RAID là gì?
Một phương pháp giúp tăng cường độ an toàn của
thông tin trên đĩa từ là dùng một mảng đĩa từ. Mảng
đĩa từ này được gọi là Hệ thống đĩa dự phòng (RAID -
Redundant Array of Independent Disks).
RAID (Redundant Arrays of Inexpensive Disks) là
hình thức ghép nhiều ổ đĩa cứng vật lý thành một hệ
thống ổ đĩa cứng có chức năng gia tăng tốc độ đọc/ghi
dữ liệu hoặc nhằm tăng thêm sự an toàn của dữ liệu
chứa trên hệ thống đĩa hoặc kết hợp cả hai yếu tố trên.
14 trang |
Chia sẻ: thanhle95 | Lượt xem: 584 | Lượt tải: 1
Bạn đang xem nội dung tài liệu Bài giảng Kiến trúc máy tính - Chương 6.5: An toàn dữ liệu trong việc lưu trữ, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
10/12/2017
1
Người ta thường chú trọng đến sự an toàn
trong lưu giữ thông tin ở đĩa từ hơn là sự
an toàn của thông tin trong bộ xử lý. Bộ xử
lý có thể hư mà không làm tổn hại đến
thông tin. Ổ đĩa của máy tính bị hư có thể
gây ra các thiệt hại rất to lớn.
TẠI SAO LẠI PHẢI CHÚ TRỌNG ĐẾN SỰ AN TOÀN
DỮ LIỆU TRONG VIỆC LƯU TRỮ
TẠI SAO LẠI PHẢI CHÚ TRỌNG ĐẾN SỰ AN TOÀN
DỮ LIỆU TRONG VIỆC LƯU TRỮ
MẤT DỮ LIỆU QUAN TRỌNG
MẤT HỆ ĐIỀU HÀNH
VÀ CÒN NHIỀU HỆ LỤY KHÁC%
Ổ đĩa
cứng hư
MẤT ĐI NHỮNG THIẾT LẬP QUAN TRỌNG
10/12/2017
2
RAID là gì?
Một phương pháp giúp tăng cường độ an toàn của
thông tin trên đĩa từ là dùng một mảng đĩa từ. Mảng
đĩa từ này được gọi là Hệ thống đĩa dự phòng (RAID -
Redundant Array of Independent Disks).
RAID (Redundant Arrays of Inexpensive Disks) là
hình thức ghép nhiều ổ đĩa cứng vật lý thành một hệ
thống ổ đĩa cứng có chức năng gia tăng tốc độ đọc/ghi
dữ liệu hoặc nhằm tăng thêm sự an toàn của dữ liệu
chứa trên hệ thống đĩa hoặc kết hợp cả hai yếu tố trên.
Lịch sử phát triển của RAID
Lần đầu tiên RAID được phát triển năm 1987 tại
trường Đại học California tại Berkeley (Hoa Kỳ) với
những đặc điểm chỉ ghép các phần đĩa cứng nhỏ hơn
thông qua phần mềm để tạo ra một hệ thống đĩa dung
lượng lớn hơn thay thế cho các ổ cứng dung lượng lớn giá
đắt thời bấy giờ.
Mặc dù hiện nay không tồn tại nữa, nhưng Hội đồng tư
vấn phát triển RAID (RAID Advisory Board: Viết tắt là
RAB) đã ra thành lập tháng 7 năm 1992 để định hướng,
lập ra các tiêu chuẩn, định dạng cho RAID. RAB đã phân
ra các loại cấp độ RAID (level), các tiêu chuẩn phần cứng
sử dụng RAID. RAB đã phân ra 7 loại cấp độ RAID từ
cấp độ 0 đến cấp độ 6.
10/12/2017
3
Các đặc tính của RAID
1
2
3
RAID là một tập hợp các ổ đĩa cứng (vật lý) được thiết
lập theo một kỹ thuật mà hệ điều hành chỉ “nhìn thấy”
chỉ là một ổ đĩa (logic) duy nhất.
Với cơ chế đọc/ghi thông tin diễn ra
trên nhiều đĩa (ghi đan chéo hay soi
gương).
Trong mảng đĩa có lưu các thông tin kiểm tra lỗi dữ
liệu; do đó, dữ liệu có thể được phục hồi nếu có một
đĩa trong mảng đĩa bị hư hỏng .
Phần 1
10/12/2017
4
Các cấp độ của RAID chuẩn
RAID 01
RAD 34
RAID 12
RAID 45
RAID 67
RAID 23
RAID 56
RAID 0
10/12/2017
5
RAID 0
Kết luận:
RAID 0 thật sự hữu ích trong các ứng dụng
yêu cầu nhiều thâm nhập đĩa với dung lượng
lớn, tốc độ cao (đa phương tiện, đồ hoạ,`).
Tuy nhiên, như đã nói ở trên, kỹ thuật này
không có cơ chế an toàn dữ liệu, nên khi có
bất kỳ một hư hỏng nào trên một đĩa thành viên
trong mảng cũng sẽ dẫn đến việc mất dữ liệu
toàn bộ trong mảng đĩa. Xác suất hư hỏng đĩa
tỉ lệ thuận với số lượng đĩa được thiết lập trong
RAID 0. RAID 0 không phải là 1 biện pháp
an toàn dữ liệu.
Minh họa cho RAID 0
Concept
Strip 0
Strip 2
Strip 4
Strip 1
Strip 3
Strip 5
RAID
0
10/12/2017
6
RAID 1 – (mirror-đĩa gương)
Yêu cầu: phải có ít nhất 2 đĩa.
Dữ liệu được ghi vào 2 đĩa giống hệt nhau
(Mirroring). Trong trường hợp một ổ bị trục
trặc, ổ còn lại sẽ tiếp tục hoạt động bình
thường. Bạn có thể thay thế ổ đĩa bị hỏng
dựa vào ổ đĩa còn lại (rebuild) mà không
phải lo lắng đến vấn đề thông tin thất lạc.
Ưu điểm: dữ liệu được đảm bảo an toàn 1
cách đơn giản.
Nhược điểm: chi phí lớn, hiệu năng thấp.
Kết luận:
Đối với RAID 1, hiệu năng không phải là yếu
tố hàng đầu nên chẳng có gì ngạc nhiên nếu
nó không phải là lựa chọn số một cho những
người say mê tốc độ.
Tuy nhiên đối với những nhà quản trị mạng
hoặc những ai phải quản lý nhiều thông tin
quan trọng thì hệ thống RAID 1 là thứ không
thể thiếu. Dung lượng cuối cùng của hệ thống
RAID 1 bằng dung lượng của ổ đơn (hai ổ
80GB chạy RAID 1 sẽ cho hệ thống nhìn thấy
duy nhất một ổ RAID 80GB).
10/12/2017
7
Minh họa RAID 1
Concept
Strip 1
Strip 2
Strip 3
Strip 1
Strip 2
Strip 3
RAID
1
Disk 0 Disk 1
RAID 2
Yêu cầu: có ít nhất 3 đĩa. Chia làm 2 phần: đĩa chứa dữ liệu, và đĩa
kiểm tra.
Một mã sửa lỗi (ECC) được tính toán dựa vào các dữ liệu được ghi
trên đĩa lưu dữ liệu, các bit được mã hoá được lưu trong các đĩa
dùng làm đĩa kiểm tra.
Khi có một yêu cầu dữ liệu, tất cả các đĩa được truy cập đồng thời.
Với một thao tác ghi dữ liệu lên một đĩa, tất cả các đĩa dữ liệu và đĩa
sửa lỗi đều được truy cập để tiến hành thao tác ghi.
Thông thường, RAID 2 dùng mã Hamming để thiết lập cơ chế mã
hoá, theo đó, để mã hoá dữ liệu được ghi, người ta dùng một bit
sửa lỗi và hai bit phát hiện lỗi.
Ưu điểm: Khi phát hiện có lỗi, bộ điều khiển nhận dạng và sửa lỗi
ngay mà không làm giảm thời gian truy cập đĩa thông qua bit sửa lỗi
và bit phát hiện lỗi.
Nhược điểm: tất cả các ổ đĩa cứng, ngay sau khi thực hiện một mã
sửa lỗi còn dùng mã Hamming, do đó, cơ chế sửa lỗi của RAID 2
bây giờ trở nên không cần thiết, RAID 2 nhanh chóng trở nên vô ích
và không còn giá trị thương mại.
10/12/2017
8
RAID 2
KẾT LUẬN: RAID 2 có khả năng phát hiện những bit lỗi và sửa
chữa ngay để không làm giảm tốc độ truy xuất dữ liệu., nhưng
do một số bất tịện, RAID 2 đã không còn được sử dụng rộng
rãi
Minh họa cho RAID 2
Phần đĩa ghi dữ liệu
Phần đĩa chứa mã
kiểm tra, sửa lỗi
10/12/2017
9
RAID 3
Yêu cầu: cần có ít nhất 3 đĩa.
Dữ liệu được ghi vào n-1 đĩa bằng kĩ thuật ghi song song. Và 1
đĩa còn lại, dùng để lưu các thông tin kiểm tra lỗi theo cơ cấu đan
chéo chẵn lẻ ở cấp độ bit (bit parity).
Ưu điểm:
Thay vì có 1 bản sao hoàn chỉnh của thông tin gốc trên mỗi đĩa, người ta chỉ
cần có đủ thông tin để phục hồi thông tin đã mất trong trường hợp hỏng ổ đĩa.
Khi một đĩa bất kỳ trong mảng bị hư, hệ thống vẫn hoạt động bình thường.
Khi thay thế một đĩa mới vào mảng, căn cứ vào dữ liệu trên các đĩa còn lại, hệ
thống tái tạo thông tin.
Nhược điểm:
chỉ có thể thiết lập raid 3 bằng phần cứng.
KẾT LUẬN:
RAID 3 là một sự cải tiến của RAID 0, nhưng có thêm ít nhất
một ổ chứa thong tin có thể khôi phục dữ liệu đã bị hư hỏng
trong các ổ chứa dữ liệu.
Minh họa cho RAID 3
Ở đây được
chia theo các
sọc (stripe)
10/12/2017
10
RAID 4
Yêu cầu ít nhất phải có 3 đĩa.
Một đĩa dùng để chứa các bit kiểm tra được tính toán từ dữ liệu
được lưu trên các đĩa dữ liệu.
Trong một mảng truy cập độc lập, mỗi đĩa thành viên được truy
xuất độc lập, do đó mảng có thể đáp ứng được các yêu cầu
song song của ngoại vi.
Ưu điểm:
Kỹ thuật này thích hợp với các ứng dụng yêu cầu nhiều ngoại vi
là các ứng dụng yêu cầu tốc độ truyền dữ liệu cao.
Nhược điểm:
bị nghẽn cổ chai tại đĩa kiểm tra khi có nhiều yêu cầu đồng thời
từ các ngoại vi.
Kết luận:
RAID 4 tương tự như RAID 3 nhưng ở một mức độ các khối dữ
liệu lớn hơn chứ không phải đến từng byte. Chúng cũng yêu cầu
tối thiểu 3 đĩa cứng (ít nhất hai đĩa dành cho chứa dữ liệu và ít
nhất 1 đĩa dùng cho lưu trữ dữ liệu tổng thể)
Minh họa cho RAID 4
Ở đây được
chia thành khối
(block)
10/12/2017
11
RAID 5
Yêu cầu:
tối thiểu phải có 3 đĩa (ổ đĩa).
Dữ liệu và bản sao lưu được bố trí trải đều chia lên tất cả
các đĩa (ổ cứng).
Cơ chế:
• Tương tự RAID 4, khi một đĩa bất kỳ trong mảng bị hư
hỏng, hệ thống vẫn hoạt động bình thường. Khi thay
thế một đĩa mới vào mảng, căn cứ vào dữ liệu trên các
đĩa còn lại, hệ thống tái tạo thông tin.
Ưu điểm:
khắc phục nhược điểm của RAID 4.
Nhược điểm:
chỉ có thể thiết lập bằng phần cứng.
KẾT LUẬN:
RAID 5 thực hiện chia đều dữ liệu trên các ổ
đĩa giống như RAID 0 nhưng với một cơ chế
phức tạp hơn. Dữ liệu và bản sao lưu được
chia lên tất cả các ổ cứng. Nguyên tắc này
khá rối rắm. Ttuy nhiên, nguyên tắc đó đã
giúp cho RAID 5 khắc phục nhược điểm của
RAID 4.
Đây có lẽ là dạng RAID mạnh mẽ nhất cho
người dùng văn phòng và gia đình với 3 hoặc
5 đĩa cứng riêng biệt.
10/12/2017
12
Minh họa cho RAID 5
RAID 6
Yêu cầu: cần phải có ít nhất 4 đĩa cứng ,
tổng quát là: n+2 đĩa.
Trong đó dữ liệu được ghi vào n đĩa và 2 đĩa
riêng biệt để lưu các khối kiểm tra. Một trong
2 đĩa kiểm tra dùng cơ chế như RAID 4&5,
đĩa còn lại kiểm tra độc lập theo một giải
thuật kiểm tra.
Ưu điểm: do cơ chế trên, RAID 6 có thể phục
hồi lại dữ liệu ngay khi có cả 2 đĩa hỏng cùng
lúc. Đồng thời, mỗi dữ liệu lại được lưu ở 3 vị
trí an toàn.
Nhược điểm: tốn kém.
10/12/2017
13
KẾT LUẬN:
Trong RAID 6, ta thấy rằng khả năng chịu
đựng rủi ro hư hỏng cứng được tăng lên rất
nhiều. Nếu với 4 ổ cứng thì chúng cho phép
hư hỏng đồng thời đến 2 ổ cứng mà hệ thống
vẫn làm việc bình thường, điều này tạo ra một
xác xuất an toàn rất lớn.
Chính do đó mà RAID 6 thường chỉ được sử
dụng trong các máy chủ chứa dữ liệu cực kỳ
quan trọng.
Minh họa cho RAID 6
10/12/2017
14
Tổng hợp
Hiện nay, RAID 0,1,5 được dùng nhiều
trong các hệ thống. Các giải pháp RAID
trên đây (trừ RAID 6) chỉ đảm bảo an toàn
dữ liệu khi có một đĩa trong mảng bị hư
hỏng. Ngoài ra, các hư hỏng dữ liệu do
phần mềm hay chủ quan của con người
không được đề cập trong chương trình.
Người dùng cần phải có kiến thức đầy đủ
về hệ thống để các hệ thống thông tin hoạt
động hiệu quả và an toàn.