Bài giảng Kiến trúc máy tính - Chương 6.5: An toàn dữ liệu trong việc lưu trữ

RAID là gì? Một phương pháp giúp tăng cường độ an toàn của thông tin trên đĩa từ là dùng một mảng đĩa từ. Mảng đĩa từ này được gọi là Hệ thống đĩa dự phòng (RAID - Redundant Array of Independent Disks). RAID (Redundant Arrays of Inexpensive Disks) là hình thức ghép nhiều ổ đĩa cứng vật lý thành một hệ thống ổ đĩa cứng có chức năng gia tăng tốc độ đọc/ghi dữ liệu hoặc nhằm tăng thêm sự an toàn của dữ liệu chứa trên hệ thống đĩa hoặc kết hợp cả hai yếu tố trên.

14 trang | Chia sẻ: thanhle95 | Lượt xem: 855 | Lượt tải: 1

Bạn đang xem nội dung tài liệu Bài giảng Kiến trúc máy tính - Chương 6.5: An toàn dữ liệu trong việc lưu trữ, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

10/12/2017 1 Người ta thường chú trọng đến sự an toàn trong lưu giữ thông tin ở đĩa từ hơn là sự an toàn của thông tin trong bộ xử lý. Bộ xử lý có thể hư mà không làm tổn hại đến thông tin. Ổ đĩa của máy tính bị hư có thể gây ra các thiệt hại rất to lớn. TẠI SAO LẠI PHẢI CHÚ TRỌNG ĐẾN SỰ AN TOÀN DỮ LIỆU TRONG VIỆC LƯU TRỮ TẠI SAO LẠI PHẢI CHÚ TRỌNG ĐẾN SỰ AN TOÀN DỮ LIỆU TRONG VIỆC LƯU TRỮ MẤT DỮ LIỆU QUAN TRỌNG MẤT HỆ ĐIỀU HÀNH VÀ CÒN NHIỀU HỆ LỤY KHÁC% Ổ đĩa cứng hư MẤT ĐI NHỮNG THIẾT LẬP QUAN TRỌNG 10/12/2017 2 RAID là gì? Một phương pháp giúp tăng cường độ an toàn của thông tin trên đĩa từ là dùng một mảng đĩa từ. Mảng đĩa từ này được gọi là Hệ thống đĩa dự phòng (RAID - Redundant Array of Independent Disks). RAID (Redundant Arrays of Inexpensive Disks) là hình thức ghép nhiều ổ đĩa cứng vật lý thành một hệ thống ổ đĩa cứng có chức năng gia tăng tốc độ đọc/ghi dữ liệu hoặc nhằm tăng thêm sự an toàn của dữ liệu chứa trên hệ thống đĩa hoặc kết hợp cả hai yếu tố trên. Lịch sử phát triển của RAID Lần đầu tiên RAID được phát triển năm 1987 tại trường Đại học California tại Berkeley (Hoa Kỳ) với những đặc điểm chỉ ghép các phần đĩa cứng nhỏ hơn thông qua phần mềm để tạo ra một hệ thống đĩa dung lượng lớn hơn thay thế cho các ổ cứng dung lượng lớn giá đắt thời bấy giờ. Mặc dù hiện nay không tồn tại nữa, nhưng Hội đồng tư vấn phát triển RAID (RAID Advisory Board: Viết tắt là RAB) đã ra thành lập tháng 7 năm 1992 để định hướng, lập ra các tiêu chuẩn, định dạng cho RAID. RAB đã phân ra các loại cấp độ RAID (level), các tiêu chuẩn phần cứng sử dụng RAID. RAB đã phân ra 7 loại cấp độ RAID từ cấp độ 0 đến cấp độ 6. 10/12/2017 3 Các đặc tính của RAID 1 2 3 RAID là một tập hợp các ổ đĩa cứng (vật lý) được thiết lập theo một kỹ thuật mà hệ điều hành chỉ “nhìn thấy” chỉ là một ổ đĩa (logic) duy nhất. Với cơ chế đọc/ghi thông tin diễn ra trên nhiều đĩa (ghi đan chéo hay soi gương). Trong mảng đĩa có lưu các thông tin kiểm tra lỗi dữ liệu; do đó, dữ liệu có thể được phục hồi nếu có một đĩa trong mảng đĩa bị hư hỏng . Phần 1 10/12/2017 4 Các cấp độ của RAID chuẩn RAID 01 RAD 34 RAID 12 RAID 45 RAID 67 RAID 23 RAID 56 RAID 0 10/12/2017 5 RAID 0 Kết luận: RAID 0 thật sự hữu ích trong các ứng dụng yêu cầu nhiều thâm nhập đĩa với dung lượng lớn, tốc độ cao (đa phương tiện, đồ hoạ,`). Tuy nhiên, như đã nói ở trên, kỹ thuật này không có cơ chế an toàn dữ liệu, nên khi có bất kỳ một hư hỏng nào trên một đĩa thành viên trong mảng cũng sẽ dẫn đến việc mất dữ liệu toàn bộ trong mảng đĩa. Xác suất hư hỏng đĩa tỉ lệ thuận với số lượng đĩa được thiết lập trong RAID 0. RAID 0 không phải là 1 biện pháp an toàn dữ liệu. Minh họa cho RAID 0 Concept Strip 0 Strip 2 Strip 4 Strip 1 Strip 3 Strip 5 RAID 0 10/12/2017 6 RAID 1 – (mirror-đĩa gương) Yêu cầu: phải có ít nhất 2 đĩa. Dữ liệu được ghi vào 2 đĩa giống hệt nhau (Mirroring). Trong trường hợp một ổ bị trục trặc, ổ còn lại sẽ tiếp tục hoạt động bình thường. Bạn có thể thay thế ổ đĩa bị hỏng dựa vào ổ đĩa còn lại (rebuild) mà không phải lo lắng đến vấn đề thông tin thất lạc. Ưu điểm: dữ liệu được đảm bảo an toàn 1 cách đơn giản. Nhược điểm: chi phí lớn, hiệu năng thấp. Kết luận: Đối với RAID 1, hiệu năng không phải là yếu tố hàng đầu nên chẳng có gì ngạc nhiên nếu nó không phải là lựa chọn số một cho những người say mê tốc độ. Tuy nhiên đối với những nhà quản trị mạng hoặc những ai phải quản lý nhiều thông tin quan trọng thì hệ thống RAID 1 là thứ không thể thiếu. Dung lượng cuối cùng của hệ thống RAID 1 bằng dung lượng của ổ đơn (hai ổ 80GB chạy RAID 1 sẽ cho hệ thống nhìn thấy duy nhất một ổ RAID 80GB). 10/12/2017 7 Minh họa RAID 1 Concept Strip 1 Strip 2 Strip 3 Strip 1 Strip 2 Strip 3 RAID 1 Disk 0 Disk 1 RAID 2 Yêu cầu: có ít nhất 3 đĩa. Chia làm 2 phần: đĩa chứa dữ liệu, và đĩa kiểm tra. Một mã sửa lỗi (ECC) được tính toán dựa vào các dữ liệu được ghi trên đĩa lưu dữ liệu, các bit được mã hoá được lưu trong các đĩa dùng làm đĩa kiểm tra. Khi có một yêu cầu dữ liệu, tất cả các đĩa được truy cập đồng thời. Với một thao tác ghi dữ liệu lên một đĩa, tất cả các đĩa dữ liệu và đĩa sửa lỗi đều được truy cập để tiến hành thao tác ghi. Thông thường, RAID 2 dùng mã Hamming để thiết lập cơ chế mã hoá, theo đó, để mã hoá dữ liệu được ghi, người ta dùng một bit sửa lỗi và hai bit phát hiện lỗi. Ưu điểm: Khi phát hiện có lỗi, bộ điều khiển nhận dạng và sửa lỗi ngay mà không làm giảm thời gian truy cập đĩa thông qua bit sửa lỗi và bit phát hiện lỗi. Nhược điểm: tất cả các ổ đĩa cứng, ngay sau khi thực hiện một mã sửa lỗi còn dùng mã Hamming, do đó, cơ chế sửa lỗi của RAID 2 bây giờ trở nên không cần thiết, RAID 2 nhanh chóng trở nên vô ích và không còn giá trị thương mại. 10/12/2017 8 RAID 2 KẾT LUẬN: RAID 2 có khả năng phát hiện những bit lỗi và sửa chữa ngay để không làm giảm tốc độ truy xuất dữ liệu., nhưng do một số bất tịện, RAID 2 đã không còn được sử dụng rộng rãi Minh họa cho RAID 2 Phần đĩa ghi dữ liệu Phần đĩa chứa mã kiểm tra, sửa lỗi 10/12/2017 9 RAID 3 Yêu cầu: cần có ít nhất 3 đĩa. Dữ liệu được ghi vào n-1 đĩa bằng kĩ thuật ghi song song. Và 1 đĩa còn lại, dùng để lưu các thông tin kiểm tra lỗi theo cơ cấu đan chéo chẵn lẻ ở cấp độ bit (bit parity). Ưu điểm: Thay vì có 1 bản sao hoàn chỉnh của thông tin gốc trên mỗi đĩa, người ta chỉ cần có đủ thông tin để phục hồi thông tin đã mất trong trường hợp hỏng ổ đĩa. Khi một đĩa bất kỳ trong mảng bị hư, hệ thống vẫn hoạt động bình thường. Khi thay thế một đĩa mới vào mảng, căn cứ vào dữ liệu trên các đĩa còn lại, hệ thống tái tạo thông tin. Nhược điểm: chỉ có thể thiết lập raid 3 bằng phần cứng. KẾT LUẬN: RAID 3 là một sự cải tiến của RAID 0, nhưng có thêm ít nhất một ổ chứa thong tin có thể khôi phục dữ liệu đã bị hư hỏng trong các ổ chứa dữ liệu. Minh họa cho RAID 3 Ở đây được chia theo các sọc (stripe) 10/12/2017 10 RAID 4 Yêu cầu ít nhất phải có 3 đĩa. Một đĩa dùng để chứa các bit kiểm tra được tính toán từ dữ liệu được lưu trên các đĩa dữ liệu. Trong một mảng truy cập độc lập, mỗi đĩa thành viên được truy xuất độc lập, do đó mảng có thể đáp ứng được các yêu cầu song song của ngoại vi. Ưu điểm: Kỹ thuật này thích hợp với các ứng dụng yêu cầu nhiều ngoại vi là các ứng dụng yêu cầu tốc độ truyền dữ liệu cao. Nhược điểm: bị nghẽn cổ chai tại đĩa kiểm tra khi có nhiều yêu cầu đồng thời từ các ngoại vi. Kết luận: RAID 4 tương tự như RAID 3 nhưng ở một mức độ các khối dữ liệu lớn hơn chứ không phải đến từng byte. Chúng cũng yêu cầu tối thiểu 3 đĩa cứng (ít nhất hai đĩa dành cho chứa dữ liệu và ít nhất 1 đĩa dùng cho lưu trữ dữ liệu tổng thể) Minh họa cho RAID 4 Ở đây được chia thành khối (block) 10/12/2017 11 RAID 5 Yêu cầu: tối thiểu phải có 3 đĩa (ổ đĩa). Dữ liệu và bản sao lưu được bố trí trải đều chia lên tất cả các đĩa (ổ cứng). Cơ chế: • Tương tự RAID 4, khi một đĩa bất kỳ trong mảng bị hư hỏng, hệ thống vẫn hoạt động bình thường. Khi thay thế một đĩa mới vào mảng, căn cứ vào dữ liệu trên các đĩa còn lại, hệ thống tái tạo thông tin. Ưu điểm: khắc phục nhược điểm của RAID 4. Nhược điểm: chỉ có thể thiết lập bằng phần cứng. KẾT LUẬN: RAID 5 thực hiện chia đều dữ liệu trên các ổ đĩa giống như RAID 0 nhưng với một cơ chế phức tạp hơn. Dữ liệu và bản sao lưu được chia lên tất cả các ổ cứng. Nguyên tắc này khá rối rắm. Ttuy nhiên, nguyên tắc đó đã giúp cho RAID 5 khắc phục nhược điểm của RAID 4. Đây có lẽ là dạng RAID mạnh mẽ nhất cho người dùng văn phòng và gia đình với 3 hoặc 5 đĩa cứng riêng biệt. 10/12/2017 12 Minh họa cho RAID 5 RAID 6 Yêu cầu: cần phải có ít nhất 4 đĩa cứng , tổng quát là: n+2 đĩa. Trong đó dữ liệu được ghi vào n đĩa và 2 đĩa riêng biệt để lưu các khối kiểm tra. Một trong 2 đĩa kiểm tra dùng cơ chế như RAID 4&5, đĩa còn lại kiểm tra độc lập theo một giải thuật kiểm tra. Ưu điểm: do cơ chế trên, RAID 6 có thể phục hồi lại dữ liệu ngay khi có cả 2 đĩa hỏng cùng lúc. Đồng thời, mỗi dữ liệu lại được lưu ở 3 vị trí an toàn. Nhược điểm: tốn kém. 10/12/2017 13 KẾT LUẬN: Trong RAID 6, ta thấy rằng khả năng chịu đựng rủi ro hư hỏng cứng được tăng lên rất nhiều. Nếu với 4 ổ cứng thì chúng cho phép hư hỏng đồng thời đến 2 ổ cứng mà hệ thống vẫn làm việc bình thường, điều này tạo ra một xác xuất an toàn rất lớn. Chính do đó mà RAID 6 thường chỉ được sử dụng trong các máy chủ chứa dữ liệu cực kỳ quan trọng. Minh họa cho RAID 6 10/12/2017 14 Tổng hợp Hiện nay, RAID 0,1,5 được dùng nhiều trong các hệ thống. Các giải pháp RAID trên đây (trừ RAID 6) chỉ đảm bảo an toàn dữ liệu khi có một đĩa trong mảng bị hư hỏng. Ngoài ra, các hư hỏng dữ liệu do phần mềm hay chủ quan của con người không được đề cập trong chương trình. Người dùng cần phải có kiến thức đầy đủ về hệ thống để các hệ thống thông tin hoạt động hiệu quả và an toàn.