Bài giảng Khái niệm cơ sở dữ liệu phân tán - Tài liệu, ebook, giáo trình, hướng dẫn

Xử lý phân tán hay còn gọi là hệ thống tính toán phân tán đó là một số bộ phận xử lý tự vận hành được liên kiết bởi một mạng máy tính và hợp đồng thực hiện các nhiệm vụ mà chúng được phân công.Các bộ phận xử lý là các thiết bị tính toán có thể chạy được một chương trình trên chính nó.

21 trang | Chia sẻ: haohao89 | Lượt xem: 3062 | Lượt tải: 2Free

Bạn đang xem trước 20 trang tài liệu Bài giảng Khái niệm cơ sở dữ liệu phân tán, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

CHƯƠNG I KHÁI NIỆM CƠ SỞ DỮ LIỆU PHÂN TÁN 1.1. XỬ LÝ PHÂN TÁN Xử lý phân tán hay còn gọi là hệ thống tính toán phân tán đó là một số bộ phận xử lý tự vận hành được liên kiết bởi một mạng máy tính và hợp đồng thực hiện các nhiệm vụ mà chúng được phân công.Các bộ phận xử lý là các thiết bị tính toán có thể chạy được một chương trình trên chính nó. Những gì được phân tán:đó là các thiết bị xử lý,một kiểu khác của phân tán là chức năng.Nhiều cức năng của hệ thông máy tính có thể được chuyển giao cho các thành phần phần cứng và phần mềm.Kiểu thứ 3 là theo dữ liệu:Dữ liệu được dùng bởi 1 số ứng dụng có thể được phân tán cho 1 số vị trí xử lý.Cuối cùng là quyền điều khiển cũng có thể được phân tán.Quyền điều khiển việc thức hiện 1 số nhiệm vụ cũng có thể được phân tán. Các hệ thống xử lý phân tán có thể được phân loại như sau:Mức độ kết nối, sự liên đới giữa các thành phần,cấu trúc tương giao,và sự đồng bộ hoá giữa các thành phần. Tại sao chúng ta lại thực hiện phân tán?Đó là vì nhằm thích ừng tốt hơn với việc phân bố rộng rãi của các công ty, xí nghiệp.Quan trọng hơn,nhiều ứng dụng hiện tại of công nghệ máy tính cũng được phân tán.Chúng ta có thể khẳng định rằng:lý do của ciệc xử lý phân tán là do nó có thể thực hiện tốt hơn các bài toán lớn và phức tạp mà chúng gặp phải hiện nay bằng cách sử dụng quy tắc”Chia để trị”. Từ quan điểm kinh tế việc xử lý phân tán có 2 ưu điểm cơ bản:trước hết tận dụng được sức mạnh tính toán bằng cách sử dụng nhiều bộ phần xử lý một cách tối ưu đòi hỏi phải nghiên cứu các hệ thống phân tán và hệ thống xử lý song song.Ưu điểm thứ hai là bằng việc giả quyết bài toán theo từng nhóm hoạt động khá độc lập, chúng ta có thể kiểm soát được chi phí phát triển phần mềm. Các hệ cơ sở dữ liệu phấn tán cũng có thể đượ xem xét trong khuôn khổ của bộ khung này và được xử lý như nhũng công cụ có thể làm cho việc xử lý dữ liệu phân tán dễ dàng và hiệu quả hơn. 1.2. HỆ CSDL PHÂN TÁN LÀ GÌ? Hệ CSDL phân tán - DDBS System (DDBS): là một tập hợp dữ liệu có liên đới logic và được phân bố trên các nút của một mạng máy tính. Hệ quản trị CSDL phân tán - DDBS Management Sytem (DDBMS) là một hệ thống phần mềm cho phép quản lý các DDBS và làm cho việc phân tán trở nên vô hình đối với người sử dụng. Có thể nói DDBS không phải là một tập hợp các tập tin được lưu trữ riêng rẽ tại các nút của mạng máy tính. Mà một DDBS là các tập tin vừa liên đới logic và vừa phải có cấu trúc và phải được truy xuất qua một giao diện chung. Phân bố vật lý của các dữ liệu không phải là vấn đề quyết định trong DDBS, ví dụ trên cùng một nút mạng có thể lưu trữ hai hệ cơ sở dữ liệu nhưng có liên đới với nhau thì đó là DDBS. Tuy vậy viêc phân bố vật lý của các dữ liệu cũng hết sức quan trọng vì nó sẽ nẩy sinh ra các vấn đề rất phức tạp như thực hiện các cấu trúc truy vấn, vấn đề cấp phát.v.v... Đơn vị xử lý Đơn vị xử lý Đơn vị xử lý O/I Bộ nhớ Hình 1.1-1. Hệ đa bộ xử lý có bộ nhớ chung Hình 1.1-2. Hệ đa bộ xử lý có shared disk Computer CPU Memory Computer CPU Memory Computer CPU Memory Shared disk Hệ thống đa xử lý Hình 1.1-3. Hệ đa bộ xử lý sở hữu cá nhân Kênh chuyển mạch Computer CPU Memory Computer CPU Memory Computer CPU Memory .... .... Computer CPU Memory Computer CPU Memory Hệ thống đa xử lý là hệ thống có nhiều đơn vị xử lý cùng dùng chung một dạng bộ nhớ, ví dụ hình 1.1-1 mô tả một hệ thống đa xử lý dùng chung bộ nhớ, hình 1.1-2 mô tả hệ thống đa xử lý dùng chung shared disk và hình 1.1-3 mô tả hệ thống đa xử lý sở hữu cá nhân. Chú ý rằng phân bố vật lý không nhất thiết là các hệ thống máy tính phải tách biệt nhau về mặt địa lý; chúng có thể ở trong cùng một văn phòng. Duy có điều là việc giao tiếp giữa chúng được thực hiện trên mạng máy tính thay cho qua bộ nhớ chung. Mạng máy tính được xem là tài nguyên dùng chung duy nhất, điều này chứng tỏ hệ thống đa xử lý không phải là DDBS. Nhận xét: Nếu CSDL nằm tại một nút mạng thì nó không phải là DDBS, vì vấn đề quản trị CSDL không khác với quản trị CSDL trong môi trường tập trung kiểu client/server của mạng (ví dụ workstation 2 trong hình 1.1-4) khi đó tất cả yêu cầ truy xuất CSDL điều được chuyển đến workstation 2. Và điều cần quan tâm ở đây chỉ là thời gian truy cập của cácworkstation khác đến workstation2. Nếu cơ sở dữ liệu được phân tán trên nhiều nút mạng. khi đó CSDL sẽ là cơ sở dữ liệu phân tán trên hình 1.1-5 Worstation5 Mạng Truyền DL CSDL Hình 1.1-5. CSDL được phân tán trên mạng, DDBS Worstation4 Worstation1 Worstation3 Worstation2 CSDL CSDL CSDL Worstation5 Mạng Truyền DL CSDL Hình 1.1-4. CSDL tập trung, không phải là DDBS Worstation4 Worstation1 Worstation3 Worstation2 1.3 . TRIỂN VỌNG CỦA CÁC HỆ CSDL PHÂN TÁN Từ lý do xã hội của việc phi tập trung đến tính hiệu quả kinh tế của cơ sở dữ liệu phân tán người ta phân DDBS ra 4 nhóm triển vọng. 1.3 .1. Quản lý dữ liệu phân tán và nhân bản vô hình. Một hệ thống vô hình là cách cho ẩn đi thao tác cài đặt, cái mà người sử dụng không cần quan tâm đến. Ví dụ: Một công ty Điện - Toán, có các văn phòng ở Boston , Edmonton, Pairis và San Francisco, có một số dự án(project) được thực hiện tại các địa điểm đó, và muốn dùng CSDL để quản lý nhân công (Employee), quản lý dự án và các dữ liệu liên quan khác. Giả sử CSDL là CSDL quan hệ - Relational database (RDB) có thể lưu các bảng sau: Bảng EMP(ENO, ENAME, TITLE) Trong đó EMP là Employee, ENO là Employee Number (Mã số nhân viên), ENAME là Employee Name (Tên nhân viên), TITLE (Chức vụ). Bảng PROJ(PNo, PNAME, BUDGET) Trong đó PNO là Project Number (Mã số dự án); PName - Project Name (Tên dự án) và BUDGET (Ngân sách dự án). Bảng PAY(TITLE, SAL) Trong đó SAL - salary (Tiền lương). Bảng ASG (ENO, PNO, DUR, RESP) Trong đó ASG Assignment (Phân công nhiệm vụ): phân nhân viên làm tại dự án, thời gian làm, với nhiệm vụ), DUR (Duration = thời gian).RESP (Responsibility = nhiệm vụ). Nếu dữ liệu được lưu ở hệ CSDL tập trung và nếu muốn có danh sách tên và lương của các nhân viên đã làm dự án nào đó trên 12 tháng thì câu lệnh truy vấn SQL sẽ là: SELECT ENAME, SAL ' Chỉ lấy ra 2 trường này FROM EMP, AGG , PAY ' Dữ liệu lấy từ các bảng này WHERE ASG.DUR > 12 AND EMP.ENO = ASG.ENO AND PAY.TITLE = EMP.TITLE Mạng Truyền dữ liệu Nhân viên tại Boston, Paris và dự án tại Boston Boston Nhân viên và dự án tại Boston, Paris Paris Nhân viên và dự án tại San Francisco San Francisco Nhân viên và dự án tại Edmonton, dự án tại Paris Edmonton Hình 1.2.1-1. Ứng dụng phân tán nhân Phân mảnh CSDL (Fragmentation) Vì công ty được phân tán các vị trí khác nhau (Boston, Edmôntn, Paris và San Fancisco), nên công ty muốn để dữ liệu về các nhân viên các dự án của vị trí nào được lưu ở vị trí đó, do đó cần phải phân hoạch các quan hệ EMP và PROJ và lưu chúng taị các vị trí như đã yêu cầu. Quá trình làm này được gọi là phân mảnh (fragmemtation) Nhân bản (Replication) Do yêu cầu về hiệu quả và độ tin cậy cho CSDL nên một phần dữ liệu đã được phân mảnh ở trên cần phải được lưu (bản sao) tại một số vị trí khác. Quá trình này được gọi là nhân bản. Ví dụ: Do tính chất phân tán của công việc kinh doanh của công ty, người ta muốn đặt dữ liệu về các nhân viên của văn phòng ở Edmonton được lưu ở Edmonton, viên của văn phòng ở Boston được lưu ở Boston v.v… Như vậy cần có một qúa trình phân hoạch mỗi quan hệ này và lưu các phân hoạch tại các vị trí khác nhau. Kết quả phân mảnh và nhân bản trên được thể hiện trên hình 1.3 .1-1. Truy xuất vô hình Tuy CSDL được phân tán và phân tán trên các nút mạng, nhưng người sử dụng vẫn có thể vấn tin như vấn tin trên CSDL tập trung tại điểm nút thực hiện truy vấn. Việc che đậy này được gọi là truy xuất vô hình. Một số yêu cầu của quản trị dữ liệu phân tán và nhân bản vô hình Độc lập dữ liệu Độc lập dữ liệu là sự miễn nhiễm các tác động hay che đậy các chi tiết về cấu trúc lưu trữ dữ liệu. Đôcl lập dữ liệu là dạng vô hình cơ bàn đầu tiên của DBMS, nó là loại duy nhất đón vai trò quan trọng về ngữ cảnh của các CSDL tập trung. Định nghĩa dữ liệu thường có hai mức: mô tả cấu trúc logic của dữ liệu và định nghĩa về cấu trúc vật lý của dữ liệu vì vậy chúng ta có thể nói đến hai loại độc lập dữ liệu. Mức logic thường được xem là định nghĩa lược đồ, còn mức vật lý được gọi là mô tả dữ liệu vật lý. + Độc lập dữ liệu logic (logical data Independence) là tính độc lập của các ứng dụng với những thay đổi trong cấu trúc logic của CSDL. tức là nếu có một chương trình ứng dụng nào đó truy xuất vào một tập con thuộc tính nào đó của CSDL thì nó sẽ không bị ảnh hưởng nếu ta thêm hoặc bớt một số thuộc tính khác (không thuộc tập con thuộc tính trên) vào hoặc từ CSDL đã cho. + Độc lập dữ liệu vật lý (physical data Independence) là che dấu các chi tiết về cấu trúc lưu trữ dữ liệu. Người viết ứng dụng không cần quan tâm đến dữ liệu để ở đâu (ổ đĩa, hay băng từ, nút mạng,… nào) và cách truy xuất dữ liệu (ví dụ tuần tự hay ngẫu nhiên). Vô hình liên kết mạng Người sử dụng được tách ra khỏi mọi chi tiết hoạt động của mạng, thậm chí là không biết có sự hiển diện của mạng nếu được - nghĩa là người sử dụng không biết là mình đang làm việc với CSDL tập trung hay phân tán. Kiểu vô hình này được gọi là vô hình kết mạng (Network transparency) hoặc là vô hình phân bố (Distributed transparency). Vô hình liên kết mạng có thể được chia thành hai loại; vô hình vị trí và vô hình đặt tên. + Vô hình vị trí (Location transparency) - là việc thực hiện một lệnh nào đó độc lập với vị trí dữ liệu được lưu trữ. + Vô hình đặt tên (Naming transparency) - là đòi hỏi cung cấp một tên duy nhất trước cho mỗi đối tượng CSDL. Khi không có vô hình đặt tên người sử dụng bị buộc phải gắn tên vị trí làm thành phần tên của tên đối tượng. Vô hình nhân bản Vô hình nhân bản làm cho người sử dụng không thể biết họ đang làm việc với CSDL gốc hay với các bản nhân bản. Vậy vô hình nhân bản làm nhiệm vụ của DBMS. Việc nhân bản sẽ làm tăng hiệu quả vì có thể làm giảm xung đột đường truyền khi truy cập vào cơ sở dữ liệu, giảm thời gian truyền dữ liệu và tăng độ an toàn và bảo mật. Hơn nữa nếu một só máy lưu dữ liệu có "hỏng hóc" thì các máy khác có thể truy cập đến các nhân bản của máy khác,.… Việc nhân bản cũng gặp nhiều khó khăn về cập nhật, vì khi một nhân bản có sự thay đổi (xóa, sửa, thêm,...) thì các nhân bản khác kể cả bản gốc liệu có cập nhật kịp thời hay không? Việc có nhân bản hay không, bao nhiêu bản, lưu trữ của bản sao tại nút nào là tùy thuộc vào nhu cầu ứng dụng quyết định. Vô hình phân mảnh (Fragmentation transparency) Vô hình phân mảnh làm cho người sử dụng không cần tham gia vào việc phân mảnh và không thể biết họ đang làm việc với CSDL gốc hay với các mảnh đã được phân mảnh từ CSDL gốc. Phân mảnh là chia CSDL thành các mảnh dữ liệu (Fragment) nhỏ hơn và xử lý mỗi mảnh nhận được như một CSDL độc lập - tức là như một quan hệ. Phân mảnh chỉ được thực hiện khi nó tăng hiệu quả, và có độ tin cậy. Có hai kiểu phân mảnh cơ bản là phân mảnh ngang (Horizontal fragmentation)và phân mảnh dọc (Vetical fragmentation). Phân mảnh ngang làm cho CSDL được phân hoạch thành các CSDL con, mỗi CSDL con là một tập hợp các bộ thỏa mãn một số tính chất nào đó. Phân mảnh dọc cũng chia CSDL thành các CSDL con gồm một tập hợp con các thuộc tính cùng với các giá trị của chúng có trong tập các thuộc tính của CSDL đã cho. Khi CSDL được phân mảnh, phải có cách xử lý các câu vấn tin của người sử dụng, các truy vấn này phải được thực hiện trên các mảnh. Tức là phải dịch câu truy vấn toàn cục (Global query) thành nhiều câu truy vấn theo các mảnh. Như vậy vấn đề vô hình phân mảnh là vấn đề vô hình xử lý các câu truy vấn. Nhiệm vụ cung cấp các đặc tính vô hình Có bốn tầng cung cấp dịch vụ vô hình là: + Tầng truy xuất (Aecess layer) là trách nhiệm cung cấp tính vô hình khi truy xuất đến các tài nguyên. Những đặc tính vô hình có thể được cài sâu vào trong ngôn ngữ của người sử dụng, chúng sẽ dịch các dịch vụ theo yêu cầu thành các thao tác cần thiết. Nói cách khác tính phiên dịch hoặc thông dịch sẽ chịu trách nhiệm vô hình này. + Tầng ở cấp độ hệ điều hành. Các hệ điều hành hiện đại có cung cấp một mức độ vô hình cho người sử dụng hệ thống. Ví dụ các trình điều khiển thiết bị. Nghĩa là hệ điều hành tự xử lý khi tiếp nhận thêm thiết bị ngoại vi chẳng hạn. Người sử dụng và lập trình viên,...không phải viết cac phần mềm điều khiển thiết bị công việc này hoàn toàn vô hình đối với người sư dụng. + Tầng quản trị CSDL: nhiệm vụ của DBMS là phải thực hiện các quá trình phiên dịch cần thiết từ hệ điều hành sang giao diện cấp cao của người sử dụng đây là phương pháp thông dụng nhất hiện nay. Vô hình ở tầng này là giải quyết sự tương tác giữa hệ điều hành và các DBMS phân tán. Chú ý: Giao diện với DBMS phân tán không nhất thiết là ngôn ngữ lập trình cũng có thể là giao diện đồ họa (GUI), giao diện của ngôn ngỡ tự nhiên và ngay cả bằng âm thanh. + Tầng ngôn ngữ: Người sử dụng có thể truy xuất đên hai dữ liệu dưới dạng trừu tượng hóa cao. Ví dụ: Nhờ giao diện đồ họa GUI, truy xuất bằng ngôn ngữ tự nhiên. Các tầng vô hình có thể minh họa ở hình 1.3 .1-2 Vô hình ngôn ngữ Vô hình phân mảnh Vô hình nhân bản Vô hình nối mạng Độc lập dữ liệu Dữ liệu Hình 1.2.1-2. Các tầng, và tầng vô hình Hiện nay phần lớn DBMS điều cung cấp một số vô hình ở một mức độ nào đó điển hình là vô hình phân bố, vô hình phân mảnh ngang và vô hình nhân bản. Phần lớn các DBMS phân tán trên thị trường không cung cấp mức vô hình đầy đủ. Ví dụ: còn đòi hỏi người sử dụng phải cho biết tên ví trí kèm theo với của mỗi đối tượng dữ liệu cần truy cập, hơn nữa chúng còn yêu cầu người sử dụng phải mô tả tên đầy đủ khi truy xuất đến đối tượng. Việc gắn tên vị trí gây ra nhiều khó khăn khi cần dịch chuyển các đối tượng giữa các máy nhằm tối ưu hóa các tác dụng về mặt vị trí, hoặc còn vì những mục đích khác. Một số hệ thống khác cũng không hộ trợ tính vô hình cho việc quản lý dữ liệu nhân bản trên các cơ sở dữ liệu logic. Chúng đòi hỏi người sử dụng phải logon vào một CSDL cụ thể nào đó và tại một thời điểm nào đó. Ví dụ: ORACLE. 1.3 .2. Yêu cầu độ tin cậy qua các giao dịch phân tán Một giao dịch (transaction) là một đơn vị tính toán cơ bản, nhất quán và tin cậy được, bao gồm một loạt các thao tác CSDL như các hành động cơ bản nhất (atomic action). Nó biến đổi CSDL từ trạng thái nhất quán này sang trạng thái nhất quán khác ngay cả khi có một số lượng giao dịch được thực hiện đồng thời (đôi khi được gọi là vô hình đồng thời concurrency transparency) và ngay cả khi có sự cố xẩy ra (cũng được gọi là tính nguyên tử khi có sự cố, failture atomicity). Như vậy nếu một DBMS được hỗ trợ đầy đủ cho giao dịch sẽ dảm bảo cho việc thực hiện đồng thời các giao dịch của người sử dụng, sẽ không vi phạm tính nhất quán của CSDL khi có sự cố hệ thống với điều kiện là các giao dịch đều hợp lệ, tức là đảm bảo tính toàn vẹn được đặc tả trên CSDL đã cho. Ví dụ khi tăng lương cho tất cả các nhân viên của công ty Điện - Toán (ví dụ mục 1.3 .1.). Chúng ta muốn việc thực hiện này chỉ xảy ra trong phạm vi giao dịch, hoặc nếu có sự cố khi đang thực hiện câu truy vấn cập nhật tăng lương trên, chúng ta muốn DBMS sẽ tự xác định nơi chương trình phải dừng lại, để khi thực hiện trở lại nó phải biết nơi phải tiếp tục, hoặc một người sử dụng khác đang thực hiện câu truy vấn tính lương trung bình của các nhân viên trong khi các hoạt động cập nhật dữ liệu đang được tiến hành vì thế kết quả tính toán có thể sai. Một lần nữa chúng ta muốn DBMS có khả năng đồng bộ hóa được việc thực hiện đồng thời của hai chương trình này. Hỗ trợ giao dịch đòi hỏi phải cài đặt các nghi thức điều khiển đồng thời phân tán và nghi thức khả tín phân tán-đặc biệt là các nghi thức ủy thác hai pha (two phase commit, 2PC) và khôi phục phân tán. Hỗ trợ nhân bản đòi hỏi phải cài đặt các nghi thức điều khiển bản sao (replica protocol control) nhằm đảm bảo ngữ nghĩa được đặc tả khi truy xuất chúng. 1.3 .3. Nâng cao hiệu năng Hiệu năng của DBMS phân tán sẽ được nâng cao dựa vào hai điều kiện: Một DBMS phân tán có khả năng phân mảnh CSDL mức khái niệm, cho phép dữ liệu ở gần nơi sử dụng (cũng được gọi là cục bộ hóa dữ liệu - data localization). Có hai ưu điểm nổi bật: Vì mỗi trạm chỉ xử lý một phần CSDL, tranh chấp về CPU và các dịch vụ I/O không nghiêm trọng như CSDL tập trung. Cục bộ hóa dữ liệu làm giảm thiểu các chậm trễ do truy xuất dữ liệu ở xa trong WAN (Wide Area Network) phải qua truyền thông như: vệ tinh, viba,… Tính chất song hành của các hệ phân tán có thể được tận dụng để thực hiện song hành liên vấn tin và nội vấn tin. Song hành liên vấn tin là khả năng thực hiện cùng một lúc nhều câu vấn tin còn song hành nội vấn tin là tách một câu vấn tin thành các câu vấn tin con, mỗi câu sẽ được thực hiện tại một vị trí và truy xuất các phần khác nhau của CSDL phân tán. 1.4. CÁC ĐẶC ĐIỂM CỦA HỆ CSDL PHÂN TÁN Tính phức tạp Các vấn đề của hệ CSDL phán tán phức tạp hơn so với các tập trung vì chúng không những có cả những vấn đề của môi trường tập trung mà còn có cả hàng loạt những vấn để mới chưa được giải quyết. Chi phí Các hệ phân tán đòi hỏi phải có thêm các thiết bị mới (thiết bị truyền thông chẳng hạn) và như thế làm tăng chi phí phần cứng. Tuy nhiên xu hướng giảm giá thành của thiết bị làm cho điềưnày trở thành một yếu tố ít quan trọng. Phần chi phí đáng kế nằm ở chỗ nó cần phải có các phần mềm và phương pháp truyền thông phức tạp hơn nhằm giải quyết một số vấn đề về kỹ thuật. Việc phát triển các kỹ thuật công nghệ phần mềm (các chương trình phát hiện và gỡ rối phân tán) rất có ích về phương diện này. Có lẽ thành phầnn chi phí quan trọng nhất là chi phí về nhân lực. Khi các thiết bị máy tính được xây dựng ở nhiều vị trí khác nhau, chúng đòi hỏi phải có con người điều hành và quán lý. Kết quả là phải tăng thêm nhân sự cho các hoạt động xứ lý dữ liệu. Vì thế chúng ta càn phải phân tích cẩn thận giữa việc tăng lợi nhuận do thông tin được sử dụng hiệu quả và kịp thời với chi phí về nhân sự. Phân tán quyền điều khiển Điểm này đã được nêu ra trước dây như mọt ưu điểm của các hệ CSDL phân tán. Không may là sự phân tán lại gây ra các vấn đề đồng bộ hóa và hiệp đồng (những lý do làm tăng tính phức tạp sẽ được nghiên cứa trong phần kế tiếp). Việc điều khiến phân tán có thể trở thành một gánh nặng nếu không có những chiến lược phù hợp để giải quyết chúng. Tính an ninh (bảo mật). Một trong những lợi ích chính của các CSDL tập trung là chúng bảo đảm kiểm soát được các truy xuất dữ liệu. An ninh dễ dàng mềm soải được ờ vị trí trung tâm qua một hệ quán trị CSDL thực thi các qui tắc an ninh. Tuy nhiên trong một hệ CSDL phân tán, môi trường mạng kèm theo sẽ có các yêu cầu an ninh của riêng chúng. Chúng ta đã từng thấy nhiều vấn đề nghiêm trọng khi phải bảo đảm an ninh trên các mạng máy tính. Vì thế về bản chất, vấn đề an ninh trong các hệ CSDL phân tán rõ ràng là phức tạp hơn so với các hệ tập trung. 1.5. KIẾN TRÚC HỆ QUẢN TRỊ CƠ SỞ DỰ LIỆU PHÂN TÁN Kiến trúc của một hệ thống xác định cấu trúc của nó . Tức là các thành phần của các hệ thống được xác định, chức năng của mỗi thành phần được mô tả, các mối quan hệ trung gian và tương tác giỡa các thành phần này được định nghĩa, bổ sung tổng quát này cũng đúng cho các hệ thống máy tính nói chung và cho các hệ phần mềm nói riêng. Đặc tả về kiến trúc cho các hệ phần mềm đòi hỏi phải xác định rất nhiều đơn thể với các giao diện và các mối quan hệ trung gian qua dữ liệu và dòng điều khiển xuyên suốt hệ thống đó. trên quan điểm công nghệ phần mềm, công việc phát triển các đơn thể riêng rẽ được gọi là lập trình vi mô, việc tích hợp các đơn thể vào một hệ thống đơn hoàn chỉnh được xem là lập trình vĩ mô. Mục tiêu dịnh nghĩa kiến trúc là xây dựng các DBMS phân tán vơi khả năng cung cấp được các chức năng như: Vô hình, để tin cậy qua các giao dịch phân tán, hiệu quả và đặc tính mở rộng,.v.v.. 1.5.1. Tiêu chuẩn hóa hệ quản trị CSDL Tiêu chuẩn hóa DBMS có liên quan chặt chẽ với mô hình tham chiếu (reference model). Nó được xác định như một bộ k