Phân rã (PR) vấn tin là một giai đoạn đầu tiên của quá trình xử lý câu vấn tin,nó biến đổi câu vấn tin dạng phép tính quan hệ thành câu vấn tin đại số quan hệ. Các vấn tin nhập xuất đều tham chiếu đến các quan hệ toàn cục và không dùng đến các thông tin về phân bố dữ liệu ,vì thế phân rã vấn tin giống nhau trong cả hệ tập trung lẫn phân tán .
15 trang |
Chia sẻ: haohao89 | Lượt xem: 1937 | Lượt tải: 1
Bạn đang xem nội dung tài liệu Bài giảng Phân hóa vân tin và cục bộ hóa dữ liệu, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
CHƯƠNG V
PHÂN HOÁ VẤN TIN VÀ CỤC BỘ HOÁ DỮ LIỆU
8.1. Phân rã vấn tin
Phân rã (PR) vấn tin là một giai đoạn đầu tiên của quá trình xử lý câu vấn tin,nó biến đổi câu vấn tin dạng phép tính quan hệ thành câu vấn tin đại số quan hệ. Các vấn tin nhập xuất đều tham chiếu đến các quan hệ toàn cục và không dùng đến các thông tin về phân bố dữ liệu ,vì thế phân rã vấn tin giống nhau trong cả hệ tập trung lẫn phân tán .
Các bước phân rã vấn tin gồm : chuẩn hoá; phân tích; loại bỏ dư thừa và viết lại câu vấn tin .
8.1.1. Chuẩn hoá
Mục đích chuẩn hoá là bíên đổi câu vấn tin thành dạng chuẩn để tiếp tục xử lý với các ngôn ngữ quan hệ như SQL ,biểu đồ quan trọng nhất là lượng trì hoá vấn tin(query quali-fication) (mệnh đề WHERE) ,có thể là một vị từ phi lượng tử với độ phức tạp nào đó với tất cả các lượng từ cần thiết như "-với mọi, $-tồn tại được đặt phía trước .
Dạng chuẩn hội(Conjunctive normal form) là hội(^) của các tuyển(v)
Ví dụ : (p11 v p12 v … v p1n)^…^(pm1 v pm2 v …pnm)
Trong đó : p là vị trí đơn giản .
Dạng chuẩn tuyển (disjunction normal from) là tuyển của các hội.
Ví dụ: (p11^p12^…^p1n) v …v(pm1^pm2^…^pmn)
Các quy tắc (^ ≡ AND, v ≡ OR, ┐ ≡ NOT)
P1 ^ P2 ↔ P2 ^ P1
P1 v P2 ↔ P2 v P1
P1 ^ ( P2 ^ P3) ↔ ( P1 ^ P2) ^ P3
P1 v (P2 v P3) ↔ (P1 v P2) v P3
P1 ^ ( P2 v P3) ↔ (P1 v P2) v (P1 v P3)
P1 v (P2 ^ P3) ↔ ( P1 v P2) ^(P1 v P3)
┐( P1 ^ P2) ↔ ┐P1 v ┐P2
┐(P1 v P2) ↔ ┐P1 ^ ┐P2
┐(┐P)↔P
Dạng chuẩn hội thường được sử dụng trong thực tế bởi vì các lượng từ hoá vấn tin thường chứa nhiều vị từ AND hơn vị từ OR .Tuy nhiên nó cũng lặp lại nhiều vị từ cho các câu vấn tin có nhiều tuyển và ít hội.
Ví dụ 8.1-1 : Tìm tên các nhân viên đang làm ở dự án P1trong 12 hoặc 24 tháng.
Câu vấn tin bằng SQL như sau:
SELECT ENAME
FROM EMP, ASG
WHERE EMP.ENO = AGS.ENO
AND ASG.PNO = “P1”
AND DUR =12 OR DUR = 24
Lượng từ hoá chuẩn hội là :
(EMP.ENO =ASG.ENO)^ (ASG.PNO = “P1”)^((DUR=12) OR (DUR=24))
Còn lượng tử hóa chuẩn tuyển là :
{ (EMP.ENO =ASG.ENO)^ (ASG.PNO = “P1”)^(DUR=12) } v
{ (EMP.ENO =ASG.ENO)^ (ASG.PNO = “P1”)^(DUR=24) }
8.1.2. Phân tích
Ví dụ 8.1-2:
Tìm tên và nhiệm vụ (RESP) của các lập trình viên (programmer) đã làm việc cho dự án CAD/CAM trong hơn ba năm.
Câu vấn tin bằng SQL như sau :
SELECTS EMANE , RESP
FROM ẸMP, ASG,PROJ
WHERE EMP.ENO = ASG.ENO
AND ASG.PNO =PROJ.PNO
AND PNAME = “CAD/CAM”
AND DVR ³ 36
AND TITLE = “Programmer”
Đồ thị vấn tin cho câu vấn tin trên là:
ASG
EMP
PROJ
RESULT
RESP
EMP.ENO = ASG.ENO
ASG.PNO = PROJ.PNO
PNAME = “CAD/CAM”
ENAME
TITLE = “Programmer”
DUR³36
Hình 8.1-1. Đồ thị vấn tin
Đồ thị nối của đồ thị vấn tin là đồ thị ở hình 8.1-1a
ASG
EMP
PROJ
EMP.ENO = ASG.ENO
ASG.PNO = PROJ.PNO
Hình 8.1-1b. Đồ thị nối của 8.1-1a
Đồ thị vấn tin giúp cho việc xác định tính đúng đắn về ngữ nghĩa của câu vấn tin hội đa biến không có phủ định. Câu vấn tin sẽ sai ngữ nghĩa nếu đồ thị vấn tin của nó không liên thông .
Câu vấn tin được xem là đúng bằng cách xét các nối kết bị thiếu như một tích Descartes. Nhưng nói chung,vấn đề chính là các vị từ nối từ bị thiếu và câu vấn tin cần được cần loại bỏ.
Ví dụ 8.1-4:
SELECT ENAME,RESP
FROM EMP, ASG,PROJ
WHERE EMP.ENO =ASG.ENO
AND ASG.ENO = PROJ.PNO
AND PNAME=”CAD/CAM”
AND DUR > =36
AND TITLE = “PROGRAM”
Đồ thị vấn tin ở 8.1-2
ASG
EMP
PROJ
RESULT
RESP
EMP.ENO = ASG.ENO
PNAME = “CAD/CAM”
ENAME
TITLE = “Programmer”
DUR³36
Hình 8.1-2 Đồ thị vấn tin không liên thông
Dựa vào đồ thị vấn tin ta thấy nó không liên thông. Ba trường hợp có thể xảy ra :
i. Loại bỏ ngay câu vấn tin.
ii. Giả định có một tích Descartes giữa quan hệ ASG và PROJ .
iii. Suy ra vị trí nối bị thiếu ASG.PNO =PROJ.PNO
8.1.3 Loại bỏ dư thừa
Câu vấn tin của người sử dụng thường được diễn tả trên một khung nhìn có thể được bổ sung thêm nhiều vị từ để có được sự tương ứng khung nhìn - quan hệ, bảo đảm được tính toàn vẹn ngữ nghĩa và bảo mật. Khi bổ sung như vậy có thể sinh ra các vị trí dư thừa. Các vị trí dư thừa cần phải loại bỏ. Người ta có thể loại bỏ vị trí dư thừa khi áp dụng các quy tắc luỹ đẳng sau :
P ^ P = P
P v P = P
P ^ T = P
P v F = P
P ^ F = F
P v F = T
P ^ ┐P = F
P v ┐P = T
P1 ^ (P1 v P2) = P1
10 .P1 v (P1 ^ P2) = P1
Ví dụ:8.1.3_1:
Câu SQL:
SELECT TITLE
FROM EMP
WHERE (NOT(TITLE=”progarmmer”))
AND (TITLE=”Progarmmer”
OR TITLE=”Elect.Eng.”
AND NOT(TITLE= “Elect.Eng.”)
OR ENAME = “J.Doe”
Có thể đơn giản hoá nhờ các quy tắc trên và trở thành
SELECT TITLE
FROM EMP
WHERE ENAME= “J.Doe”
Đặt P1 = TITLE=”program”
P2= TITLE=”Elect.Eng.”
P3=ENAME=”J.Doe”
Thì câu SQL viết lại
(┐P1^(P1 v P2)^┐P2) v P3=P3 Theo quy tắc luỹ đẳng 5
Vì (┐P1^(P1 v P2)^┐P2) v P3=
(┐P1^((P1 ^ ┐P2) v (P2 ^ ┐P2)) v P3=(┐P1^P1^ ┐P2) v P3
Áp dụng quy tắc 7 → (F ^ P2) v (┐P1 ^ F) v P3↔F v F v P3↔P3.
8.1.4 Viết lại câu vấn tin
Viết lại câu vấn tin bằng đại số quan hệ được chia làm hai bước nhỏ
i/Biến đổi câu vấn tin từ phép tính quan hệ thành đại số quan hệ và
ii/Cấu trúc lại câu vấn tin đại số nhằm cải thiện hiệu năng.
Một cây toán tử là một cây với mỗi nút lá biểu thị cho một quan hệ được lưu trong cơ sở dữ liệu, nút không phải là lá biểu thị một quan hệ trung gian được sinh ra bởi phép toán quan hệ. Chuỗi các phép toán để đi theo hướng lá đến gốc, gốc biểu thị kết quả vấn tin.
Cách biến đổi câu vấn tin phép tính quan hệ trở thành một cây toán tử như sau:
i. Trước hết tạo ra các nút lá là các quan hệ trong SQL các nút lá nằm sau FROM.
ii. Nút gốc được tạo ra như phép chiếu chứa các thuộc tính kết quả ,các thuộc tính này nằm sau SELECT.
iii. Lượng tử hoá (sau where) được chuyển thành các phép tính quan hệ thích hợp (phép chọn ,phép nối ,…) đi từ các nút lá đến gốc .Chuỗi này có thể được cho trực tiếp qua thứ tự xuất hiện của các vị trí và các toán tử.
Ví dụ :8.1.4_1:
Tìm tên các nhân viên, trừ J.Doe đã làm cho dự án CAD/CAM trong một hoặc hai năm
Câu SQL là :
SELECT ENAME {Gốc }
FROM ASG.ENO=EMP.ENO
AND ENAME ≠ “J.Doe”
AND PROJ.PNAME= “CAD/CAM”
AND (DUR=12 OR DUR=24)
Cây toán tử như sau (hình 8.1.4_1):
Qua áp dụng quy tắc biến đổi , có thể có cây tương đương với cây ở 8.1.4_1. Sáu quy tắc tương đương hay dùng nhất sẽ được trình bày như sau đây:
Gọi R(A) │A={A1, …,An }; S(B)=│B{B1,…,Bn} và T là những quan hệ
i. Giao hoán phép toán: R*S « S*R; R wvS « SwvR
ii. Kết hợp: (R*S)*T « R*(S*T)
(RwvS) wvT « Rwv (SwvT)
iii. Luỹ thừa đẳng của phép toán đơn ngôi:
Những phép chiếu liên tiếp trên cùng một quan hệ có thể được nhóm lại. Ngược lại một phép chiếu trên nhiều thuộc tính có thể được tách ra thành nhiều phép chiếu liên tiếp nhau.
Gọi R(A) là quan hệ trên tập thuộc tính A ,A’Í A, A’’Í A, A’Í A- thì
ÕA’(ÕA’’( R)) « ÕA’( R)
Nhiều phép chọn liên tiếp sP(A1) trên cùng một quan hệ, trong đó Pi là một vị từ áp dụng cho thuộc tính Ai thì có thể được nhóm lại như sau:
sP1(A1) (sP2(A2)(R)) « sP1(A1) Ç P2(A2)
Ngược lại, phép chọn qua một hội vị từ có thể tách ra thành nhiều phép chọn liên tiếp nhau.
sDUR=12 Ú DUR=24
sPNAME = ”CAD/CAM”
sENAME ¹ ”J.Doe”
wvPNO
wv
PROJ
ASG
EMP
Hình 8.1.4 – 1. Ví dụ về cây toán tử
ÕENAME
Chọn
Nối
Chiếu
iv. Giao hoán với phép chiếu
ÕA1,…,An (sP(Ap)(R)) « ÕA1,…,An (sP(Ap)(ÕA1,…,An(R)))
Chú ý rằng, nếu Ap là phần tử của {A1,…,An} thì phép chiếu cuối cùng trên {A1,…,An} ở vế phải của hệ thức sẽ không có tác dụng.
v. Giao hoán phép chọn với phép toán 2 ngôi
Phép chọn và tích Descartes có thể được giao hoán bằng các qui tắc sau: (Ai Î R)
sP(Ai)(R*S) « (sP(Ai)(R))*S
Chọn và nối cũng có thể giao hoán:
sP(Ai)(RwvP(Aj,Bk)S) « sP(Ai)(R)wvP(Aj,Bk)S
Chọn và hợp cũng có thể giao hoán nếu R và T có lược đồ giống nhau:
sP(Ai)(RÈT) « sP(Ai)(R) È sP(Ai)(T)
Chọn và hiệu cũng có thể được giao hoán tương tự.
vi. Giao hoán phép chiếu với phép toán hai ngôi.
Chiếu và tích Descartes có thể được giao hoán. Nếu C = A’ÈB’, trong đó A’Í A, B’Í B; A, B là các tập thuộc tính tương ứng của các quan hệ R và S, thì :
ÕC(R*S) « ÕA’(R)*ÕB’(S)
Chiếu và nối cũng có thể giao hoán:
ÕC(RwvP(Aj,Bk)S) « ÕA’(R)wvP(Ai,Bj)ÕB’(S)
Để vế phải đúng, cần phải có Ai Î A’, Bj Î B’. Bởi vì C = A’ÈB’ nên Ai và Bj Î C vì thế chúng ta không cần chiếu lên C một khi đã chiếu trên A’ và B’.
Chiếu và hợp cũng có thể được giao hoán như sau:
ÕC(RÈS) « ÕC(R)ÈÕC(S)
Chiếu và hiệu có thể được giao hoán tương tự.
Áp dụng 6 qui tắc trên, cho phép tạo ra nhiều cây tương đương.
Ví dụ. Cây ở hình 8.1.4 – 1 tương đương với cây sau:
sPNAME = ”CAD/CAM” Ù (DUR=12 Ú DUR=24) Ù ENAME ¹ ”J.Doe”
wvPNO
wv
PROJ
ASG
EMP
Hình 8.1.4 – 2. Cây tương đương
ÕENAME
Có thể viết lại cây toán tử này như sau để tránh tích Descartes:
wvPNO
sPNAME = ”CAD/CAM”
sENAME ¹ ”J.Doe”
PROJ
ASG
EMP
Hình 8.1.4 – 3. Cây toán tử đã được viết lại
ÕENAME
ÕPNO,ENAME
wvENO
ÕPNO,ENO
ÕENO,ENAME
sDUR=12 Ú DUR=24
ÕPNO
8.2. Cục bộ hoá dữ liệu phân tán
Tầng cục bộ hoá dữ liệu (mục 5.5 chương 5) chịu trách nhiệm dịch câu vấn tin đại số trên quan hệ toàn cục sang câu vấn tin đại số trên các mảnh vật lý. Cục bộ hoá có sử dụng các thông tin được lưu trong lược đồ phân mảnh.
Một cách cục bộ hoá (Cbh) một vấn tin phân tán khá thô sơ là tạo ra một câu vấn tin trong đó mối quan hệ toán cục được thay bằng chương trình cục bộ hoá của nó. Chương trình cục bộ hoá là một chương trình đại số quan hệ mà các toán hạng là các quan hệ nó được dùng để xây dựng lại quan hệ toàn cục dựa trên qui tắc tái thích. Tuy nhiên cách làm này không hiệu quả vì nhiều tái thiết cấu trúc. Vì vậy chúng ta sẽ dùng các kỹ thuật rút gọn.
8.2.1. Rút gọn cho phân mảnh ngang nguyên thuỷ.
Phân mảnh ngang một quan hệ dựa trên các vị từ chọn.
Ví dụ 8.2.1 – 1:
EMP1 = sENO £ “E3” (EMP)
EMP2 = s“E3” < ENO £ “E6” (EMP)
EMP3 = s ENO > “E6” (EMP)
Chương trình cục bộ hoá cho quan hệ phân mảnh ngang trên là hợpcác mảnh lại:
EMP = EMP1 È EMP2 È EMP3
Vì vậy dạng vấn tin gốc được xác định trên EMP sẽ thu được nhờ thay EMP bởi EMP1 È EMP2 È EMP3
Rút gọn vấn tin trên các quan hệ phân mảnh ngang chủ yếu là xác định, sau khi đã tái cấu trúc lại cây con, xem cây nào tạo ra quan hệ rỗng thì bỏ cây con đó đi.
Rút gọn với phép chọn:
Nếu chọn trên các mảnh có lớp từ mâu thuẫn với lượng từ hoá của qui tắc phân mảnh sẽ sinh ra các quan hệ rỗng. Cho quan hệ R được phân mảnh ngang thành R1, R2,…, Rn trong đó Rj = s Pi(R).
Qui tắc 1: s Pi(Rj) = Æ nếu "x Î R: Ø(Pi(x) Ù Pj(x))
Trong đó Pi và Pj là các vị trí chọn x biểu thị cho một bộ, P(x) biểu thị cho “vị từ p đúng với x”.
Ví dụ: Vị từ chọn ENO = “E1” mâu thuẫn với các vị trí các mảnh EMP2 và EMP3 (Nghĩa là không có bộ nào trong EMP2 và EMP3 thoả vị từ chọn ENP = “E1”).
Ví dụ 8.2.1 – 2. Rút gọn co phân mảnh ngang bằng cách dùng câu vấn tin mẫu sau:
SELECT *
FROM EMP
WHERE ENO = “ES”
Hình 8.2.1 – 1. Rút gọn cho phân mảnh ngang (với phép chọn)
(b) vấn tin đã rút gọn
sENO = “E5”
EMP2
(a) vấn tin gốc
sENO = “E5”
EMP1
EMP3
EMP2
Áp dụng các tiếp cận đơn giản, dễ cục bộ hoá EMP từ EMP1, EMP2 và EMP3 cho ra câu vấn tin gốc (hình 8.2.1 – 1a). Bằng cách hoán vị phép chọn với phép lượng, sinh ra vị từ chọn ENO = “E5” mâu thuẫn với các vị từ phân mảnh EMP1, EMP3 do vậy tạo ra quan hệ rỗng. Câu vấn tin rút gọn chỉ được áp dụng trên EMP2 (như hình 8.2.1 – 1b).
Rút gọn và phép nối
Nối trên các quan hệ phân mảnh ngang có thể được đơn giản khi các quan hệ nối được phân mảnh theo thuộc tính nối. Đơn giản hoá gồm phân phối các nối trên các hợp rồi bỏ đi các nối vô dụng. Phân phối nối trên hợp có dạng:
(R1 È R2) wv S = (R1 wv S) È (R2 wv S)
Trong đó, Ri là các mảnh của R, còn S là một quan hệ.
Giả sử các mảnh Ri và Rj được định nghĩa tương ứng với các vị từ Pi và Pj trên cùng một quan hệ, qui tắc đơn giản hoá có thể được phát triển như sau:
Qui tắc 2:
Ri wv Rj = Æ nếu "x Î Ri, "y Î Rj: Ø(P(x) Ù P(x))
Ví dụ 8.2.1 – 3:
Giả sử EMP được phân mảnh thành EMP1, EMP2 và EMP3 như ví dụ 8.2.1 – 1 và quan hệ ASG được phân mảnh ngang như sau:
ASG1 = sENO £ “E3” (ASG)
ASG2 = s ENO > “E3” (ASG)
Như vậy EMP1 và ASG1 được định nghĩa bởi cùng một vị từ. Ngoài ra vị từ định nghĩa ASG2 là hợp của các vị từ định nghĩa mảnh EMP2 và EMP3. Bây giờ xét câu vấn tin
SELECT *
FROM EMP, ASG
WHERE EMP.ENO = ASG.ENO
Câu vấn tin gốc tương đương được trình bày trong hìn 8.2.1 – 2a. Câu vấn tin rút gọn bằng cách phân phối các nối trên hợp và việc áp dụng qui tắc 2 ở hình 8.2.1 – 2b.
Hình 8.2.1 – 2. Rút gọn cho phân mảnh ngang (với nối)
wvENO
EMP1
EMP2
EMP3
ASG1
ASG2
wv
wv
wv
EMP1
ASG1
EMP2
ASG2
EMP3
ASG2
(a) vấn tin gốc
(b) vấn tin đã rút gọn
8.2.2. Rút gọn cho phân mảnh dọc
Phân mảnh dọc phân tán một quan hệ dựa trên các thuộc tính chiếu. Toán tử tái xây dựng các mảnh dọc là nối, chương trình cục bộ hoá cho một quan hệ phân mảnh dọc là nối, chương trình cục bộ hoá cho một quan hệ phân mảnh dọc gồm có nối của các mảnh theo thuộc tính chung.
Ví dụ 8.2.2 – 1:
Giả sử EMP được phân thành hai mảnh dọc như sau, trong đó thuộc tính khoá ENO được nhân đôi: EMP1 = ÕENO,ENAME(EMP)
EMP2 = ÕENO,TITLE(EMP)
Chương trình cục bộ hoá sẽ là: EMP = EMP1 wvENO EMP2
Qui tắc 3:
Cho quan hệ R(A) | A = {A1, …, An} và được phân mảnh thành các mảnh dọc
Ri = ÕA’(R) | A’ Í A. Qui tắc phát biểu như sau:
ÕD,K(Ri) là vô dụng nếu các thuộc tính chiếu D không thuộc A’.
Ví dụ 8.2.2 – 2:
Cho câu vấn tin trong SQL:
SELECT ENAME
FROM EMP
Được mảnh EMP1, mảnh còn lại là EMP2 (khi kết hợp với các thuộc tính khoá) câu vấn tin gốc tương đương trên EMP1 và EMP2 được cho trên hình 8.2.2 – 1a, câu vấn tin rút gọn trên hình 8.2.2 – 1b sau khi hoán vị phép chiếu với phép nối (tức là chiếu trên ENO, ENAME), chúng ta thấy EMP2 là vô dụng vì ENAME không thuộc EMP2.
ÕENAME
ÕENAME
wvENO
EMP1
EMP2
EMP1
(a) vấn tin gốc
(b) vấn tin đã rút gọn
Hình 8.2.2 – 1. Rút gọn cho phân mảnh dọc
8.2.3. Rút gọn cho phân mảnh dẫn xuất
Chúng ta thấy rằng, nếu quan hệ R phải phan mảnh dẫn xuất theo quan hệ S, thì các mảnh của R và S có giá trị giống nhau ở thuộc tính nối sẽ nằm cùng vị trí. Ngoài ra, S có thể được phân mảnh theo vị trừ chọn.
Bởi vì các bộ của R được đặt tuỳ theo các bộ của S, phân mảnh dẫn xuất chỉ sử dụng cho mối liên hệ 1 – n có dạng S à R, trong đó một bộ của S có thể khớp với nhiều bộ của R, nhưng một bộ của R chỉ khớp với một bộ của S.
Ví dụ 8.2.3 – 1:
Giả sử EMP được phân mảnh ngang (xem chương 3) thành EMP1 và EMP2 như sau:
EMP1 = sTITLE = ”programmer”(EMP)
EMP1 = sTITLE ¹ ”programmer”(EMP)
Phân mảnh dẫn xuất ASG được thực hiện như sau:
ASG1 wvENO EMP1
ASG2 wvENO EMP2
Chương trình cục bộ hoá cho quan hệ phân mảnh ngang là hợp của các mảnh. Tức:
ASG = ASG1 È ASG2
Các câu vấn tin trên các mảnh dẫn xuất cũng có thể được rút gọn theo Qui tắc 2. Bởi vì qui tắc phân mảnh chỉ rõ các bộ sẽ khớp với nhau, một số nối sẽ sinh ra quan hệ rỗng nếu các vị trí phân mảnh có mâu thuẫn. Ví dụ các vị từ của ASG và EMP2 mâu thuẫn, vì thế: ASG1 wv = Æ
Ví dụ 8.2.3 – 2:
Rút gọn theo mảnh dẫn xuất được minh hoạ bằng cách dùng câu vấn tin SQL truy xuất tất cả các thuộc tính từ EMP và ASG có cùng giá trị của ENO và chức vụ là: TITLE = “Mech.Eng”.
SELECT *
FROM EMP, ASG
WHERE ASG.ENO = EMP.ENO
AND TITLE = “Mech.Eng”
Các mảnh EMP1, EMP2, ASG1, ASG2 ở ví dụ 8.2.3 – 1.
Câu vấn tin gốc trong hình 8.2.3 – 1a.
wvENO
ASG1
EMP1
ASG2
(8.2.3 - 1a) vt gốc (EMP1 không có “Mech.Eng”
(8.2.3 - 1b)
Hình 8.2.2 – 1. Rút gọn cho phân mảnh dọc
EMP2
sTITLE = ”Mech.Eng”
wvENO
ASG1
ASG2
sTITLE = ”Mech.Eng”
EMP2
Bằng cách dùng phép chọn (giao hoán) xuống các mảnh EMP1 và EMP2 do vị từ chọn mâu thuẫn với vị từ phân mảnh EMP1 và vì thế loại bỏ EMP1 nên ta có câu vấn tin mới ở hình 8.2.3 – 1b. Để phát hiện các vị trí mâu thuẫn, chúng ta phân phối các nối trên các hợp. Kết quả là cây 8.2.3 – 1c.
wvENO
wvENO
ASG1
EMP2
sTITLE = ”Mech.Eng”
ASG2
EMP2
sTITLE = ”Mech.Eng”
wvENO
sTITLE = ”Mech.Eng”
ASG2
EMP2
(8.2.3 – 1c)
Cây con bên trái (của 8.2.3 – 1c) nối hai mảnh ASG1 và EMP2 với các lượng từ mâu thuẫn do vị từ TITLE = “programmar” trong ASG1 và TITLE ¹ “programmer” trong EMP2 vì thế ta có thể bỏ qua cây cọn trai. Kết quả cuối cùng ở hình 8.2.3 – 1d.
8.2.4. Rút gọn mảnh hỗn hợp
Ví dụ 8.2.4 – 1:
Ba mảnh sau được phân mảnh hỗn hợp từ quan hệ EMP
EMP1 = sENO £ “E4” (ÕENO,ENAME(EMP))
EMP2 = s ENO > “E4” (ÕENO,ENAME(EMP))
EMP3 = ÕENO,TITLE(EMP)
Chương trình cục bộ hoá sẽ là: EMP = (EMP1 È EMP2) wvENO EMP3
Các câu vấn tin trên các mảnh hỗn hợp có thể được rút gọn bằng cách tổ hợp các qui tắc tương ứng đã được dùng trong các phân mảnh ngang, dọc, và ngang dẫn xuất, có thể tóm tắt các qui tắc như sau:
1. Loại bỏ các quan hệ rỗng được tạo ra bởi các phép chọn mâu thuẫn trên các mảnh ngang.
2. Loại bỏ các quan hệ vô dụng được tạo ra bởi các phép chiếu trên các mảnh dọc.
3. Phân phối các nối cho các hợp nhằm cô lập và loại bỏ các nối vô dụng.
Ví dụ 8.2.4 – 2:
Câu vấn tin SQL sau minh hoạ cách áp dụngÕENO,ENAME
sENO = “E5”
wvENO
EMP3
EMP1
EMP2
Qui tắc 1 và Qui tắc 2 cho phân mảnh ngang - dọc của quan hệ EMP thành EMP1, EMP2 và EMP3 được cho ở trên.
SELECT ENAME
FROM EMP
WHERE ENO = “ES”
Câu vấn tin gốc ở hình 8.2.4 – 1(a) có thể được rút gọn bằng cách trước tiên đẩy phép chọn xuống để loại bỏ EMP1, đẩy phép chiếu xuống để loại EMP3. Câu vấn tin rút gọn cuối cùng là:
ÕENO,ENAME
sENO = “E5”
EMP2