Bài giảng Đơn giản hóa văn phạm phi ngữ cảnh và các dạng chuẩn

Chuỗi trống đóng một vai trò khá đặc biệt trong nhiều định lý và chứng minh, và thường cần có một sự chú ý đặc biệt cho nó. Nếu L∋λ thì biểu diễn L= L1∪λ với L1= L-λ. Nếu G1= (V1, T, S1, P1) là văn phạm biểu diễn cho L1 thì G= (V1∪{S}, T, S, P1∪{S→S1| λ}) là văn phạm biểu diễn cho L. Trong chương này, chúng ta chỉ xem xét các NNPNC không chứa λ. Tuy nhiên những kết luận cho ngôn ngữ không chứa λ vẫn có thể áp dụng cho ngôn ngữ có chứa λ.

35 trang | Chia sẻ: haohao89 | Lượt xem: 3367 | Lượt tải: 1

Bạn đang xem trước 20 trang tài liệu Bài giảng Đơn giản hóa văn phạm phi ngữ cảnh và các dạng chuẩn, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

Trang 189 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Chương 6 Đơn giản hóa VPPNC và các dạng chuẩn 6.1 Các phương pháp để biến đổi văn phạm 6.2 Hai dạng chuẩn quan trọng 6.3 Giải thuật thành viên cho văn phạm phi ngữ cảnh Trang 190 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Các phương pháp để biến đổi văn phạm Chuỗi trống đóng một vai trò khá đặc biệt trong nhiều định lý và chứng minh, và thường cần có một sự chú ý đặc biệt cho nó. Nếu L ∋ λ thì biểu diễn L = L1 ∪ λ với L1 = L - λ. Nếu G1 = (V1, T, S1, P1) là văn phạm biểu diễn cho L1 thì G = (V1 ∪ {S}, T, S, P1 ∪ {S→ S1 | λ}) là văn phạm biểu diễn cho L. Trong chương này, chúng ta chỉ xem xét các NNPNC không chứa λ. Tuy nhiên những kết luận cho ngôn ngữ không chứa λ vẫn có thể áp dụng cho ngôn ngữ có chứa λ. Trang 191 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Một vài qui tắc thay thế hiệu quả Định lý 6.1 Cho G = (V, T, S, P) là một VPPNC. Giả sử P có chứa luật sinh A→ x1Bx2 trong đó A, B là các biến khác nhau và B→ y1 | y2 | ... | yn là tập tất cả các luật sinh trong P mà có B ở vế trái. Cho G1= (V, T, S, P1) là VP được xây dựng bằng cách xóa đi A→ x1Bx2 từ P, và thêm vào nó A→ x1y1x2 | x1y2x2| ... | x1ynx2 Thì L(G) = L(G1) Trang 192 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Ví dụ Xét văn phạm G = ({A, B}, {a, b}, A, P) với các luật sinh A→ a | aA | bBc, B→ abA | b. Sau khi thay thế biến B ta nhận được VP tương đương như sau A→ a | aA | babAc | bbc, B→ abA | b Chuỗi abbc có các dẫn xuất trong G và G1 lần lượt như sau: A⇒ aA⇒ abBc⇒ abbc A⇒ aA⇒ abbc Chú ý rằng, biến B và các luật sinh của nó vẫn còn ở trong VP mặc dù chúng không còn đóng vai trò gì trong bất kỳ dẫn xuất nào. Sau này chúng ta sẽ thấy rằng những luật sinh không cần thiết như vậy có thể bị loại bỏ ra khỏi văn phạm. Trang 193 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Loại bỏ đệ qui trái Định lý 6.2 (Loại bỏ đệ qui trái) Cho G = (V, T, S, P) là một VPPNC. Chia tập các luật sinh mà vế trái của chúng là một biến đã cho nào đó (chẳng hạn là A), thành hai tập con riêng biệt A→ Ax1 | Ax2 | ... | Axn (6.2) A→ y1 | y2 | ... | ym (6.3) với xi, yi ∈ (V ∪ T)*, và A không là prefix của bất kỳ yi nào. Xét G1 = (V ∪ {Z}, T, S, P1), trong đó Z ∉ V và P1 nhận được bằng cách thay mọi luật sinh của P có dạng (6.2 ) và (6.3) bởi A→ yi | yiZ, i = 1, 2, . . . , m, Z→ xi | xiZ, i = 1, 2, . . . , n, Thì L(G) = L(G1). Trang 194 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Loại bỏ đệ qui trái (tt) Chứng minh Các dạng câu mà A sinh ra trong văn phạm G có dạng: A A(x1 + x2 + ... + xn)* ⇒ yi(x1 + x2 + ... + xn)* Các dạng câu này cũng có thể được sinh ra trong G1 bằng cách chú ý Z có thể sinh ra các dạng câu có dạng Z (x1 + x2 + ... + xn)(x1 + x2 + ... + xn)* mà A→ yi | yiZ nên A yi(x1 + x2 + ... + xn)* Vì vậy L(G) = L(G1). Ghi chú Các luật sinh đệ qui-trái chỉ là một trường hợp đặc biệt của đệ qui-trái trong văn phạm như được phát biểu sau. Một văn phạm được gọi là đệ qui-trái nếu có một biến A nào đó mà đối với nó A Ax là có thể. *⇒ *⇒ *⇒ *⇒ Trang 195 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Ví dụ Sử dụng Định lý 6.2 để loại bỏ các luật sinh đệ qui-trái khỏi VP A→ Aa | aBc | λ B→ Bb | ba Áp dụng định lý cho biến A ta được tập luật sinh mới như sau: A→ aBc | λ | aBcZ | Z B→ Bb | ba Z→ a | aZ Áp dụng định lý một lần nữa lần này cho biến B ta được tập luật sinh kết quả cuối cùng như sau: A→ aBc | aBcZ | Z | λ B→ ba | baY Z→ a | aZ Y→ b | bY Nhận xét Việc loại bỏ các luật sinh đệ qui-trái đưa ra các biến mới. VP kết quả có thể là "đơn giản" hơn đáng kể so với VP gốc nhưng một cách tổng quát nó sẽ có nhiều biến và luật sinh hơn. Trang 196 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Luật sinh vô dụng Định nghĩa 6.1: Cho G = (V, T, S, P) là một VPPNC. Một biến A ∈ V được gọi là khả dụng nếu và chỉ nếu có ít nhất một chuỗi w ∈ L(G) sao cho S xAy w, với x, y ∈ (V ∪ T)*. Bằng lời, một biến là khả dụng nếu và chỉ nếu nó xuất hiện trong ít nhất một dẫn xuất. Một biến mà không khả dụng thì gọi là vô dụng.Một luật sinh được gọi là vô dụng nếu nó có chứa bất kỳ biến vô dụng nào. Các dạng vô dụng Vô dụng loại 1: A w ∈ T* Vô dụng loại 2: S xAy *⇒ *⇒ *⇒ *⇒ Trang 197 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Loại bỏ các luật sinh vô dụng Định lý 6.3 Cho G = (V, T, S, P) là một VPPNC, ∃ một VP tương đương G0 = (V0, T, S, P0) mà không chứa bất kỳ biến vô dụng nào. Chứng minh Loại bỏ các biến và luật sinh vô dụng loại 1 Tạo văn phạm G1 = (V1, T, S, P1) với V1 là tập biến không vô dụng loại 1. Ta tìm V1 như sau: 1. Khởi tạo V1 = ∅. 2. Lặp lại bước sau cho đến khi không còn biến nào được thêm vào V1. Đối với mỗi A ∈ V mà có luật sinh A→ x, x ∈ (V1∪T)*, thì thêm A vào V1. 3. Loại khỏi P các luật sinh có chứa các biến ∉ V1, ta được P1. Trang 198 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Loại bỏ các luật sinh vô dụng (tt) Để loại tiếp các biến và các luật sinh vô dụng loại 2 ta dựa vào G1 vừa có ở trên và vẽ đồ thị phụ thuộc cho nó, sau đó tìm tập các biến không đạt tới được từ S. Loại các biến này và các luật sinh liên quan đến nó ra khỏi G1 ta được văn phạm kết quả G0. Đồ thị phụ thuộc (dependency graph) Là một đồ thị có các đỉnh biểu diễn các biến, còn một cạnh nối hai đỉnh A và B khi và chỉ khi có luật sinh dạng A→ xBy Ví dụ Loại bỏ các biến và các luật sinh vô dụng ra khỏi văn phạm G = ({S, A, B, C}, {a, b}, S, P), với tập luật sinh P là: S → aS | A | C B → aa A → a C → aCb A B Trang 199 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Ví dụ Loại bỏ các biến vô dụng loại 1 ta được V1 = {S, A, B} và tập luật sinh P1 S→ aS | A A→ a B→ aa Loại bỏ các biến vô dụng loại 2 ta được văn phạm kết quả S→ aS | A A→ a Nhận xét Nếu thay đổi thứ tự loại bỏ (loại bỏ các biến và luật sinh vô dụng loại 2 trước) thì sẽ không loại bỏ được tất cả các biến và luật sinh vô dụng chỉ bằng một lần như ví dụ sau cho thấy. S → aS | A | C A → a B → aa C → aCb S A B Trang 200 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Ví dụ (tt) Xét văn phạm sau S→ aSb | ab | A A→ aAB B→ b Nếu loại bỏ các biến và luật sinh vô dụng loại 2 trước ta thấy văn phạm vẫn không thay đổi vì tất cả các biến đều đạt tới được từ S. Sau đó loại bỏ tiếp các biến và luật sinh vô dụng loại 1 ta sẽ được văn phạm sau: S→ aSb | ab | A B→ b Rõ ràng văn phạm này còn biến B là vô dụng loại 2. Trang 201 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Loại bỏ luật sinh-λ Định nghĩa 6.2 Bất kỳ luật sinh nào của VPPNC có dạng A→ λ được gọi là luật sinh-λ. Bất kỳ biến A nào mà A λ là có thể thì được gọi là khả trống (nullable). Định lý 6.4 Cho G là một VPPNC bất kỳ mà L(G) không chứa λ, thì tồn tại một văn phạm G0 tương đương mà không có chứa luật sinh-λ. Chứng minh: Bước 1 Tìm tập VN tất cả các biến khả trống của G bằng các bước sau. *⇒ Trang 202 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Loại bỏ luật sinh-λ 1. Đối với mọi luật sinh A → λ, đưa A vào VN. 2. Lặp lại bước sau cho đến khi không còn biến nào được thêm vào VN. Đối với mọi luật sinh B→ A1A2 … An, mà A1, A2, An ∈ VN thì đặt B vào VN. Bước 2 Sau khi có tập VN ta xây dựng tập luật sinh như sau. Ứng với mỗi luật sinh có dạng A→ x1x2 … xm, m ≥ 1, trong đó mỗi xi ∈ V ∪ T, đặt luật sinh này vào cùng với các luật sinh được sinh ra bằng cách thay thế các biến khả trống bằng λ trong mọi tổ hợp có thể, ngoại trừ nếu tất cả các xi đều khả trống thì không đặt luật sinh A→ λ vào P0 của G0 Trang 203 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Ví dụ Loại bỏ các luật sinh-λ của văn phạm sau: S→ ABaC C→ D | λ A→ BC D→ d B→ b | λ Vì B→ λ và C→ λ suy ra B và C là các biến khả trống. Vì A→ BC nên suy ra A cũng là biến khả trống. Ngoài ra không còn biến nào khác là khả trống. Theo Bước 2 ta xây dựng được tập luật sinh mới tương đương như sau: S→ ABaC | BaC | AaC | Aba | aC | Aa | Ba | a A→ BC | B | C B→ b C→ D D→ d Trang 204 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Loại bỏ luật sinh đơn vị Định nghĩa 6.3 Bất kỳ luật sinh nào của VPPNC có dạng A→ B trong đó A, B ∈ V được gọi là luật sinh-đơn vị. Định lý 6.5 Cho G = (V, T, S, P) là một VPPNC bất kỳ không có luật sinh-λ, thì tồn tại một VPPNC G1 = (V1, T, S, P1) mà không có bất kỳ luật sinh đơn vị nào và tương đương với G1. Chứng minh 1. Đặt vào trong P1 tất cả các luật sinh không đơn vị của P. 2. Đối với mỗi biến A tìm tất cả các biến B mà A B (*) Điều này thực hiện bằng cách vẽ đồ thị phụ thuộc cho G nhưng một cạnh nối 2 đỉnh A và B khi và chỉ khi có luật sinh-đơn vị A→ B. Hai biến A và B thõa (*) khi và chỉ khi có một con đường trong đồ thị đi từ A đến B. ⇒* Trang 205 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Ví dụ 3. Đối với mỗi A, B thõa (*) thêm vào trong P1 các luật sinh A→ y1 | y2 | ... | yn với B→ y1 | y2 | ... | yn là các luật sinh không đơn vị của B. Ví dụ Loại bỏ các luật sinh đơn vị cho VP sau S→ Aa | B B→ A | bb A→ a | bc | B Trước hết, đặt các luật sinh không đơn vị vào trong P1 S→ Aa A→ a | bc B→ bb S A B Từ ĐTPT ta đưa được thêm các luật sinh sau vào S→ a | bc | bb A→ bb B→ a | bc Trang 206 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Ví dụ (tt) Kết quả ta có văn phạm tương đương sau không có luật sinh đơn vị S→ Aa | a | bc | bb A→ a | bc | bb B→ bb | a | bc Định lý 6.6 Cho L là một NNPNC không chứa λ, tồn tại một VPPNC sinh ra L mà không chứa bất kỳ luật sinh vô dụng, luật sinh-λ, hay luật sinh-đơn vị nào. Chứng minh: B1. Loại bỏ luật sinh-λ B2. Loại bỏ luật sinh đơn vị B3. Loại bỏ luật sinh vô dụng loại 1, rồi vô dụng loại 2 Trang 207 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Một số nhận xét 1.Loại bỏ biến vô dụng loại 1 có thể sinh ra biến vô dụng loại 2. 2.Việc loại bỏ biến vô dụng loại 2 không sinh ra biến vô dụng loại 1. 3.Văn phạm không có luật sinh đơn vị thì việc loại bỏ luật sinh-λ có thể sinh ra luật sinh-đơn vị. 4.Văn phạm không có luật sinh-λ thì việc loại bỏ luật sinh-đơn vị không thể sinh ra luật sinh-λ mới. 5.Loại bỏ luật sinh-λ có thể sinh ra biến vô dụng loại 1. 6.Loại bỏ luật sinh-đơn vị có thể sinh ra biến vô dụng loại 2. 7.Văn phạm không có luật sinh-λ, luật sinh-đơn vị thì việc loại bỏ các luật sinh vô dụng loại 1, loại 2 không sinh ra thêm bất kỳ luật sinh-λ và luật sinh-đơn vị nào mới. Trang 208 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Dạng chuẩn Chomsky Định nghĩa 6.4 Một VPPNC là thuộc dạng chuẩn Chomsky nếu mọi luật sinh có dạng A→ BC, hoặc A→ a trong đó A, B, C ∈ V, còn a ∈ T. Định lý 6.7 Bất kỳ VPPNC G = (V, T, S, P) nào với λ ∉ L(G) đều có một văn phạm tương đương G1 = (V1, T, S, P1) có dạng chuẩn Chomsky. Chứng minh Không mất tổng quát giả sử G không có luật sinh-vô dụng, luật sinh-đơn vị và luật sinh-λ. Ta xây dựng văn phạm G1 có dạng chuẩn Chomsky bằng thủ tục sau: Trang 209 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Thủ tục: G-to-GChomsky Input: G = (V, T, S, P) với λ ∉ L(G) Output: G1 = (V1, T, S, P1) có dạng chuẩn Chomsky. 1.Đặt các luật sinh A→ a vào P1. 2.Đối với các luật sinh A→ x1x2 ... xn với n ≥ 2, xi ∈ (V ∪ T) thì thay các kí hiệu kết thúc, chẳng hạn xk = a, bằng các biến đại diện mới Ba, tạo thành các luật sinh trung gian A→ C1C2...Cn. 3.Ứng với mỗi biến đại diện Ba đặt vào P1 các luật sinh Ba→ a. 4. Sau khi thực hiện bước 2, ứng với mỗi luật sinh A→ C1C2 ... Cn mà n = 2 đặt nó vào P1. Ngược lại ứng với n > 2 ta giới thiệu các biến mới D1, D2, ... và đưa vào các luật sinh sau: A → C1D1 D1 → D1D2 Dn-2 → Cn-1Cn M Trang 210 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Ví dụ Hãy biến đổi VP sau thành VP có dạng chuẩn Chomsky. S→ a | ABa A→ aab B→ b | Ac S→ a B→ b S→ ABXa A→ XaXaXb B→ AXc Xa→ a Xb→ b Xc→ c S → AD1 D1→ BXa A → XaD2 D2→ XaXbBước 2 B ư ớ c 1 Bước 3 B ư ớ c 4 S → a | AD1 D1→ BXa A → XaD2 D2→ XaXb B → b | AXc Xa→ a Xb→ b Xc→ c Kết quả Trang 211 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Dạng chuẩn Greibach Định nghĩa 6.5 Một VPPNC là thuộc dạng chuẩn Greibach nếu mọi luật sinh có dạng A→ ax trong đó a ∈ T còn x ∈ V*. Định lý 6.8 Đối với mọi VPPNC G với λ ∉ L(G), thì tồn tại một văn phạm tương đương trong dạng chuẩn Greibach. Chứng minh Không mất tính tổng quát giả sử G không có luật sinh-vô dụng, luật sinh-đơn vị và luật sinh-λ. Ta xây dựng văn phạm có dạng chuẩn Greibach bằng thủ tục sau. Trang 212 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Thủ tục: G-to-GGreibach Input: G = (V, T, S, P) với λ ∉ L(G) Output: G1 = (V1, T, S, P1) có dạng chuẩn Greibach. 1.Đánh số thứ tự cho các biến chẳng hạn là A1, A2, . . . An. 2.Dùng Định lý 6.1 và 6.2 để viết lại VP sao cho các luật sinh có một trong ba dạng sau Điều này thực hiện được bằng cách sử dụng Định lý 6.1 và 6.2 cho các biến Ai theo thứ tự i đi từ 1, 2, ... đến n như sau. Giả sử xét luật sinh của biến Ai. Nếu có luật sinh Ai→ Ajx mà i > j thì thay Aj đi đầu bằng các vế phải của nó, và làm cho đến khi các luật sinh của Ai có dạng Ai→ Ajx, i ≤ j. Đến đây loại đệ qui trái cho Ai thì các luật sinh của nó sẽ có dạng như đã nêu. a ∈ T và xi ∈ (V ∪ T)* Zi là các biến mới Ai→ Ajxj, i < j Zi→ Ajxj, j ≤ n Ai→ axi Trang 213 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Thủ tục: G-to-GGreibach (tt) 3.Sau khi thực hiện bước 2, tất cả các luật sinh của An phải có dạng An→ axn Thay An đi đầu vế phải của các luật sinh bằng các vế phải của nó. Kết quả các luật sinh của An-1 có dạng An-1→ axn-1 Tương tự thay thế An-1 đi đầu vế phải của các luật sinh bằng các vế phải của nó. Và thực hiện lần lượt cho đến A1. 4.Thay các kí hiệu kết thúc, chẳng hạn a, không đi đầu vế phải bằng các biến đại diện, chẳng hạn Xa, đồng thời thêm vào các luật sinh mới Xa→ a. Ví dụ Biến đổi VP sau thành VP có dạng chuẩn Greibach S→ SBb | Ab A → Sb | Ba B→ Sb | a Trang 214 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Ví dụ S→ SBb | Ab A → Sb | Ba B→ Sb | a B2→ S0b | a S0→ A1b | A1bZ0 (1) Z0→ B2b | B2bZ0 (2) A1→ A1bb | A1bZ0b | B2a B2→ B2aba | B2aZ1ba | B2abZ0a | B2aZ1bZ0a | b B2→ A1ba | A1bZ0a | b B2→ b | bZ2 (5) Z2→ aba | aZ1ba | abZ0a | aZ1bZ0a | abaZ2 | aZ1baZ2 | abZ0aZ2 | aZ1bZ0aZ2 (6) S0→ S0B2b | A1b A1→ S0b | B2a Loại đệ qui trái Thay thế Loại đệ qui trái Thay thế Loại đệ qui trái Thay thế A1→ B2a | B2aZ1 (3) Z1→ bb | bZ0b | bbZ1 | bZ0bZ1 (4) Trang 215 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Ví dụ (tt) S0→ A1b | A1bZ0 (1) B2→ b | bZ3 (5) Thay thế S0→ bab | bZ2ab | baZ1b | bZ2aZ1b | babZ0 | bZ2abZ0 | baZ1bZ0 | bZ2aZ1bZ0 (8) Z0→ bb | bZ2b | bbZ0 |bZ2bZ0 (9)Z0→ B2b | B2bZ0 (2) Thay thế Thay thế A1→ B2a | B2aZ1 (3) A1→ ba | bZ2a | baZ1 |bZ2aZ1 (7) Trang 216 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Ví dụ (tt) S0→ bab | bZ2ab | baZ1b | bZ2aZ1b | babZ0 | bZ2abZ0 | baZ1bZ0 | bZ2aZ1bZ0 (8) A1→ ba | bZ2a | baZ1 |bZ2aZ1 (7) B2→ b | bZ3 (5) Z0→ bb | bZ2b | bbZ0 |bZ2bZ0 (9) Z1→ bb | bZ0b | bbZ1 | bZ0bZ1 (4) Z2→ aba | aZ1ba | abZ0a | aZ1bZ0a | abaZ2 |aZ1baZ2 | abZ0aZ2 | aZ1bZ0aZ2 (6) Thay kí hiệu kết thúc không đi đầu bằng biến đại diện S → bXY | bZ2XY | bXZ1Y | bZ2XZ1Y | bXYZ0 | bZ2XYZ0 | bXZ1YZ0 | bZ2XZ1YZ0 A → bX | bZ2X | bXZ1 |bZ2XZ1 B → b | bZ3 Z0→ bY | bZ2Y | bYZ0 |bZ2YZ0 Z1→ bY | bZ0Y | bYZ1 | bZ0YZ1 Z2→ aYX | aZ1YX | aYZ0X | aZ1YZ0X | aYXZ2 | aZ1YXZ2 | aYZ0XZ2 | aZ1YZ0XZ2 X → a Y → b Văn phạm gần- Greibach Trang 217 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Giải thuật thành viên cho VPPNC Giải thuật CYK (J.Cocke, D.H.Younger, T.Kasami) Input: Văn phạm Chomsky G = (V, T, S, P) Chuỗi w = a1a2 … an Output: “Yes” + DXTN hoặc “No”. Chúng ta định nghĩa các chuỗi con wij = ai ... aj, Và các tập con của V Vij = {A ∈ V : A wij}, Để ý w = w1n, vậy w ∈ L(G) khi và chỉ khi S ∈ V1n. Vậy để biết w có ∈ L(G) hay không chúng ta tính V1n và xem S có ∈ V1n hay không. *⇒ Trang 218 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Giải thuật CYK A ∈ Vii nếu và chỉ nếu A có luật sinh A → ai. Vậy, Vii có thể được tính ∀i, 1 ≤ i ≤ n. Nếu B wik (⇔ B ∈ Vik), C w(k+1)j (⇔ C ∈ V(k+1)j) và đồng thời A → BC thì A wij (⇔ A ∈ Vij) ∀ i ≤ k, k < j. Vij = ∪k∈{i, i+1, ... , j – 1}{A: A→ BC, với B ∈ Vik, C ∈ V(k+1)j} Quá trình tính các tập Vij V11, V22, ...,Vnn V12, V23, . . .,V(n-1)n V13, V24, . . .,V(n-2)n ... V1n *⇒ *⇒ *⇒ Trang 219 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Ví dụ Sử dụng giải thuật CYK đê PTCP chuỗi w = aabbb trên G sau S→ AB (1) A→ BB | a (2, 3) B→ AB | b (4, 5) Ta có w =a a b b b 1 2 3 4 5 V11 = {A}, V22 = {A}, V33 = {B}, V44 = {B}, V55 = {B}, V12 = ∅, V23 = {S, B}, V34 = {A}, V45 = {A}, V13 = {S, B}, V24 = {A}, V35 = {S, B}, V14 = {A}, V25 = {S, B}, V15 = {S, B}. S ∈ V15⇒ w ∈ L(G). Trang 220 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Ví dụ (tt) Để tìm dẫn xuất cho w, chúng ta phải tìm cách “lưu vết” V11 = {A ( a)}, V22 = {A( a)}, V33 = {B( b)}, V44 = {B( b)}, V55 = {B( b)}, V12 = ∅, V23 = {S( A22B33), B( A22B33)}, V34 = {A( B33B44)}, V45 = {A( B44B55)}, V13 = {S( A11B23), B( A11B23)}, V24 = {A( B23B44)}, V35 = {S( A34B55), B( A34B55)}, V14 = {A( B13B44)}, V25 = {S( A22B35, A24B55), B( A22B35, A24B55)}, V15 = {S( A22B35, A24B55), B( A22B35, A24B55)}. 3→ S→ AB (1) A→ BB | a (2, 3) B→ AB | b (4, 5) w = a a b b b 1 2 3 4 5 5→ 5→5→ 3→ 1→ 4→ 2→ 2→ 1→ 4→ 2→ 1→ 4→ 2→ 1→ 1→ 4→ 4→ 1→ 1→ 4→ 4→ Trang 221 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Ví dụ (tt) Kết quả có 3 DXTN như sau: (1) S A11B25 aB25 aA22B35 aaB35 aaA34B55 aaB33B44B55 aabbb (DXTN: 134342555) (2) S A11B25 aB25 aA24B55 aB23B44B55 aA22B33B44B55 aabbb (DXTN: 134243555) (3) S A14B55 B13B44B55 A11B23B44B55 aB23B44B55 aA22B33B44B55 aabbb (DXTN: 124343555) S→ AB (1) A→ BB | a (2, 3) B→ AB | b (4, 5) w = a a b b b 1 2 3 4 5 1⇒ 3⇒ 4⇒ 3⇒ 4⇒ 2⇒ 5,5,5⇒ 1⇒ 3⇒ 4⇒ 2⇒ 4⇒ 5,5,5,3⇒ 1⇒ 2⇒ 4⇒ 3⇒ 4⇒ 5,5,5,3⇒ Trang 222 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Ví dụ (tt) 3 CDXtương ứng: S→ AB (1) A→ BB | a (2, 3) B→ AB | b (4, 5) w = a a b b b 1 2 3 4 5 S A11 B25 a A22 B35 a A34 B55 bB33 B44 bb S A11 B25 a B55A24 bB23 B44 bA22 B33 ba S B55A14 bB44B13 bB23A11 a A22 B33 ba Trang 223 Lý thuyết Ôtômát & NNHT - Khoa Công Nghệ Thông Tin Bài tập Dùng giải thuật CYK PTCP các chuỗi sau w1 = abab, w2 = abaa trên các VP G1, G2 tương ứng. G1 G2 S→ AB⏐BB (1, 2) S→ AB (1) A → BA⏐a (3, 4) A→ BB⏐a (2, 3) B→ AA⏐a⏐b (5, 6, 7) B→ BA⏐b (4, 5)