Trong quản lý các cơ sở dữ liệu (CSDL), phụ thuộc dữ liệu được hiểu là
những mệnh đề mô tả các ràng buộc mà dữ liệu phải đáp ứng trong thực tế. Nhờ có
những mô tả phụ thuộc này mà hệ quản trị cơ sở dữ liệu có thể quản lý tốt được chất
lượng dữ liệu. Lý thuyết về các phụ thuộc dữ liệu đóng vai trò quan trọng trong việc
mô tả thế giới thực, phản ánh ngữ nghĩa dữ liệu trong cơ sở dữ liệu. Phụ thuộc dữ
liệu được Codd, tác giả của mô hình dữ liệu quan hệ đặt nền móng từ những năm 70
với khái niệm phụ thuộc hàm. Sau đó một loạt tác giả khác tiếp tục phát triển các
dạng phụ thuộc bậc cao, phụ thuộc mờ cũng như xây dựng các hệ tiên đề cho các
lớp phụ thuộc - tức là đặt cơ sở lý thuyết về phụ thuộc dữ liệu.
Một điều khá tự nhiên là ngay từ những ngày đầu phát triển lý thuyết thiết kế
cơ sở dữ liệu, logic đã được chọn như một ngôn ngữ hữu hiệu để đặc tả phụ thuộc
dữ liệu, do đó, trong số các loại hình phụ thuộc dữ liệu rất đa dạng được đề xuất và
phát triển sau này, các phụ thuộc logic luôn luôn là trọng tâm chú ý của các nhóm
nghiên cứu.
Đề tài này tập trung vào tìm hiểu và nghiên cứu khái niệm chuyển dịch lược
đồ quan hệ, đưa chúng về dạng thu gọn và nhận được các biểu diễn quan trọng cho
bao đóng, khóa và phản khoá. Các kết quả thu được sử dụng trong quá trình thiết kế
các cơ sở dữ liệu.
65 trang |
Chia sẻ: nhungnt | Lượt xem: 2139 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Đề tài Ứng dụng phép dịch chuyển lược đồ quan hệ trong cơ sở dữ liệu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
ĐẠI HỌC THÁI NGUYÊN
KHOA CÔNG NGHỆ THÔNG TIN
___________________________________
VŨ TR Í DŨNG
ỨNG DỤNG PHÉP DỊCH CHUYỂN
LƯỢC ĐỒ QUAN HỆ TRONG CƠ SỞ DỮ LIỆU
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Thái Nguyên - 2009
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
ĐẠI HỌC THÁI NGUYÊN
KHOA CÔNG NGHỆ THÔNG TIN
____________________________
VŨ TRÍ DŨNG
ỨNG DỤNG PHÉP DỊCH CHUYỂN
LƯỢC ĐỒ QUAN HỆ TRONG CƠ SỞ DỮ LIỆU
CHUYÊN NGÀNH : KHOA HỌC MÁY TÍNH
MÃ SỐ : 60 48 35 01
LUẬN VĂN THẠC SỸ CÔNG NGHỆ THÔNG TIN
Người hướng dẫn khoa học
PGS. TSKH. NGUYỄN XUÂN HUY
T hái Nguyê n - 2009
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
MỤC LỤC
LỜI NÓI ĐẦU 1
CHƢƠNG 1. TỔNG QUAN VỀ ĐỀ TÀI VÀ CÁC KHÁI NIỆM CƠ SỞ 4
1.1. TỔNG QUAN VỀ ĐỀ TÀI 4
1.1.1. Giới thiệu đề tài. 4
1.1.2. Nội dung của đề tài, các vấn đề cần giải quyết. 4
1.1.3. Phƣơng pháp nghiên cứu. 5
1.1.4. Phạm vi ứng dụng. 5
1.1.5. Kết quả đạt đƣợc. 5
1.2. CÁC KHÁI NIỆM CƠ SỞ 6
1.2.1. Quan hệ, thuộc tính, bộ. 7
1.2.2. Đại số quan hệ. 10
1.2.3. Phụ thuộc hàm, Hệ tiên đề Armstrong, Lƣợc đồ quan hệ. 13
1.2.4. Bao đóng của tập thuộc tính. 18
1.2.5. Phủ của tập phụ thuộc hàm 21
1.2.6. Khóa của lƣợc đồ quan hệ. 27
1.2.7. Chuẩn hoá LĐQH trên cơ sở phụ thuộc hàm. 31
CHƢƠNG 2. PHÉP DỊCH CHUYỂN LƢỢC ĐỒ QUAN HỆ 36
2.1. Phép dịch chuyển LĐQH. 37
2.2. Thuật toán dịch chuyển LĐQH. 38
2.3. Định lý cơ bản của phép dịch chuyển LĐQH. 39
2.4. Dạng biểu diễn thứ nhất của khóa 43
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
2.5. Dạng biểu diễn thứ hai của khóa 45
2.6. Kết luận 50
CHƢƠNG 3. CÀI ĐẶT CHƢƠNG TRÌNH 51
3.1. Giới thiệu. 51
3.2. Các chức năng của chƣơng trình. 51
3.3. Một số giao diện của chƣơng trình. 52
3.4. Các thí dụ. 54
DANH MỤC BÀI BÁO, CÔNG TRÌNH NCKH 57
KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 58
TÀI LIỆU THAM KHẢO 60
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
DANH MỤC CÁC KÝ HIỆU, VIẾT TẮT
1NF 1
st
normal form - dạng chuẩn 1
2NF 2
nd
normal form - dạng chuẩn 2
3NF 3
rd
normal form - dạng chuẩn 3
CSDL Cơ sở dữ liệu
LĐQH Lƣợc đồ quan hệ
PTH phụ thuộc hàm
FD phụ thuộc hàm
╞ suy dẫn theo tiên đề (theo logic)
├ suy dẫn theo quan hệ
khác
với mọi
thuộc
là con
chứa
giao (của 2 tập thuộc tính)
hợp (của 2 tập thuộc tính)
X
+
bao đóng của tập thuộc tính X
tƣơng đƣơng
≢ không tƣơng đƣơng
\ phép trừ logic
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
_______________________________________________________
Vũ Trí Dũng, Luận văn Thạc sĩ Công nghệ thông tin, Trang 1
LỜI NÓI ĐẦU
Trong quản lý các cơ sở dữ liệu (CSDL), phụ thuộc dữ liệu được hiểu là
những mệnh đề mô tả các ràng buộc mà dữ liệu phải đáp ứng trong thực tế. Nhờ có
những mô tả phụ thuộc này mà hệ quản trị cơ sở dữ liệu có thể quản lý tốt được chất
lượng dữ liệu. Lý thuyết về các phụ thuộc dữ liệu đóng vai trò quan trọng trong việc
mô tả thế giới thực, phản ánh ngữ nghĩa dữ liệu trong cơ sở dữ liệu. Phụ thuộc dữ
liệu được Codd, tác giả của mô hình dữ liệu quan hệ đặt nền móng từ những năm 70
với khái niệm phụ thuộc hàm. Sau đó một loạt tác giả khác tiếp tục phát triển các
dạng phụ thuộc bậc cao, phụ thuộc mờ cũng như xây dựng các hệ tiên đề cho các
lớp phụ thuộc - tức là đặt cơ sở lý thuyết về phụ thuộc dữ liệu.
Một điều khá tự nhiên là ngay từ những ngày đầu phát triển lý thuyết thiết kế
cơ sở dữ liệu, logic đã được chọn như một ngôn ngữ hữu hiệu để đặc tả phụ thuộc
dữ liệu, do đó, trong số các loại hình phụ thuộc dữ liệu rất đa dạng được đề xuất và
phát triển sau này, các phụ thuộc logic luôn luôn là trọng tâm chú ý của các nhóm
nghiên cứu.
Đề tài này tập trung vào tìm hiểu và nghiên cứu khái niệm chuyển dịch lược
đồ quan hệ, đưa chúng về dạng thu gọn và nhận được các biểu diễn quan trọng cho
bao đóng, khóa và phản khoá. Các kết quả thu được sử dụng trong quá trình thiết kế
các cơ sở dữ liệu.
Nội dung đề tài được cấu trúc như sau:
Chương 1 giới thiệu về đề tài và các khái niệm chung về mô hình quan hệ với
trọng tâm là các khái niệm hình thức của mô hình quan hệ, trong đó vận dụng chủ
yếu các cấu trúc rời rạc. Phụ thuộc hàm (PTH) là lớp phụ thuộc đầu tiên của phụ
thuộc logic và đồng thời cũng là lớp phụ thuộc kinh điển theo nghĩa, được Codd, tác
giả của mô hình dữ liệu quan hệ, đề xuất sớm nhất và được sử dụng như một công
cụ thiết kế các cơ sở dữ liệu chuẩn hóa.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
_______________________________________________________
Vũ Trí Dũng, Luận văn Thạc sĩ Công nghệ thông tin, Trang 2
Chương 2 trình bày một kỹ thuật thu gọn lược đồ quan hệ (LĐQH) được gọi
là phép dịch chuyển lược đồ quan hệ. Bản chất của kỹ thuật này là loại bỏ khỏi
LĐQH ban đầu một số thuộc tính không quan trọng theo nghĩa chúng không làm
ảnh hưởng đến kết quả tính toán các đối tượng đang được quan tâm như bao đóng,
khóa, phản khóa... Mặc dù LĐQH thu được qua phép dịch chuyển không tương
đương với LĐQH ban đầu, nhưng ta có thể thu được các đối tượng cần tìm bằng
những phép toán đơn giản như loại bỏ hoặc thêm một số thuộc tính. Điều lý thú là
sau khi loại bỏ một số thuộc tính thì một số PTH sẽ được loại bỏ theo vì chúng trở
thành các PTH tầm thường (có vế trái chứa về phải) hoặc mang thông tin tiền định
(đó là các PTH dạng X). Các phép dịch chuyển LĐQH được phát triển cho lớp
các phụ thuộc logic đầu tiên là phụ thuộc hàm cho ta một số kết quả lý thú về biểu
diễn bao đóng, khóa, phản khóa cùng một số dấu hiệu cần và đủ để nhận biết các
đặc trưng tương quan giữa các đối tượng nói trên.
Chương 3 cài đặt chương trình mô phỏng ứng dụng phép dịch chuyển lược
đồ quan hệ vào thiết kế cơ sở dữ liệu cùng với một số thí dụ.
Phần cuối của luận văn là kết luận và hướng phát triển và các tài liệu tham
khảo.
Em xin bày tỏ lòng chân thành cảm ơn PGS TSKH Nguyễn Xuân Huy -
người Thầy đã tận tình hướng dẫn, giúp đỡ em hoàn thành luận văn này.
Em xin chân thành cảm ơn Khoa Công nghệ thông tin - Đại học Thái Ngyên
đã tạo điều kiện về tinh thần cũng như cơ sở vật chất để em được học tập, nâng cao
kiến thức và thực hiện luận văn tốt nghiệp.
Em xin chân thành cảm ơn các Thầy, Cô giáo ở Viện Công nghệ thông tin -
Viện Khoa học và Công nghệ Việt Nam, các Thầy, Cô giáo ở Khoa Công nghệ
thông tin - Đại học Thái Nguyên đã nhiệt tình giảng dạy, hướng dẫn và cung cấp
cho em những kiến thức vô cùng quí báu, để em có điều kiện nâng cao kiến thức và
hiểu biết của mình trong lĩnh vực công nghệ thông tin.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
_______________________________________________________
Vũ Trí Dũng, Luận văn Thạc sĩ Công nghệ thông tin, Trang 3
Em cũng xin chân thành cảm ơn Ban lãnh đạo Liên đoàn Lao động tỉnh Hà
Nam, Ban giám hiệu Trường trung cấp nghề Kinh tế - Kỹ thuật Hà Nam, gia đình,
người thân và bạn bè đã tạo điều kiện thuận lợi, động viên và giúp đỡ em trong suốt
thời gian học tập, nghiên cứu và làm luận văn tốt nghiệp.
Học viên
Vũ Trí Dũng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
_______________________________________________________
Vũ Trí Dũng, Luận văn Thạc sĩ Công nghệ thông tin, Trang 4
CHƯƠNG 1
TỔNG QUAN VỀ ĐỀ TÀI VÀ CÁC KHÁI NIỆM CƠ SỞ
1.1. TỔNG QUAN VỀ ĐỀ TÀI
1.1.1. Giới thiệu đề tài
Trong quản lý các cơ sở dữ liệu lớn và phức tạp đòi hỏi nhiều thuật toán hữu
hiệu để tính toán các đối tượng như bao đóng, khóa, phủ... Một số thuật toán tốt
theo nghĩa độ phức tạp tính toán giới hạn ở các hàm tuyến tính hoặc đa thức theo
chiều dài dữ liệu vào đã được công bố như thuật toán tính bao đóng của tập thuộc
tính, thuật toán tìm một khóa, thuật toán xác định thành viên hay thuật toán xác định
phụ thuộc hàm suy dẫn, thuật toán tìm giao các khóa, thuật toán xác định một lược
đồ quan hệ có một khóa duy nhất… [1, 2, 8].
Một nhận xét tự nhiên là nếu kích thước của lược đồ quan hệ càng nhỏ thì
các thuật toán càng phát huy hiệu quả hơn. Một số hướng nghiên cứu tinh giản các
lược đồ cơ sở dữ liệu được thực hiện thông qua các phép biến đổi tương đương,
chẳng hạn đưa tập phụ thuộc hàm về dạng thu gọn hoặc thu gọn tự nhiên, dạng
không dư, dạng tối ưu (chứa ít ký hiệu nhất)… đã được công bố [3, 5, 6, 7].
Trong phép dịch chuyển lược đồ quan hệ. Bản chất của kỹ thuật này là loại
bỏ khỏi lược đồ quan hệ ban đầu một số thuộc tính không quan trọng theo nghĩa
chúng không làm ảnh hưởng đến kết quả tính toán các đối tượng đang quan tâm như
bao đóng, khóa,... Mặc dù lược đồ quan hệ thu được qua phép thu gọn không tương
đương với lược đồ quan hệ ban đầu, nhưng ta có thể thu được các đối tượng cần tìm
bằng những phép toán đơn giản như loại bỏ hoặc thêm một số thuộc tính. Điều lý
thú là sau khi loại bỏ một số thuộc tính thì một số phụ thuộc hàm sẽ được loại bỏ
theo, vì chúng trở thành các phụ thuộc hàm tầm thường (có vế trái chứa về phải)
hoặc mang thông tin tiền định (đó là các phụ thuộc hàm dạng X).
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
_______________________________________________________
Vũ Trí Dũng, Luận văn Thạc sĩ Công nghệ thông tin, Trang 5
1.1.2. Nội dung của đề tài, các vấn đề cần giải quyết
Luận văn tập trung tìm hiểu và cải tiến các kỹ thuật và thuật toán thu gọn
lược đồ quan hệ p thông qua phép dịch chuyển lược đồ quan hệ theo một tập thuộc
tính X. Khảo sát sự phụ thuộc của phép dịch chuyển thông qua các tính chất của tập
thuộc tính X. Khảo sát hai dạng biểu diễn khóa của lược đồ quan hệ qua phép dịch
chuyển. Xây dựng một hệ trình minh họa và đánh giá các kết quả lý thuyết.
1.1.3. Phương pháp nghiên cứu
1. Tiếp cận chủ yếu để giải quyết các vấn đề đặt ra trong phạm vi đề tài là tiên
đề hóa. Các hệ tiên đề được xây dựng trên cơ sở một hệ suy dẫn hình thức
với các tính chất cơ bản về các đối tượng cơ sở và các mối liên hệ giữa
chúng. Cơ sở toán học của các hệ tiên đề là định lý về tính xác đáng và đầy
đủ cùng với các định lý về điều kiện cần và đủ cho các hệ tiên đề tương
đương.
2. Tiếp cận hình thức vận dụng chủ yếu các phương pháp và các cấu trúc của
toán học rời rạc (bao gồm cả logic hình thức), kết hợp với các phương pháp
đối sánh, mô hình hóa, tối ưu và quy hoạch rời rạc.
3. Kết hợp chặt chẽ giữa lý thuyết và thực hành, sử dụng và phát triển các phần
mềm nói chung và các phần mềm toán học nói riêng để kiểm định và thể
hiện các kết quả lý thuyết.
1.1.4. Phạm vi ứng dụng
Các kết quả thu được có thể vận dụng cho các quy trình thiết kế các cơ sở dữ
liệu quan hệ dùng trong các hệ thống thông tin, cụ thể là:
- Tính bao đóng của các tập thuộc tính,
- Tìm khóa của các lược đồ quan hệ.
- Chuẩn hoá LĐQH
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
_______________________________________________________
Vũ Trí Dũng, Luận văn Thạc sĩ Công nghệ thông tin, Trang 6
1.1.5. Kết quả đạt được
Về lý thuyết, luận văn tập trung vào các kết quả sau đây:
- Khái niệm về phép dịch chuyển lược đồ quan hệ,
- Phát biểu và chứng minh công thức tính bao đóng qua phép dịch chuyển
lược đồ quan hệ,
- Phát biểu và chứng minh kết quả về dạng biểu diễn khóa thứ nhất,
- Phát biểu và chứng minh kết quả về dạng biểu diễn khóa thứ hai,
- Phân tích thuật toán tìm khóa, phát triển thuật toán tìm tất cả các khoá
Về thực hành luận văn sẽ cài đặt các kết quả lý thuyết dưới dạng chương
trình bao gồm các chức năng sau:
Nạp và cập nhật dữ liệu: thuộc tính và các phụ thuộc hàm.
Tính bao đóng
Tìm các khóa của lược đồ quan hệ.
Chuẩn hoá LĐQH
1.2. CÁC KHÁI NIỆM CƠ SỞ
Trong các mô hình dữ liệu thì mô hình dữ liệu quan hệ được sử dụng rộng rãi
hơn cả do tính trực quan, kiến trúc đơn giản và có cơ sở toán học chặt chẽ. Ngoài ra,
người ta đã chứng minh được sự tương đương và cung cấp các phép chuyển đổi
giữa mô hình dữ liệu quan hệ với mô hình mạng và phân cấp. Một cách giải thích
rất trực quan cho mô hình dữ liệu quan hệ là các dữ liệu của bài toán quản lý được
tổ chức theo hàng và cột, cột biểu thị thuộc tính thông tin cần quản lý của một đối
tượng, thuộc tính này còn gọi là tiêu đề cột và các giá trị trong cột đó có cùng một
kiểu. Tập hợp tất cả các giá trị thuộc tính trên một hàng (gọi là bộ) là dữ liệu về một
đối tượng đang quản lý.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
_______________________________________________________
Vũ Trí Dũng, Luận văn Thạc sĩ Công nghệ thông tin, Trang 7
Mục này trình bày một số khái niệm mở đầu về mô hình quan hệ. Trọng tâm
được tập trung vào các khái niệm hình thức của mô hình quan hệ, trong đó vận dụng
chủ yếu các cấu trúc rời rạc. Phần đầu tiên của mục này giới thiệu định nghĩa về
quan hệ, thuộc tính và bộ. Phần thứ hai giới thiệu về đại số quan hệ như một ngôn
ngữ truy nhập dữ liệu trong các cơ sở dữ liệu quan hệ. Phần thứ ba mô tả phụ thuộc
hàm như một công cụ toán học trợ giúp cho việc biểu đạt ngữ nghĩa dữ liệu và đảm
bảo tính nhất quán của dữ liệu trong cơ sở dữ liệu, phụ thuộc hàm là lớp phụ thuộc
đầu tiên của phụ thuộc logic và đồng thời cũng là lớp phụ thuộc kinh điển theo
nghĩa, được Codd, tác giả của mô hình dữ liệu quan hệ đề xuất sớm nhất và được sử
dụng như một công cụ thiết kế các cơ sở dữ liệu chuẩn hóa. Các tính chất của phụ
thuộc hàm và các hệ tiên đề cho phụ thuộc hàm được mô tả đầy đủ, trong đó hệ tiên
đề Armstrong được sử dụng nhiều hơn cả. Một trong những khái niệm quan trọng
của phụ thuộc hàm là bao đóng của tập thuộc tính và các tính chất cơ bản của phép
toán lấy bao đóng được trình bày trong phần thứ tư của mục này. Phần thứ năm giới
thiệu các loại phủ quan trọng nhất, đóng vai trò thu gọn các tập phụ thuộc hàm, tạo
thuận tiện cho tối ưu hóa các thao tác ngữ nghĩa. Hai khái niệm chủ chốt liên quan
đến phụ thuộc hàm là khóa và các dạng chuẩn của lược đồ quan hệ được trình bày
trong hai phần cuối, phần thứ sáu và thứ bảy của mục.
1.2.1. Quan hệ, thuộc tính, bộ
Địn h n g h ĩ a
Cho tập hữu hạn U = {A1, A2 , ... , An} khác rỗng (n 1). Các phần tử của U
được gọi là thuộc tính. Ứng với mỗi thuộc tính AiU, i = 1,2,...,n có một tập
chứa ít nhất hai phần tử dom(Ai) được gọi là miền trị của thuộc tính Ai. Gọi D
là hợp của các dom(Ai), i = 1,2,...,n. Một quan hệ R với các thuộc tính U, ký
hiệu là R(U), là một tập các ánh xạ t: UD sao cho với mỗi AiU ta có
t(Ai)dom(Ai). Mỗi ánh xạ được gọi là một bộ của quan hệ R.
Mỗi quan hệ R(U) có hình ảnh là một bảng, mỗi cột ứng với một thuộc tính,
mỗi dòng là một bộ.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
_______________________________________________________
Vũ Trí Dũng, Luận văn Thạc sĩ Công nghệ thông tin, Trang 8
Ta ký hiệu t(U) là một bộ trên tập thuộc tính U.
Một quan hệ rỗng, ký hiệu , là quan hệ không chứa bộ nào.
Vì mỗi quan hệ là một tập các bộ nên trong quan hệ không có hai bộ trùng lặp.
Các ký hiệu và một số quy ước
Theo truyền thống của lý thuyết cơ sở dữ liệu chúng ta chấp nhận các quy
định sau đây:
Các thuộc tính được ký hiệu bằng các chữ LATIN HOA đầu bảng chữ A, B, C,...
Tập thuộc tính được ký hiệu bằng các chữ LATIN HOA cuối bảng chữ X, Y,
Z,...
Các phần tử trong một tập thường được liệt kê như một xâu ký tự, không có
các ký hiệu biểu diễn tập, chẳng hạn ta viết X = ABC thay vì viết
X = A, B, C. XY biểu diễn hợp của hai tập X và Y, X Y. Phép trừ hai tập X
và Y được ký hiệu là X\Y, hoặc X-Y.
Một phân hoạch của tập M (thành các tập con rời nhau và có hợp là M), X1,
X2, ..., Xm được ký hiệu là
M = X1 | X2 |... | Xm
với ý nghĩa M = X1 X2 ... Xm và Xi Xj = , 1 i, j m, i j.
Các bộ được biểu diễn bằng các chữ Latin thường có thể kèm chỉ số, thí dụ t,
u, v, t1 ...
Với mỗi bộ t trong quan hệ R(U) và mỗi tập con các thuộc tính X U ta ký
hiệu t[X] hoặc t.X là hạn chế của bộ (ánh xạ) t trên tập thuộc tính X.
Ta chấp nhận quy ước tự nhiên là miền trị của mọi thuộc tính chứa ít nhất hai
phần tử. Trong trường hợp một miền trị của thuộc tính chỉ chứa một giá trị
duy nhất thì ta có thể loại bỏ cột tương ứng của thuộc tính đó trong quan hệ.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
_______________________________________________________
Vũ Trí Dũng, Luận văn Thạc sĩ Công nghệ thông tin, Trang 9
Ta chấp nhận quy ước sau đây: Mọi cặp bộ t và v trong mọi quan hệ giống
nhau trên miền rỗng các thuộc tính, t. = v..
Hàm Attr(R) cho tập thuộc tính của quan hệ R.
Hàm Card(R) cho lực lượng (số bộ) của quan hệ R.
Trong trường hợp tập thuộc tính U đã cho trước ta có thể viết đơn giản R thay
cho R(U).
Ký hiệu REL(U) là tập toàn thể các quan hệ trên tập thuộc tính U, REL_p(U)
là tập toàn thể các quan hệ có không qúa p bộ trên tập thuộc tính U, p 1.
Hai quan hệ R và S được gọi là tương thích nếu chúng có cùng một tập thuộc
tính, tức là nếu Attr(R) = Attr(S).
Với mỗi bộ t trong quan hệ R(U) và mỗi bộ v trong quan hệ S(V) ta ký hiệu tv
là phép dán hai bộ t và v. tv cho ta bộ r trên tập thuộc tính UV thoả điều
kiện: r.U = t và r.V = v.
Với mỗi bộ t trong quan hệ R(U) và với mỗi quan hệ S(V) ta ký hiệu tS là
phép dán bộ t với quan hệ S. tS cho ta quan hệ P(UV) = { tv | vS }.
Th í d ụ
Cho U = ABC, V = BD, t(U) = (a,b,c), v(V) = (b,d). Ta có r(UV) = t * v =
(a,b,c,d) là một bộ trên tập thuộc tính UV = ABCD.
Cho thêm quan hệ S(BD)
Khi đó t*S cho ta quan hệ P(ABCD) sau đây
S (B D)
b d
x d
b e
P (A B C D)
a b c d
a b c e
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
_______________________________________________________
Vũ Trí Dũng, Luận văn Thạc sĩ Công nghệ thông tin, Trang 10
1.2.2. Đại số quan hệ
Đại số quan hệ được xây dựng trên tập các quan hệ với các phép toán cơ sở là
chọn, chiếu, kết nối tự nhiên, chia, hợp, giao và trừ. Mục này sử dụng các ký
pháp theo tài liệu [7].
Phép chọn (phép lọc)
Địn h n g h ĩ a
Cho quan hệ R(U) và biểu thức điều kiện (còn gọi là biểu thức lọc hay biểu
thức chọn) e. Phép chọn trên quan hệ R theo điều kiện e, ký hiệu R(e) cho ta
quan hệ:
P(U) = R(e) = { t R | Sat(t, e) }
trong đó hàm logic Sat(t, e) kiểm tra bộ t thoả điều kiện e được xác định theo
hai bước sau:
1) Thay mọi xuất hiện của mỗi thuộc tính A trong biểu thức chọn e bằng trị
tương ứng của A trong bộ t, t.A, ta thu được một mệnh đề logic b.
2) Tính trị của b. Nếu là đúng (True) thì bộ t thoả điều kiện e; ngược lại, nếu
trị của b là sai (False) thì bộ t không thoả điều kiện e.
Trong các biểu thức chọn ta sử dụng ký hiệu cho các phép toán logic như sau:
Hội: Tuyển: Phủ định: ¬, Kéo theo:
Phép chiếu
Địn h n g h ĩ a
Phép chiếu quan hệ R(U) trên tập con thuộc tính X U, ký hiệu R[X], cho ta
quan hệ
P(X) = R[X] = { t.X | tR }
R[X] được tính theo 2 bước như sau:
(i) Xoá các cột không thuộc X của bảng R,
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
_______________________________________________________
Vũ Trí Dũng, Luận văn Thạc sĩ Công nghệ thông tin, Trang 11
(ii) Lược bớt các dòng giống nhau trong bảng kết quả: chỉ giữ lại một
dòng trong số các dòng giống nhau.
Phép kết nối tự nhiên
Địn h n g h ĩ a
Cho hai quan hệ R(U) và S(V). Đặt M = UV. Phép kết nối (tự nhiên) hai quan
hệ R(U) và S(V), ký hiệu RS, cho ta quan hệ chứa các bộ được dán từ các bộ
u của quan hệ R với mỗi bộ v của quan hệ S (sao cho các trị trên miền thuộc
tính chung M của hai bộ này giống nhau).
P(UV) = R S ={ uv | uR, vS, u.M = v.M }
Nếu M = UV = , R S sẽ cho ta tích Descartes, trong đó mỗi bộ của quan
hệ R sẽ được ghép với mọi bộ của quan hệ S.
Phép cộng (hợp)
Địn h n g h ĩ a
Phép hợp (theo lý thuyết tập hợp hoặc nối dọc) hai quan hệ tương thích R(U)
và S(U), ký hiệu RS, hoặc R+S, cho ta quan hệ chứa các bộ của mỗi quan hệ
thành phần,
P(U) = R S = { t | tR tS }
Phép trừ