Đồ án Sử dụng tri thức trong cơ sở dữ liệu

1. Mô hình dữ liệu và tính toàn vẹn 1.1. Mô hình dữ liệu 1.2. Mô hình dữ liệu quan hệ 1.3. Hệ quản trị cơ sở dữ liệu 2. Tính toàn vẹn dữ liệu 2.1. Giới thiệu về tri thức 2.2. Giới thiệu về tính toàn vẹn 2.3. Phụ thuộc hàm 3. Thử nghiệm 3.1. Tìm hiểu về VISUAL BASIC 3.2. Tìm hiểu về SQL SERVER 3.3. Xây dựng chương trình trên cơ sở dữ liệu văn hóa 4. Kết luận

ppt16 trang | Chia sẻ: nhungnt | Lượt xem: 2219 | Lượt tải: 2download
Bạn đang xem nội dung tài liệu Đồ án Sử dụng tri thức trong cơ sở dữ liệu, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC DÂN LẬP HẢI PHÒNG KHOA CÔNG NGHỆ THÔNG TIN ĐỒ ÁN TỐT NGHIỆP ĐỀ TÀI SỬ DỤNG TRI THỨC TRONG CƠ SỞ DỮ LIỆU Giáo viên hướng dẫn : PGS.TS. ĐỖ TRUNG TUẤN Sinh viên : ĐỖ THỊ PHƯƠNG NGÂN Lớp CT 701 1. Mô hình dữ liệu và tính toàn vẹn 1.1. Mô hình dữ liệu 1.2. Mô hình dữ liệu quan hệ 1.3. Hệ quản trị cơ sở dữ liệu 2. Tính toàn vẹn dữ liệu 2.1. Giới thiệu về tri thức 2.2. Giới thiệu về tính toàn vẹn 2.3. Phụ thuộc hàm 3. Thử nghiệm 3.1. Tìm hiểu về VISUAL BASIC 3.2. Tìm hiểu về SQL SERVER 3.3. Xây dựng chương trình trên cơ sở dữ liệu văn hóa 4. Kết luận NỘI DUNG BÁO CÁO 1. Mô hình dữ liệu: - Là tập các khái niệm dùng để mô tả dữ liệu và các phép toán xử lí dữ liệu - Dùng cho việc miêu tả đối tượng phức tạp, có cấu trúc phức tạp - Chia thành 3 mức: mức trong, mức khái niệm và mức ngoài 2. Mô hình dữ liệu quan hệ: - Được E.F.Codd đề xuất năm 1970 - Bao gồm: + Một hệ thống các ký hiệu để mô tả dữ liệu dưới dạng dòng và cột như quan hệ, bộ, thuộc tính, khoá chính, khoá ngoài,… + Một tập hợp các phép toán thao tác trên dữ liệu như phép toán tập hợp, phép toán quan hệ. + Ràng buộc toàn vẹn quan hệ. MÔ HÌNH DỮ LIỆU VÀ TÍNH TOÀN VẸN 1. Định nghĩa: Là một phần mềm hệ thống cho phép: - Định nghĩa – khai báo bộ khung dữ liệu cùng với các mô tả chi tiết về dữ liệu. - Xây dựng – lưu trữ dữ liệu lên bộ nhớ phụ. - Xử lí – truy vấn, cập nhật và phát sinh báo cáo. - Bảo trì cơ sở dữ liệu và cung cấp các tiến trình điều khiển cơ sở dữ liệu. 2. Mục đích: - Độc lập vật lí - Độc lập logic - Xử lí dữ liệu nhờ các ngôn ngữ phi thủ tục - Khả năng quản trị dữ liệu - Dư thừa dữ liệu - Tương hợp dữ liệu - Dùng chung các dữ liệu - An toàn dữ liệu HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU 3. Các chức năng: - Mô tả dữ liệu. - Tìm kiếm dữ liệu đã lưu trữ. - Cập nhật dữ liệu: thêm, bớt, sửa đổi dữ liệu. - Chuyển hoá dữ liệu giữa các mức lược đồ. - Điều khiển tính an toàn và toàn vẹn dữ liệu. - Quản lí dữ liệu ở mức thấp: các giao tác xử lí dữ liệu. 4. Thành phần: - Giao diện dữ liệu. - Giao diện người sử dụng. - Giao diện người lập trình. HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU TRI THỨC 1. Tri thức: - Là sản phẩm của sự nhận thức và kinh nghiệm của loài người. - Phụ thuộc vào ngữ cảnh, tri thức là tài sản của các cá nhân hoặc tập thể. - Có thể được cung cấp dưới dạng các thủ tục, các quá trình tích hợp, được nhúng trong ngôn ngữ, các câu truyện kể lại, các khái niệm, các luật và các công cụ. - Tăng cường cho các quá trình tạo ra quyết định hành động. 2. Các dạng tri thức: - Tri thức thủ tục - Tri thức mô tả - Tri thức meta - Tri thức may rủi - Tri thức cấu trúc TÍNH TOÀN VẸN 1. Khoá của quan hệ: - Khoá chính: Là một thuộc tính, hay tập các thuộc tính, cho phép xác định duy nhất mỗi dòng của bảng quan hệ. - Khoá ngoài: Là thuộc tính hay tập các thuộc tính từ một hay nhiều bảng và là khoá chính của một trong số các bảng này. 2. Ràng buộc toàn vẹn: - Định nghĩa: Ràng buộc toàn vẹn là một đặc tả mà một cơ sở dữ liệu phải thỏa mãn để giữ được tính đúng đắn của nó. - Các yếu tố: điều kiện, bối cảnh và phạm vi ảnh hưởng. - Phân loại: + Ràng buộc toàn vẹn trên phạm vi một quan hệ, gồm: RBTV miền giá trị, RBTV liên thuộc tính, RBTV liên bộ. + Ràng buộc toàn vẹn trên phạm vi nhiều quan hệ bao gồm: RBTV phụ thuộc tồn tại, RBTV liên bộ - liên quan hệ, RBTV liên thuộc tính - liên quan hệ. 1. Tính toàn vẹn dữ liệu: - Nhằm đảm bảo độ tin cậy của dữ liệu trong bảng. - Liên quan đến các ràng buộc đối với dữ liệu trong cơ sở dữ liệu. 2. Phân loại toàn vẹn dữ liệu : - Toàn vẹn thực thể - Toàn vẹn về miền - Toàn tham chiếu - Toàn vẹn người dùng định nghĩa. 3. Điều kiện toàn vẹn: - Điều kiện toàn vẹn trên một thuộc tính. - Điều kiện toàn vẹn trên nhiều thuộc tính. - Điều kiện về tính duy nhất. TÍNH TOÀN VẸN 1. Định nghĩa: Giả sử R{A1, A2,…, An } là lược đồ quan hệ, X, Y là hai tập con của {Ai­}. Người ta nói rằng X → Y (Ta nói X xác định Y hay Y phụ thuộc hàm vào X) nếu với mọi r của R, n_bộ t1, t2 của r có: Nếu t1.X = t2.X thì t1.Y = t2.Y 2. Tính chất: Có các tập X, Y, Z, W là tập con của tập các thuộc tính {A}. - Tính chất 1: Phản xạ: Nếu X Y thì X→Y - Tính chất 2: Tăng: {X→Y} |= XZ→YZ - Tính chất 3: Bắc cầu: Cho X  Y, Y  Z  X  Z Từ 3 tính chất trên có thể suy diễn ra các tính chất: - Tính chất 4: Hợp: Cho X  Y, X  Z  X  YZ - Tính chất 5: Giả bắc cầu: Cho X  Y, YZ  W  XZ  W - Tính chất 6: Phân rã: Cho X  YZ  X  Y 3. Các loại phụ thuộc hàm: - Các phụ thuộc hàm sơ cấp - Phụ thuộc hàm trực tiếp - Phụ thuộc hàm chính quy TÍNH TOÀN VẸN Định nghĩa: Visual Basic (VB) là một phần của bộ công cụ phát triển phần mềm Visual Studio, sản phẩm của hãng MicroSoft. VB dùng để xây dựng các chương trình các ứng dụng chạy trong môi trường Window, với giao diện đồ hoạ vẫn thấy trên Window rất quen thuộc với người dùng. 2. Đặc điểm: - VB là một công cụ trực quan - Phần giao diện của một chương trình VB cấu thành từ các thành phần điều khiển – gọi là các Control - quen thuộc. - Phần mã lệnh gắn với các điều khiển để thực hiện các tính toán xử lí gồm những câu lệnh - Tích hợp kèm theo nhiều công cụ hỗ trợ để viết mã lệnh, sửa lỗi chính tả, sửa lỗi logic ... - Khả năng kết hợp các thư viện liên kết động DLL. - Tiện lợi, dễ sử dụng, tiết kiệm thời gian và công sức so với các ngôn ngữ lập trình khác khi xây dựng cùng một ứng dụng. VISUAL BASIC SQL SERVER 1. Định nghĩa: SQL Server 2000 là một hệ thống quản lý cơ sở dữ liệu quan hệ sử dụng Transact-SQL để trao đổi dữ liệu giữa máy khách và máy chủ SQL. 2. Đặc điểm: - Là một hệ quản trị cơ sở dữ liệu quan hệ, cung cấp cách tổ chức dữ liệu bằng cách lưu chúng vào các bảng. Dữ liệu quan hệ có thể được nhóm vào các bảng và các quan hệ có thể được định nghĩa giữa các bảng với nhau. - Là một cơ sở dữ liệu có khả năng mở rộng, nghĩa là chúng có thể lưu một lượng lớn dữ liệu và hỗ trợ tính năng cho phép nhiều dùng truy cập dữ liệu đồng thời. - Cho phép người quản trị cơ sở dữ liệu truy cập server trực tiếp để thực hiện các chức năng cấu hình, quản trị và thực hiện các tác vụ bảo trì cơ sở dữ liệu 3. Công cụ để thực thi toàn vẹn dữ liệu trong SQL: - Ràng buộc thực thể: RB PRIMARY KEY, RB UNIQUE, Thuộc tính IDENTITY - Ràng buộc về miền: RB DEFAULT, RB CHECK, Thuộc tính NOT NULL, Rule - Ràng buộc tham chiếu: RB FOREIGN KEY, RB CHECK - Ràng buộc người dùng định nghĩa: Tất cả các RB trên, Stored Procedure, Trigger PHÁT BIỂU BÀI TOÁN Bài toán khai thác thông tin từ cơ sở dữ liệu về âm nhạc. Cơ sở dữ liệu này lưu trữ thông tin của các nghệ sĩ, các tác phẩm. Thông tin về nghệ sĩ bao gồm: Mã nghệ sĩ, họ tên, ngày sinh, giới tính, nơi sinh, địa chỉ, điện thoại và dòng nhạc chính của nghệ sĩ đó. Một nghệ sĩ có thể là một nhạc sĩ, một ca sĩ hay là người sáng tác lời cho một bài hát nào đó. Vì vậy một nghệ sĩ có thể sáng tác một hay nhiều bài hát, có thể biểu diễn một hay nhiều bài hát và một bài hát cũng có thể do một hay nhóm nghệ sĩ sáng tác hoặc biểu diễn. Thông tin về bài hát bao gồm: Mã tác phẩm, tên tác phẩm, thể loại và tóm tắt nội dung của bài hát đó. Khi nghệ sĩ sáng tác một bài hát thì thông tin của bài hát đó sẽ được lưu vào trong cơ sở dữ liệu cùng với thông tin về tác giả và năm sáng tác. Mỗi bài hát khi được một nghệ sĩ thể hiện thì các thông tin mà nghệ sĩ đó biểu diễn sẽ được lưu trong cơ sở dữ liệu, bao gồm thông tin về nơi biểu diễn và thời lượng mà nghệ sĩ đó thể hiện bài hát. Thông tin trong cơ sở dữ liệu phải thoả mãn tính toàn vẹn về cơ sở dữ liệu điều kiện ràng buộc do người dùng thiết lập. Các điều kiện này có thể thay đổi linh hoạt tuỳ theo yêu cầu của người sử dụng cơ sở dữ liệu. Dữ liệu đưa vào phải được tự động kiểm tra xem có thỏa mãn các điều kiện đó hay không. ĐIỀU KIỆN RÀNG BUỘC 1. Điều kiện ràng buộc về thông tin nghệ sĩ: - Tên tác giả không được vượt quá 40 kí tự và NOTNULL. - 3 < Tuổi tác giả < 120 - Giới tính: Nam / Nữ - Nơi sinh: Không dài quá 500 - Địa chỉ: Không dài quá 500 kí tự - Điện thoại: Không vượt quá 12 kí tự 2. Điều kiện ràng buộc về thông tin tác phẩm: - Tên bài hát không vượt quá 100 kí tự và NOTNULL - 2.0 phút < Thời lượng < 4.0 phút - Mô tả tóm tắt: Không vượt quá 1000 kí tự 3. Điều kiện ràng buộc khác: - Khi có thông tin về tác giả thì phải có ít nhất thông tin về một bài hát của tác giả đó. - Khi có thông tin về tác phẩm thì phải có được thông tin về tác giả sáng tác hoặc biểu diễn bài hát đó. Các điều kiện ràng buộc này được khởi tạo mặc định trong cơ sở dữ liệu, người dùng có thể kiểm soát dữ liệu nhập vào bằng cách thay đổi các điều kiện đó. EM XIN CHÂN THÀNH CẢM ƠN THẦY CÔ VÀ CÁC BẠN ĐÃ CHÚ Ý THEO DÕI !