Bài giảng chương 1 Khái niệm về cơ sở dữ liệu

1.1. Dữ liệu Dữ liệu(data): sự biểu diễn của các đối tượng và sự kiện được ghi nhận và được lưu trữ trên các phương tiện của máy tính. Dữ liệu có cấu trúc: số, ngày, chuỗi ký tự, Dữ liệu không có cấu trúc: hình ảnh, âm thanh, đoạn phim,

pdf22 trang | Chia sẻ: mamamia | Lượt xem: 1926 | Lượt tải: 2download
Bạn đang xem trước 20 trang tài liệu Bài giảng chương 1 Khái niệm về cơ sở dữ liệu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Nhập môn CSDL - Khoa CNTT1  Số tiết: 45  Tài liệu tham khảo:  Giáo trình Cơ sở dữ liệu - Nguyễn Đăng tỵ, Đỗ Phúc (Đại học QG TP Hồ Chí Minh-Trường Đại học CNTT)  Nhập môn Cơ sở dữ liệu - Nguyễn Tuệ -NXB GD  Hình thức thi: thi viết  Thời gian 60-90 phút  Kiểm tra định kì: 2 lần  Giảng viên: Đặng Thị Kim Anh  Email: kimanh060282@gmail.com 2 1. Định nghĩa cơ sở dữ liệu 3 1.1. Dữ liệu Dữ liệu (data): sự biểu diễn của các đối tượng và sự kiện được ghi nhận và được lưu trữ trên các phương tiện của máy tính. Dữ liệu có cấu trúc: số, ngày, chuỗi ký tự, … Dữ liệu không có cấu trúc: hình ảnh, âm thanh, đoạn phim, … 1. Định nghĩa cơ sở dữ liệu (TT) 4 1.2. Cơ sở dữ liệu CSDL là một hệ thống các thông tin có cấu trúc được lưu trữ trên các thiết bị lưu trữ thứ cấp (như băng từ, đĩa từ…) nhằm thỏa mãn yêu cầu khai thác thông tin đồng thời của nhiều người sử dụng hay chươngtrình ứng dụng với nhiều mục đích khác nhau Ưu điểm nổi bật của cơ sở dữ liệu: - Giảm trùng lặp thông tin xuống mức thấp nhất - Đảm bảo dữ liệu có thể được truy xuất theo nhiều cách khác nhau - Khả năng chia sẻ thông tin cho nhiều người sử dụng và nhiều ứng dụng khác nhau. 1. Định nghĩa cơ sở dữ liệu(tt) 5 1.2. Cơ sở dữ liệu Những vấn đề cần lưu ý đối với CSDL: - Tính chủ quyền của dữ liệu - Tính bảo mật và quyền khai thác thông tin của người sử dụng - Tranh chấp dữ liệu - Đảm bảo dữ liệu khi có sự cố 1. Định nghĩa cơ sở dữ liệu(tt) 6 1.3. Thông tin (information) - Thông tin là dữ liệu đã được xử lý để làm tăng sự hiểu biết của người sử dụng. - Dữ liệu trong ngữ cảnh. - Dữ liệu được tổng hợp / xử lý. 1. Định nghĩa cơ sở dữ liệu (tt) 7 Dữ liệu 50010273 NguyễnTrungTiến MT00 20 50100298 LêViệtHùng MT01 19 59900012 Trần HùngViệt MT99 21 50200542 Hồ Xuân Hương MT02 18 50000075 Bùi Đức Duy MT00 20 Thông tin: dữ liệu trong ngữ cảnh Mã sinh viên Họ và tên sinh viên Lớp Tuổi 50010273 Nguyễn Trung Tiến MT00 20 50100298 Lê Việt Hùng MT01 19 59900012 Trần Hùng Việt MT99 21 50200542 Hồ Xuân Hương MT02 18 50000075 Bùi Đức Duy MT00 20 1. Định nghĩa cơ sở dữ liệu(tt) 8 Thông tin: dữ liệu được tổng hợp / xử lý MT00 40% MT01 20% MT02 20% MT99 20% 9 Hệ thống xử lý tập tin (file processing system) Hệ thống xử lý tập tin là tập hợp các chương trình dùng để lưu trữ, thao tác và truy xuất các tập tin dữ liệu có kích thước lớn. Các tập tin dữ liệu được lưu trữ trong các thư mục (folder). 2. Hệ thống xử lý tập tin 10 2. Hệ thống xử lý tập tin  Các thành phần của hệ thống xử lý tập tin  Phần cứng: các máy tính.  Phần mềm:  Hệ điều hành  Các tiện ích  Các tập tin  Các chương trình quản lý tập tin  Các chương trình ứng dụng tạo các báo cáo từ các dữ liệu được lưu trữ trong các tập tin.  Con người: người quản lý, chuyên gia, người lập trình, người sử dụng cuối cùng.  Các thủ tục: các lệnh và các qui tắc chi phối việc thiết kế và sử dụng các thành phần của phần mềm.  Dữ liệu: tập hợp các sự kiện. 11  CSDL cá nhân (personal database) CSDL riêng.  CSDL nhóm làm việc (workgroup database) Mạng cục bộ (ít hơn 25 người sử dụng)  CSDL phòng ban (department database) Mạng cục bộ (từ 25 đến 100 người sử dụng)  CSDL xí nghiệp (enterprise database) Mạng diện rộng (hàng trăm hoặc hàng ngàn người sử dụng) 3. Các loại cơ sở dữ liệu 12 4. Hệ quản trị cơ sở dữ liệu 13 Hệ quản trị CSDL (DBMS – DataBase Management System) Hệ quản trị CSDL là tập hợp các chương trình dùng để quản lý cấu trúc và dữ liệu của CSDL và điều khiển truy xuất dữ liệu trong CSDL. Cho phép người sử dụng định nghĩa, tạo lập và bảo trì CSDL và cung cấp các truy xuất dữ liệu. 4. Hệ quản trị cơ sở dữ liệu 14 4. Hệ quản trị cơ sở dữ liệu 15 Hệ quản trị CSDL gồm các thành phần sau: - Ngôn ngữ giữa người sử dụng và CSDL:. + Ngôn ngữ mô tả dữ liệu: Cho phép khai báo cấu trúc của CSDL, khai báo mối liên hệ dữ liệu và quy tắc. + Ngôn ngữ thao tác dữ liệu: cho phép người sử dụng có thể thêm (Insert), xóa (Delete), sửa (Update) dữ liệu trong CSDL + Ngôn ngữ truy vấn dữ liệu + Ngôn ngữ kiểm soát dữ liệu: cho phép người quản trị hệ thống thay đổi cấu trúc của bảng dữ liệu, khai báo bảo mật thông tin và cấp quyền hạn khai thác CSDL cho người sử dụng. 4. Hệ quản trị cơ sở dữ liệu 16 Hệ quản trị CSDL gồm các thành phần sau: - Từ điển dữ liệu dùng để mô tả các ánh xạ liên kết, ghi nhận các thành phần cấu trúc của CSDL, các chương trình ứng dụng, mật mã, quyền hạn sử dụng - Có biện pháp bảo mật tốt khi có yêu cầu bảo mật - Cơ chế giải quyết tranh chấp dữ liệu - Hệ quản trị CSDL cũng phải có cơ chế sao lưu (backup) và phục hồi (restore) khi có sự cố. - Hệ quản trị CSDL phải cung cấp một giao diện tốt, dễ sử dụng, dễ hiểu cho những người sử dụng không chuyên. 17  Hệ thống tập tin (flat file): 1960 - 1980  Hệ CSDL phân cấp (hierarchical): 1970 - 1990  Hệ CSDL mạng (network): 1970 - 1990  Hệ CSDL quan hệ (relational): 1980 - nay  Hệ CSDL hướng đối tượng (object-oriented): 1990 - nay  Hệ CSDL đối tượng - quan hệ (object-relational): 1990 - nay  Kho dữ liệu (data warehouse): 1980 - nay  Web-enabled: 1990 - nay 5. Sự phát triển các hệ CSDL 18 6.1. Mức vật lý Đây là mức lưu trữ CSDL, vấn đề cần giải quyết là dữ liệu gì và được lưu trữ như thế nào, ở đâu (đĩa từ, băng từ track, sector…nào)? Việc truy xuất tuần tự hay ngẫu nhiên đối với từng loại dữ liệu. 6.2. Mức quan niệm Tại mức này sẽ giải quyết cho các câu hỏi CSDL cần phải lưu giữ bao nhiêu loại dữ liệu, đó là những dữ liệu gì? Mối quan hệ giữa các loại dữ liệu này như thế nào. CSDL ở mức quan niệm là sự biểu diễn trừu tượng CSDL mức vật lý hoặc ngược lại, CSDL ở mức vật lý là sự cài đặt cụ thể của CSDL mức quan niệm. 6. Các mức biểu diễn CSDL 19 6.3. Mức ngoài Đó là mức của người sử dụng và các chương trình ứng dụng. Làm việc tại mức này có các nhà chuyên môn, các kỹ sư tin học và nhưng người sử dụng không chuyên. Mỗi người sử dụng hay mỗi chương trinh ứng dụng có thể “nhìn” (view) CSDL theo một góc độ khác nhau. Có thể nhìn thấy toàn bộ hay chỉ một phần hoặc chỉ các thông tin tổng hợp từ CSDL hiện có. 6. Các mức biểu diễn CSDL 20 Sơ đồ quan niệm (hoặc mức logic) Sơ đồ Cấu trúc vật lý CSDL Môi trường thực - thế giới thực Cấu trúc ngoài 1 Cấu trúc ngoài 2 Cấu trúc ngoài n Chương trình ứng dụng n NSD1 NSD2 Được mô hình hoá thành 7. Tính độc lập giữa dữ liệu và chương trình 21  Tính độc lập dữ liệu ở mức vật lý Người quản trị CSDL có thể tổ chức lại CSDL bằng cách thay đổi cách tổ chức, cấu trúc vật lý của dữ liệu trên các thiết bị nhớ thứ cấp để làm thay đổi hiệu quả tính toán của các chương trình ứng dụng, nhưng không đòi hỏi phải viết lại chương trình ứng dụng. 7. Tính độc lập giữa dữ liệu và chương trình 22 Tính độc lập dữ liệu ở mức logic  Giữa khung nhìn với lươc đồ quan niệm cũng có thể tồn tại một loại độc lập về dữ liệu.  Trong quá trình khai thác CSDL người ta có thể nhận thấy tính cần thiết phải sửa đổi lược đồ khái niệm như bổ sung thêm thông tin hoặc xóa bớt các thông tin của các thực thể đang tồn tại trong CSDL.  Việc thay đổi lược đồ khái niệm không làm ảnh hưởng tới các lược đồ con, do đó không cần phải viết lại các chương trình ứng dụng.