BÀI 1
GIỚI THIỆU VỀ CƠ SỞ DỮ LIỆU
Mã bài: 01
Giới thiệu:
Cơ sở dữ liệu là gì và tại sao cần phải có Cơ sở dữ liệu? Cơ sở dữ liệu
(CSDL) là một hệ thống các thông tin có cấu trúc, các dữ liệu có liên quan với
nhau được lưu trữ trên các thiết bị lưu trữ nhằm thỏa mãn yêu cầu khai thác
thông tin đồng thời của nhiều người sử dụng hay nhiều chương trình ứng dụng
với mục đích khác nhau. Một cơ sở dữ liệu biểu thị một khía cạnh nào đó của
thế giới thực như hoạt động của một công ty, một nhà trường, một ngân hàng
Vì vậy Cơ sở dữ liệu rất cần thiết trong cuộc sống hiện nay.
Cơ sở dữ liệu và kỹ thuật cơ sở dữ liệu đã có ảnh hưởng rất lớn đến việc sử
dụng máy tính. Có thể nói rằng cơ sở dữ liệu đóng vai trò quan trọng trong mọi
lĩnh vực có sử dụng máy tính như giáo dục, thương mại, kỹ nghệ, khoa học, thư
viện, . Thuật ngữ cơ sở dữ liệu trở thành một thuật ngữ phổ dụng
Bài này sẽ giới thiệu một cách tổng quan về các khái niệm: cơ sở dữ
liệu, hệ quản trị cơ sở dữ liệu, hệ thống cơ sở dữ liệu và mô hình cơ sở dữ
liệu;
Mục tiêu:
- Phân biệt được hệ cơ sở dữ liệu với hệ thống tập tin cổ điển.
- Phân biệt được các mô hình dữ liệu mạng, phân cấp, quan hệ, thực thể
liên kết và mô hình hướng đối tượng.
- Nghiêm túc, tự giác trong học tập
Nội dung chính:10
1. Một số khái niệm
1.1. Cơ sở dữ liệu
1.1.1. Dẫn nhập
Lưu trữ thông tin là nhu cầu rất thông dụng trong cuộc sống của con người.
Từ thời xa xưa con người đã biết sử dụng những vật dụng có sẵn để lưu trữ
thông tin như in hình lên đá, in lên các gốc cây, thanh gỗ. Nhưng hiện nay thì
việc lưu trữ đó đã trở nên quá lỗi thời. Thay vào đó công nghệ thông tin phát
triển, mọi người đều có khả năng mua máy tính và lưu trữ thông tin trên máy
tính.
Lưu trữ dữ liệu dưới dạng hệ thống tập tin
Hình 1.1. Hệ thống tập tin dữ liệu Microsoft Office
Khi sử dụng máy tính thông thường ta sẽ lưu trữ thông tin dưới dạng file,
và mỗi file ta sẽ đặt nó trong những folder có tên khác nhau nhằm mục đích dễ
dàng tìm đến. Với cách này ta sẽ có những ưu điểm và nhược điểm như sau:
* Ưu điểm:
- Với việc lưu trữ này thì rõ ràng khi ta cần là lưu ngay nên tốc độ triển
khai sẽ nhanh
- Rõ ràng và trực quan với người không có chuyên môn công nghệ thông
tin
* Khuyết điểm:11
- Dữ liệu không nhất quán, đôi khi có trường hợp nhiều người sử dụng một
file và sẽ xảy ra hiện tượng lưu đè.
- Trùng lặp dữ liệu nhiều.
- Tính chia sẻ dữ liệu không cao (kém)
Hiện nay các cá nhân sử dụng máy tính đa số sử dụng cách lưu trữ này để
lưu trữ thông tin cho riêng mình, nên nói về sự phổ biến thì cách này phổ biến
nhất, tuy nhiên với những hệ thống dữ liệu lớn thì sẽ có rất nhiều hạn chế như
việc truy xuất tìm kiếm dữ liệu sẽ chậm, khó bảo quản,. Với những hạn chế
trên thì khái niệm cơ sở dữ liệu và hệ quản trị cơ sở dữ liệu được ra đời.
117 trang |
Chia sẻ: thanhle95 | Lượt xem: 660 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Giáo trình mô đun Cơ sở dữ liệu - Nghề: Lập trình máy tính, quản trị mạng máy tính, công nghệ thông tin, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
0
ỦY BAN NHÂN DÂN TỈNH BR – VT
TRƢỜNG CAO ĐẲNG NGHỀ
GIÁO TRÌNH
MÔ ĐUN: CƠ SỞ DỮ LIỆU
NGHỀ : DÙNG CHUNG CHO CÁC NGHỀ: LẬP TRÌNH MÁY
TÍNH, QUẢN TRỊ MẠNG MÁY TÍNH, CÔNG NGHỆ THÔNG TIN
(DÙNG CHO TRÌNH ĐỘ CAO ĐẲNG)
Ban hành kèm theo Quyết định số: /QĐ-CĐN
ngày.tháng.năm ......... ........... của Hiệu trưởng trường Cao đẳng
nghề tỉnh BR - VT
Bà Rịa – Vũng Tàu, năm 2015
1
TUYÊN BỐ BẢN QUYỀN
Tài liệu này thuộc loại sách giáo trình nên các nguồn thông tin có thể đƣợc
phép dùng nguyên bản hoặc trích dùng cho các mục đích về đào tạo và tham
khảo.
Mọi mục đích khác mang tính lệch lạc hoặc sử dụng với mục đích kinh
doanh thiếu lành mạnh sẽ bị nghiêm cấm.
2
LỜI GIỚI THIỆU
Ngày nay, cơ sở dữ liệu đã có nhiều ứng dụng trong mọi hoạt động của xã
hội. Muốn thiết kế và sử dụng cơ sở dữ liệu chúng ta phải nắm duợc các kỹ thuật
cơ bản của cơ sở dữ liệu. Giáo trình này nhằm trình bày các kỹ thuật cơ sở của
co sở dữ liệu truyền thống, dó là mô hình liên kết thực thể, mô hình co sở dữ
liệu quan hệ. Giáo trình cung trình bày cách thiết kế một co sở dữ liệu quan hệ,
cách sử dụng các phép toán dại số quan hệ dể tạo, cập nhật và truy vấn co sở dữ
liệu và khái niệm phụ thuộc hàm ứng dụng trong lí thuyết thiết kế và chuẩn hóa
cơ sở dữ liệu quan hệ.
Giáo trình “Cơ sở dữ liệu” đƣợc biên soạn nhằm cung cấp cho ngƣời học
những kiến thức cơ bản về thiết kế các cơ sở dữ liệu quan hệ.
Giáo trình đƣợc biên soạn dựa trên một số tài liệu tham khảo cập nhật, có
giá trị và với mục tiêu cung cấp các kiến thức cơ bản về Cơ sở dữ liệu cho ngƣời
học, vì vậy nội dung trình bày vẫn chƣa đƣợc đầy đủ và không tránh khỏi thiếu
sót. Tác giả rất mong nhận đƣợc các ý kiến đóng góp, bổ sung để giáo trình ngày
càng hoàn thiện hơn.
Tôi chân thành cảm ơn các đồng nghiệp trong khoa Công nghệ thông tin –
Kế toán đã có những ý kiến đóng góp giá trị cho nội dung giáo trình và các tác
giả đã biên soạn, chia sẻ các tài liệu bổ ích.
Bà Rịa – Vũng Tàu, ngày 31 tháng 8 năm 2015
Tham gia biên soạn
Trần Lệ Thủy
3
MỤC LỤC
LỜI GIỚI THIỆU .................................................................................................. 2
BÀI 1: GIỚI THIỆU VỀ CƠ SỞ DỮ LIỆU ..................................................... 9
1. Một số khái niệm ......................................................................................... 10
1.1. Cơ sở dữ liệu ......................................................................................... 10
1.1.2. Khái niệm Cơ sở dữ liệu .................................................................... 11
1.1.3. Tính chất ............................................................................................ 11
1.1.4. Ƣu điểm của cơ sở dữ liệu ................................................................. 12
1.1.5. Những vấn đề Cơ sở dữ liệu cần giải quyết ...................................... 12
1.1.6. Đối tƣợng sử dụng Cơ sở dữ liệu ...................................................... 13
1.2. Hệ quản trị cơ sở dữ liệu .......................................................................... 13
2. Các mô hình dữ liệu ..................................................................................... 16
2.1. Mô hình dữ liệu mạng ........................................................................... 16
2.2. Mô hình phân cấp ................................................................................. 18
2.3. Mô hình quan hệ ................................................................................... 19
2.4. Mô hình thực thể liên kết ...................................................................... 20
2.5. Mô hình hƣớng đối tƣợng ..................................................................... 24
BÀI 2: CÁC KHÁI NIỆM CƠ BẢN TRONG MÔ HÌNH CƠ SỞ DỮ LIỆU
QUAN HỆ .......................................................................................................... 29
1. Thuộc tính........................................................................................................ 29
2. Lƣợc đồ quan hệ .......................................................................................... 31
3. Quan hệ ........................................................................................................ 31
4. Bộ giá trị ...................................................................................................... 32
5. Tân từ ........................................................................................................... 32
6. Khóa, siêu khóa, khóa chỉ định, khóa chính, khóa ngoại ............................ 32
9. Các phép tính trên cơ sở dữ liệu quan hệ .................................................... 35
10. Cách chuyển đổi từ mô hình thực thể kết hợp sang mô hình quan hệ ...... 36
BÀI 3: PHÉP HỘI, PHÉP GIAO, PHÉP TRỪ TRÊN ĐẠI SỐ QUAN HỆ 40
3. Phép giao 2 quan hệ (Intersection) .............................................................. 42
4. Phép Trừ 2 quan hệ (Minus) ........................................................................ 43
4
BÀI 4: PHÉP TÍCH ĐỀ CÁC, PHÉP CHIA TRÊN ĐẠI SỐ QUAN HỆ ... 45
1. Tích Decac của 2 quan hệ (Cartesian Product) ........................................... 45
2. Phép chia 2 quan hệ: .................................................................................... 46
BÀI 5: PHÉP CHIẾU VÀ PHÉP CHỌN TRONG ĐẠI SỐ QUAN HỆ ...... 49
1. Phép chọn (Selection) .................................................................................. 49
2. Phép chiếu ( Project) ................................................................................... 51
4. Phép gom nhóm và các hàm nhóm. ............................................................. 54
BÀI 6: PHÉP KẾT TRONG ĐẠI SỐ QUAN HỆ .......................................... 56
1. Phép kết ( phép nối) ..................................................................................... 56
2. Phép kết tự nhiên ......................................................................................... 58
3. Phép kết ngoài (outer join) .......................................................................... 59
BÀI 7: XÁC ĐỊNH RÀNG BUỘC TOÀN VẸN CÓ BỐI CẢNH 1 QUAN
HỆ ....................................................................................................................... 62
1. Khái niệm và các yếu tố của ràng buộc toàn vẹn ........................................ 62
2. Ràng buộc miền giá trị trên bối cảnh một quan hệ ...................................... 65
3. Ràng buộc toàn vẹn liên thuộc tính ............................................................ 66
4. Ràng buộc liên bộ - liên thuộc tính trên bối cảnh 1 quan hệ ....................... 66
BÀI 8: XÁC ĐỊNH RÀNG BUỘC TOÀN VẸN CÓ BỐI CẢNH NHIỀU
QUAN HỆ .......................................................................................................... 69
1. Ràng buộc toàn vẹn tham chiếu .................................................................. 69
2. Ràng buộc toàn vẹn liên thuộc tính. ............................................................ 70
BÀI 9 : PHỤ THUỘC HÀM VÀ HỆ TIÊN ĐỀ AMSTRONG CHO CÁC
PHỤ THUỘC HÀM .......................................................................................... 75
1. Định nghĩa phụ thuộc hàm ........................................................................... 75
2. Một số tính chất của phụ thuộc hàm - Hệ luật dẫn Armstrong ................... 77
BÀI 10: XÁC ĐỊNH BAO ĐÓNG.................................................................... 80
1. Bao Đóng Của Tập Phụ Thuộc Hàm F ...................................................... 80
2. Bao đóng của tập thuộc tính. ....................................................................... 81
BÀI 11: XÁC ĐỊNH KHÓA CỦA LƢỢC ĐỒ CƠ SỞ DỮ LIỆU ................ 84
1. Định nghĩa khoá của quan hệ (relation key)................................................ 84
5
2. Thuật toán tìm 1 khóa. ................................................................................. 84
3. Thuật toán tìm tất cả các khóa. .................................................................... 86
BÀI 12: XÁC ĐỊNH PHỦ TỐI THIỂU .......................................................... 89
1. Tập phụ thuộc hàm tƣơng đƣơng. ............................................................... 89
2. Phủ tối thiểu ( Tập phụ thuộc hàm tối thiểu) ............................................... 90
BÀI 13: XÁC ĐỊNH DẠNG CHUẨN CỦA LƢỢC ĐỒ CSDL .................... 93
1. Một số khái niệm liên quan đến dạng chuẩn ............................................... 93
2. Dạng chuẩn 1. .............................................................................................. 95
3. Dạng chuẩn 2 (2NF) .................................................................................... 95
4. Dạng Chuẩn 3 (third normal form) .............................................................. 96
5. Dạng Chuẩn BC (Boyce Codd normal form- BC NF) ................................ 97
BÀI 14: CHUẨN HÓA LƢỢC ĐỒ CƠ SỞ DỮ LIỆU VỀ DẠNG CHUẨN 3
............................................................................................................................. 99
1. Phƣơng pháp chuẩn hóa. ............................................................................. 99
2. Ví dụ .......................................................................................................... 100
BÀI 15: TỐI ƢU HOÁ CÂU HỎI ................................................................. 105
1.Nguyên tắc tổng quát để tối ƣu truy vấn .................................................... 105
2. Thuật toán tối ƣu hoá câu hỏi trong ngôn ngữ Đại số quan hệ ................. 106
2.1. Các phép biến đổi đại số ........................................................................ 106
2.2. Thuật toán cho tối ƣu hóa biểu thức đại số quan hệ ............................... 111
3.Ví dụ một thuật toán tối ƣu hoá biểu thức quan hệ. ................................... 111
6
MÔ ĐUN CƠ SỞ DỮ LIỆU
Mã mô đun: MĐ 12
Vị trí, tính chất, ý nghĩa và vai trò của mô đun:
Đây là môn học cơ sở và là môn bắt buộc của trình độ cao đẳng nghề công
nghệ thông tin đƣợc bố trí sau khi sinh viên học xong các môn chung, anh văn,
tin học cơ sở. Là môn học nền tảng về thiết kế và lƣu trữ dữ liệu
Mục tiêu của mô đun:
- Trình bày đƣợc các khái niệm về: Cơ sở dữ liệu, Các mô hình dữ liệu, các
ngôn ngữ định nghĩa và xử lý dữ liệu.
- Trình bày đƣợc khái niệm về quan hệ, thuộc tính, các loại khóa, lƣợc đồ
quan hệ, bộ giá trị và phụ thuộc hàm, ràng buộc toàn vẹn của mô hình cơ sở dữ
liệu quan hệ.
- Trình bày đƣợc khái niệm phép hội, giao, trừ, tích dề các, chia trong đại
số tập hợp.
- Trình bày đƣợc khái niệm phép chiếu, chọn, kết trong đại số quan hệ.
- Trình bày đƣợc khái niệm bao đóng và thuật toán tìm bao đóng của tập
thuộc tính.
- Trình bày đƣợc hệ tiên đề Amstrong đối với các phụ thuộc hàm.
- Trình bày đƣợc khái niệm khóa và các thuật toán tìm khóa của lƣợc đồ
CSDL.
- Trình bày đƣợc khái niệm tập phụ thuộc hàm tƣơng đƣơng và phủ tối
thiểu.
- Trình bày đƣợc thuật toán tìm phủ tối thiểu.
- Trình bày đƣợc khái niệm các dạng chuẩn 1,2,3,BC.
- Trình bày đƣợc phƣơng pháp chuẩn hóa CSDL về dạng chuẩn 3.
- Trình bày đƣợc phƣơng pháp tối ƣu hóa câu hỏi bằng đại số quan hệ.
7
- Thực hiện đƣợc các phép toán hội, giao,trừ, tích đề các, chia trên đại số
tập hợp.
- Thực hiện đƣợc các phép chiếu, chọn, kết trên đại số quan hệ.
- Phân biệt đƣợc các loại ràng buộc toàn vẹn.
- Xác định đƣợc các ràng buộc toàn vẹn trong 1 CSDL.
- Xác định đƣợc các phụ thuộc hàm trong CSDL.
- Xác định đƣợc bao đóng của các tập thuộc tính trong 1 CSDL.
- Tìm đƣợc khóa của lƣợc đồ CSDL bằng thuật toán tìm 1 khóa và thuật
toán tìm tất cả các khóa.
- Tìm đƣợc phủ tối thiệu của lƣợc đồ quan hệ bằng thuật toán tìm phủ tối
thiểu.
- Xác định đƣợc dạng chuẩn của các lƣợc đồ CSDL.
- Chuẩn hóa đƣợc lƣợc đồ CSDL về dạng chuẩn 3.
- Tối ƣu hóa đƣợc câu hỏi bằng đại số quan hệ.
Nội dung của mô đun:
1. Nội dung tổng quát và phân phối thời gian:
Số
TT
Tên các bài trong mô đun
Thời
gian
Hình thức
giảng dạy
1. Giới thiệu cơ sở dữ liệu 2 Lý thuyết
2.
Các Khái niệm cơ bản trong mô hình cơ sở
dữ liệu quan hệ
3 Lý thuyết
3.
Phép hội, phép giao, phép trừ trên đại số
quan hệ
5 Tích hợp
4.
Phép tích decac và phép chia trên đại số
quan hệ
5 Tích hợp
5.
Phép chiếu và phép chọn trong đại số quan
hệ
5 Tích hợp
8
6. Phép kết nối trong đại số quan hệ 5 Tích hợp
Kiểm tra Bài 3,4,5,6 2
7. Xác định RBTV trên bối cảnh 1 quan hệ 5 Tích hợp
8. Xác định RBTV trên bối cảnh nhiều quan hệ 5 Tích hợp
9.
Phụ thuôc hàm và hệ tiên đề Amstrong cho
các phụ thuộc hàm
3 Tích hợp
10. Xác định Bao đóng của tập thuộc tính 2 Tích hợp
11. Xác định Khóa của lƣợc đồ CSDL 5 Tích hợp
Kiểm tra Bài 7,8,9,10,11 3
12. Xác định Phủ tối thiểu của lƣợc đồ CSDL 5 Tích hợp
13. Xác định Dạng chuẩn của lƣợc đồ CSDL 5 Tích hợp
14. Chuẩn hóa lƣợc đồ CSDL về dạng chuẩn 3 7 Tích hợp
15. Tối ƣu hóa câu hỏi 5 Tích hợp
Kiểm tra Bài 12,13,14,15 3
Cộng: 75
9
BÀI 1
GIỚI THIỆU VỀ CƠ SỞ DỮ LIỆU
Mã bài: 01
Giới thiệu:
Cơ sở dữ liệu là gì và tại sao cần phải có Cơ sở dữ liệu? Cơ sở dữ liệu
(CSDL) là một hệ thống các thông tin có cấu trúc, các dữ liệu có liên quan với
nhau đƣợc lƣu trữ trên các thiết bị lƣu trữ nhằm thỏa mãn yêu cầu khai thác
thông tin đồng thời của nhiều ngƣời sử dụng hay nhiều chƣơng trình ứng dụng
với mục đích khác nhau. Một cơ sở dữ liệu biểu thị một khía cạnh nào đó của
thế giới thực nhƣ hoạt động của một công ty, một nhà trƣờng, một ngân hàng
Vì vậy Cơ sở dữ liệu rất cần thiết trong cuộc sống hiện nay.
Cơ sở dữ liệu và kỹ thuật cơ sở dữ liệu đã có ảnh hƣởng rất lớn đến việc sử
dụng máy tính. Có thể nói rằng cơ sở dữ liệu đóng vai trò quan trọng trong mọi
lĩnh vực có sử dụng máy tính nhƣ giáo dục, thƣơng mại, kỹ nghệ, khoa học, thƣ
viện,. Thuật ngữ cơ sở dữ liệu trở thành một thuật ngữ phổ dụng
Bài này sẽ giới thiệu một cách tổng quan về các khái niệm: cơ sở dữ
liệu, hệ quản trị cơ sở dữ liệu, hệ thống cơ sở dữ liệu và mô hình cơ sở dữ
liệu;
Mục tiêu:
- Phân biệt đƣợc hệ cơ sở dữ liệu với hệ thống tập tin cổ điển.
- Phân biệt đƣợc các mô hình dữ liệu mạng, phân cấp, quan hệ, thực thể
liên kết và mô hình hƣớng đối tƣợng.
- Nghiêm túc, tự giác trong học tập
Nội dung chính:
10
1. Một số khái niệm
1.1. Cơ sở dữ liệu
1.1.1. Dẫn nhập
Lƣu trữ thông tin là nhu cầu rất thông dụng trong cuộc sống của con ngƣời.
Từ thời xa xƣa con ngƣời đã biết sử dụng những vật dụng có sẵn để lƣu trữ
thông tin nhƣ in hình lên đá, in lên các gốc cây, thanh gỗ. Nhƣng hiện nay thì
việc lƣu trữ đó đã trở nên quá lỗi thời. Thay vào đó công nghệ thông tin phát
triển, mọi ngƣời đều có khả năng mua máy tính và lƣu trữ thông tin trên máy
tính.
Lƣu trữ dữ liệu dƣới dạng hệ thống tập tin
Hình 1.1. Hệ thống tập tin dữ liệu Microsoft Office
Khi sử dụng máy tính thông thƣờng ta sẽ lƣu trữ thông tin dƣới dạng file,
và mỗi file ta sẽ đặt nó trong những folder có tên khác nhau nhằm mục đích dễ
dàng tìm đến. Với cách này ta sẽ có những ƣu điểm và nhƣợc điểm nhƣ sau:
* Ưu điểm:
- Với việc lƣu trữ này thì rõ ràng khi ta cần là lƣu ngay nên tốc độ triển
khai sẽ nhanh
- Rõ ràng và trực quan với ngƣời không có chuyên môn công nghệ thông
tin
* Khuyết điểm:
11
- Dữ liệu không nhất quán, đôi khi có trƣờng hợp nhiều ngƣời sử dụng một
file và sẽ xảy ra hiện tƣợng lƣu đè.
- Trùng lặp dữ liệu nhiều.
- Tính chia sẻ dữ liệu không cao (kém)
Hiện nay các cá nhân sử dụng máy tính đa số sử dụng cách lƣu trữ này để
lƣu trữ thông tin cho riêng mình, nên nói về sự phổ biến thì cách này phổ biến
nhất, tuy nhiên với những hệ thống dữ liệu lớn thì sẽ có rất nhiều hạn chế nhƣ
việc truy xuất tìm kiếm dữ liệu sẽ chậm, khó bảo quản,... Với những hạn chế
trên thì khái niệm cơ sở dữ liệu và hệ quản trị cơ sở dữ liệu đƣợc ra đời.
1.1.2. Khái niệm Cơ sở dữ liệu
Cơ sở dữ liệu (CSDL) là một hệ thống các thông tin có cấu trúc, các dữ liệu
có liên quan với nhau đƣợc lƣu trữ trên các thiết bị lƣu trữ nhằm thỏa mãn yêu
cầu khai thác thông tin đồng thời của nhiều ngƣời sử dụng hay nhiều chƣơng
trình ứng dụng với mục đích khác nhau..
Ví dụ: Để quản lý việc học tập trong một trƣờng học, các dữ liệu là các
thông tin về sinh viên, về các môn học, điểm thi.Chúng ta tổ chức các dữ liệu
đó thành các bảng và lƣu giữ chúng vào sổ sách hoặc sử dụng một phần mềm
máy tính để lƣu giữ chúng trên máy tính. Ta có một tập các dữ liệu có liên quan
đến nhau và mang nhiều ý nghĩa, đó là một cơ sở dữ liệu.
1.1.3. Tính chất
- Một cơ sở dữ liệu biểu thị một khía cạnh nào đó của thế giới thực nhƣ
hoạt động của một công ty, một nhà trƣờng, một ngân hàng Những thay đổi
của thế giới thực phải đƣợc phản ánh một cách trung thực vào trong cơ sở dữ
liệu. Những thông tin đƣợc đƣa vào trong cơ sở dữ liệu tạo thành một không
gian cơ sở dữ liệu hoặc là một “thế giới nhỏ” (miniworld) .
- Một cơ sở dữ liệu là một tập hợp dữ liệu liên kết với nhau một cách logic
và mang một ý nghĩa cố hữu nào đó. Một cơ sở dữ liệu không phải là một tập
hợp tuỳ tiện.
12
- Một cơ sở dữ liệu đƣợc thiết kế và đƣợc phổ biến cho một mục đích riêng.
Nó có một nhóm ngƣời sử dụng có chủ định và có một số ứng dụng đƣợc xác
định phù hợp với mối quan tâm của ngƣời sử dụng. Nói cách khác, một cơ sở dữ
liệu có một nguồn cung cấp dữ liệu, một mức độ tƣơng tác với các sự kiện trong
thế giới thực và một nhóm ngƣời quan tâm tích cực đến các nội dung của nó.
- Một cơ sở dữ liệu có thể có cỡ tuỳ ý và có độ phức tạp thay đổi. Có những
cơ sở dữ liệu chỉ gồm vài trăm bản ghi (nhƣ cơ sở dữ liệu phục vụ việc quản lý
lƣơng ở một cơ quan nhỏ), và có những cơ sở dữ liệu có dung lƣợng rất lớn (nhƣ
các cơ sở dữ liệu phục vụ cho việc tính cƣớc điện thoại, quản lý nhân sự trên
một phạm vi lớn). Các cơ sở dữ liệu phải đƣợc tổ chức quản lý sao cho những
ngƣời sử dụng có thể tìm kiếm dữ liệu, cập nhật dữ liệu và lấy dữ liệu ra khi cần
thiết. Một cơ sở dữ liệu có thể đƣợc tạo ra và duy trì một cách thủ công và cũng
có thể đƣợc tin học hoá.
1.1.4. Ƣu điểm của cơ sở dữ liệu
-Giảm sự trùng lắp thông tin xuống mức thấp nhất và do đó bảo đảm đƣợc
tính nhất quán và toàn vẹn dữ liệu.
-Đảm bảo dữ liệu có thể truy xuất theo nhiều cách khác nhau.
-Khả năng chia sẻ thông tin cho nhiều ngƣời sử dụng.
1.1.5. Những vấn đề Cơ sở dữ liệu cần giải quyết
- Tính chủ quyền dữ liệu: đƣợc thể hiện ở phƣơng diện an toàn dữ liệu, khả
năng biểu diễn các mối liên hệ ngữ nghĩa của dữ liệu và tính chính xác của dữ
liệu. Điều này có nghĩa là ngƣời khai thác CSDL phải có nhiệm vụ cập nhật các
thông tin mới nhất của CSDL.
- Tính bảo mật và quyền khai thác thông tin của người sử dụng: Do có
nhiều ngƣời đƣợc phép khai thác dữ liệu một cách đồng thời, nên cần thiết phải
có một cơ chế bảo mật và phân quyền hạn khai thác CSDL. Các hệ điều hành
nhiều ngƣời sử dụng hay hệ điều hành mạng cục bộ đều có cung cấp cơ chế này
13
- Tranh chấp dữ liệu: Nhiều ngƣời đƣợc phép truy nhập cùng một lúc vào
tài nguyên dữ liệu của CSDL với những mục đích khác nhau, do đó cần thiết
phải có một cơ chế ƣu tiên khi truy nhập dữ liệu. Cơ chế ƣu tiên có thể đƣợc
thực hiện bằng việc cấp quyền ƣu tiên cho từng ngƣời khai thác.
- Đảm bảo dữ liệu khi có sự cố: Việc quản lý dữ liệu tập trung có thể làm
tăng khả năng mất mát hoặc sai lệch thông tin khi có sự cố nhƣ mất điện đột
xuất, hay một phần đĩa lƣu trữ CSDL bị hƣ, một số hệ điều hành mạng có
cung cấp dịch vụ sao lƣu ảnh đĩa cứng, tự động kiểm tra và khắc phục lỗi khi có
sự cố. Tuy nhiên, bên cạnh dịch vụ của hệ điều hành, để đảm bảo CSDL luôn ổn
định,