Quản lý nguồn dữ liệu
Tổ chức dữ liệu trong môi trường truyền thống File •Cách dùng cơ sở dữ liệu để quản lý dữ liệu •Tạo Cơ sở dũ liệu •Khuynh hưóng phát triển của cơ sở dữ liệu
Bạn đang xem trước 20 trang tài liệu Quản lý nguồn dữ liệu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Bài 5
Quản Lý Nguồn Dữ Liệu
1
Nội Dung
•Tổ chức dữ liệu trong môi trường truyền thống File
•Cách dùng cơ sở dữ liệu để quản lý dữ liệu
•Tạo Cơ sở dũ liệu
•Khuynh hưóng phát triển của cơ sở dữ liệu
2
Mục tiêu
Tại sao doanh nghiệp gặp trở ngại trong việc
tìm kiếm thông tin mà họ cần trong HTTT của
mình?
Hệ quản trị CSDL giúp doanh nghiệp cải thiện
tổ chức thông tin của họ như thế nào?
Các mô hình CSDL ảnh hưởng lên cách mà
DN truy xuất & sử dụng thông tin như thế nào?
Yêu cầu về tổ chức & quản lý đối với môi
trường CSDL là gì?
Các công nghệ & công cụ mới nào có thể làm
cho CSDL hữu dụng & dễ truy xuất hơn?
3
Tổ chức dữ liệu trong môi trường
truyền thống File
Khái niệm & thuật ngữ:
Bit
Byte
Field
Record
File
Database
4
Tổ chức dữ liệu trong môi trường
truyền thống File
Khái niệm & thuật ngữ:
Entity
Attribute
Key field
5
Tổ chức dữ liệu trong môi trường
truyền thống File
Các vấn đề trong môi trường File:
Dữ liệu dư thừa: khi các chức năng khác nhau trong tổ chức
thu thập cùng loại thông tin 1 cách riêng biệt tên/mã khác
nhau chỉ cùng 1 loại TT, TT khác nhau biểu diễn cùng tên/mã
phụ thuộc dữ liệu & chương trình: quan hệ trói buộc giữa DL
lưu trong file & các CT cụ thể dùng để cập nhật & bảo trì các
file đó thay đổi nhỏ về DL như kích thước field buộc phải
sửa đổi CT
Thiếu sự linh động: không thể tạo báo cáo bất thường hay yêu
cầu TT ko tính trước nhanh chóng
Bảo mật kém: có thể ko biết ai là người truy xuất hay thay đổi
DL
Thiếu sự chia sẽ dữ liệu & tính sẳn sàng: TT trong các file khác
nhau có thể ko quan hệ với nhau; TT ko đi tự do qua các chức
năng khác nhau
6
Tổ chức dữ liệu trong môi trường
truyền thống File
Xử lý tập tin truyền thống 7
Cách dùng cơ sở dữ liệu để quản
lý dữ liệu
CSDL :
Tập hợp các DL có quan hệ với nhau
được tổ chức theo cách để thuận tiện
cho việc tìm kiếm DL
Tập hợp các DL được tổ chức để
phục vụ cho nhiều ứng dụng 1 cách
hiệu quả bằng cách tập trung DL & tối
thiểu sự dư thừa
8
Cách dùng cơ sở dữ liệu để quản
lý dữ liệu
Hệ quản trị CSDL:Là phần mềm cho phép tổ
chức tập trung DL, quản lý DL hiệu quả, &
cung cấp truy xuất đến DL lưu trữ bởi CT.
Tạo & bảo trì CSDL
Không xét đến phát biểu định nghĩa dữ liệu
có trong CT truyền thống
Hoạt động như giao diện giữa chương trình
ứng dụng & các tập tin dữ liệu vật lý
Phân ra xem DL theo logic hay vật lý
9
Cách dùng cơ sở dữ liệu để quản
lý dữ liệu
Môi trường CSDL 10
Cách dùng cơ sở dữ liệu để quản
lý dữ liệu
Thành phần CSDL:
Ngôn ngữ định nghĩa DL (Data definition
language): xác định cấu trúc & nội dung
CSDL & định nghĩa từng phần tử DL
Ngôn ngữ truy xuất DL (Data manipulation
language): Lấy DL trong CSDL
Tự điển DL (Data dictionary): lưu trữ các
định nghĩa các phần tử DL & tính chất DL
11
Cách dùng cơ sở dữ liệu để quản
lý dữ liệu
Ví dụ về
phần tử DL
trong tự
điển DL
12
Cách dùng cơ sở dữ liệu để quản
lý dữ liệu
Các loại CSDL:
CSDL quan hệ (Relational DBMS)
CSDL mạng & phân cấp (Hierarchical
and Network DBMS)
CSDL hướng đối tượng (Object-
Oriented Databases)
13
Cách dùng cơ sở dữ liệu để quản
lý dữ liệu
CSDL quan hệ (Relational DBMS):
thể hiện DL như các bảng 2 chiều gọi
là quan hệ
Quan hệ DL giữa các bảng dựa trên
phần tử DL chung
VD: DB2, Oracle, MS SQL Server
14
Cách dùng cơ sở dữ liệu để quản
lý dữ liệu
Mô hình DL quan hệ 15
Cách dùng cơ sở dữ liệu để quản
lý dữ liệu
3 thao tác cơ bản trong CSDL quan hệ:
Chọn (Select): tạo tập con gồm 1 số
dòng theo điều kiện cụ thể
Kết (Join): Kết hợp các bảng quan hệ
để cung cấp TT cho người dùng
Chiếu (Project): Cho phép người
dùng tạo các bảng mới chỉ chứa các
TT thích đáng
16
Cách dùng cơ sở dữ liệu để quản
lý dữ liệu
3 thao tác cơ bản trong CSDL quan hệ
17
Cách dùng cơ sở dữ liệu để quản
lý dữ liệu
CSDL phân cấp (Hierarchical DBMS)
Tổ chức DL theo cấu trúc cây
Hỗ trợ quan hệ 1 cha nhiều con (one-
to-many parent-child)
Thịnh hành trong các HT lớn cũ
18
Cách dùng cơ sở dữ liệu để quản
lý dữ liệu
CSDL phân cấp (Hierarchical DBMS)
19
Cách dùng cơ sở dữ liệu để quản
lý dữ liệu
CSDL Mạng (Network DBMS)
Mô tả DL logic như quan hệ nhiều-
nhiều (many-to-many)
20
Cách dùng cơ sở dữ liệu để quản
lý dữ liệu
CSDL Mạng (Network DBMS)
21
Cách dùng cơ sở dữ liệu để quản
lý dữ liệu
Nhược điểm CSDL mạng & phân cấp:
Lổi thời
Ít linh động hơn so với RDBMS
Thiếu hỗ trợ cho truy vấn bằng ngôn
ngữ giống như tiếng Anh & truy vấn bất
thường
22
Cách dùng cơ sở dữ liệu để quản
lý dữ liệu
CSDL Hướng đối tượng:
Hệ QT CSDL hướng đối tượng (Object-
oriented DBMS): lưu trữ DL & thủ tục như
các đối tượng để có thể lấy ra & chia sẽ 1
cách tự động
Hệ QT CSDL quan hệ đối tượng (Object-
relational DBMS): cung cấp các khả năng
của Hệ QT CSDL quan hệ & hướng đối
tượng
23
Truy vấn CSDL: các lệnh SQL cơ bản
SELECT: các cột cụ thể
FROM: Bảng hay views
WHERE: điều kiện cụ thể
Cách dùng cơ sở dữ liệu để quản lý dữ liệu
24
Kết quả lệnh SELECT
Cách dùng cơ sở dữ liệu để quản lý dữ liệu
25
Kết quả lệnh SELECT có điều kiện
137
150
Door latch
Door seal
22.50
6.00
CCách dùng cơ sở dữ liệu để quản lý dữ liệu
26
Lệnh Chiếu từ việc kết các bảng PART & SUPPLIER
Cách dùng cơ sở dữ liệu để quản lý dữ liệu
27
Thiết kế CSDL:
Thiết kế quan niệm (Conceptual design): Mô
hình rút gọn CSDL từ góc độ kinh doanh
Thiết kế vật lý (Physical design): Mô tả chi tiết
nhu cầu thông tin kinh doanh
Tạo Cơ sở dữ liệu
28
Sơ đồ thực thể kết hợp (Entity-relationship
diagram): phương pháp lập tư liệu CSDL để
minh họa các quan hệ giữa các thực thể
CSDL
Chuẩn hóa (Normalization): tiến trình tạo ra
các cấu trúc DL ổn định nhỏ từ các nhóm DL
phức tạp
Tạo Cơ sở dữ liệu
29
Figure 7-13
Tạo Cơ sở dữ liệu
30
Figure 7-14
Tạo Cơ sở dữ liệu
31
1 quan hệ đã được chuẩn hóa
Tạo Cơ sở dữ liệu
32
CSDL tập trung (Centralized Database)
Sử dụng 1 hay nhiều bộ xử lý tập trung ở
mạng client/server
Tạo Cơ sở dữ liệu
33
CSDL phân tán (Distributed database)
Lưu trữ trong 1 hay nhiều vị trí vật lý
CSDL phân ra thành các phần khác nhau
(Partitioned database)
CSDL lặp lại (Duplicated database)
Tạo Cơ sở dữ liệu
34
Tạo Cơ sở dữ liệu
35
Các yêu cầu quản trị đối với HT CSDL
Các phần tử chính trong môi trường CSDL:
Quản trị CSDL (Data Administration): xác định yêu cầu
TT cho toàn TC, phát triển chính sách TT, hoạch định
DL, phát triển từ điển DL & thiết kế CSDL logic, giám sát
các chuyên viên IS & người dùng sử dụng DL như thế
nào
Phương pháp mô hình hóa & hoạch định DL (Data
Planning and Modeling Methodology)
Quản trị & công nghệ CSDL (Database Technology and
Management)
Người dùng (Users)
Tạo Cơ sở dữ liệu
36
Các yêu cầu quản trị đối với HT CSDL
Tạo Cơ sở dữ liệu
37
Phân tích DL đa chiều
Xử lý phân tích trực tuyến (On-line analytical
processing - OLAP)
Phân tích DL đa chiều
Hỗ trợ lấy & phân tích số lớn DL từ nhiều góc
độ
cần dùng CSDL đa chiều chuyên biệt hoặc
công cụ tạo các DL đa chiều trong CSDL quan
hệ
Khuynh hướng phát triển của cơ sở dữ liệu
38
Mô hình DL đa chiều (Multidimensional Data Model)
Khuynh hướng phát triển của cơ sở dữ liệu
39
Data warehouse
Hỗ trợ các công cụ truy vấn & báo cáo
Lưu trữ DL lịch sử & hiện thời
Hợp nhất DL để ra quyết định & phân tích
quản trị
Tổng kho DL & Khai phá DL
Khuynh hướng phát triển của cơ sở dữ liệu
40
Các thành phần của Data Warehouse
Khuynh hướng phát triển của cơ sở dữ liệu
41
Data mart
Tập con của data warehouse để trong
CSDL riêng biệt cho 1 số người dùng cụ
thể
Chứa các phần DL tổng hợp hay tập trung
cao cho 1 chức năng/nhóm người dùng cụ
thể
Khuynh hướng phát triển của cơ sở dữ liệu
Tổng kho DL & Khai phá DL
42
Datamining
Công cụ cho việc phân tích khối lượng rất lớn
DL
Tìm các mẫu ẩn tàng & các luật quy nạp để
dự báo khuynh hướng
Khuynh hướng phát triển của cơ sở dữ liệu
Tổng kho DL & Khai phá DL
43
Cải tiến & làm dễ dàng khả năng truy
xuất TT
Khả năng mô hình hóa & tái lập mô
hình DL
Lợi ích của Data Warehouses
Khuynh hướng phát triển của cơ sở dữ liệu
44
Hypermedia database
Tổ chức DL như mạng của các nốt
Kết nối các nốt theo cách được xác định bởi
người dùng
Hỗ trợ văn bản, đồ họa, âm thanh, phim ảnh
& các CT thực hiện
Khuynh hướng phát triển của cơ sở dữ liệu
CSDL & Web
45
A Hypermedia Database
Khuynh hướng phát triển của cơ sở dữ liệu
46
Database server
Máy tính trong môi trường client/server chạy
Hệ QT CSDL để xử lý các lệnh SQL & thực
hiện các công việc quản trị CSDL
Application server
Phần mềm kiểm soát tất cả các hoạt động
ứng dụng
CSDL & Web
Khuynh hướng phát triển của cơ sở dữ liệu
47
Kết nối CSDL nội bô tới trang Web
Khuynh hướng phát triển của cơ sở dữ liệu
48