9Dữ liệu không chuẩn hóa.
9Một bảng dữ kiện và các chiều bao quanh.
9Các truy vấn nhằm vào bảng dữ kiện và được cấu
trúc bởi các bảng chiều.
9Cho phép một hệ thống các đối tượng có thể kết nối
với nhiều đối tượng khác.
26 trang |
Chia sẻ: lylyngoc | Lượt xem: 2651 | Lượt tải: 4
Bạn đang xem trước 20 trang tài liệu Mô hình kho dữ liệu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
1MÔ HÌNH KHO DỮ LIỆU
BÁO CÁO
4/25/2014 MÔ HÌNH KHO DỮ LIỆU 2
4/25/2014 MÔ HÌNH KHO DỮ LIỆU 3
Nội dung báo cáo
SƠ ĐỒ HÌNH TUYẾT RƠI ( SNOWFLAKE)2
SƠ ĐỒ HÌNH SAO ( STAR SCHEMA )31
SƠ ĐỒ KẾT HỢP 3
4/25/2014 MÔ HÌNH KHO DỮ LIỆU 4
1.SƠ ĐỒ HÌNH SAO
1.ĐẶC ĐIỂM
2. LƯỢC ĐỒ HÌNH SAO
3. FACT VÀ DIMENSION
4. MỐI QUAN HỆ GIỮA FACT VÀ DIMENSION
5.ƯU ĐIỂM
6. NHƯỢC ĐIỂM
4/25/2014 MÔ HÌNH KHO DỮ LIỆU 5
1.SƠ ĐỒ HÌNH SAO
9 Dữ liệu không chuẩn hóa.
9Một bảng dữ kiện và các chiều bao quanh.
9 Các truy vấn nhằm vào bảng dữ kiện và được cấu
trúc bởi các bảng chiều.
9 Cho phép một hệ thống các đối tượng có thể kết nối
với nhiều đối tượng khác.
ĐẶC ĐIỂM:
Ví dụ
4/25/2014 MÔ HÌNH KHO DỮ LIỆU 6
1.SƠ ĐỒ HÌNH SAO
34
4/25/2014 MÔ HÌNH KHO DỮ LIỆU 7
1.SƠ ĐỒ HÌNH SAO
XÁC ĐỊNH VÀ PHÂN LOẠI DỮ LIỆU
9 Các sự kiện được tổ chức thành bảng Fact.
9 Phạm vi hay chiều của dữ liệu được tổ chức
thành các bảng Dimension.
4/25/2014 MÔ HÌNH KHO DỮ LIỆU 8
1.SƠ ĐỒ HÌNH SAO
Fact chứa các thông tin cơ sở ở mức giao tác ở trong
nghiệp vụ mà các ứng dụng cần thiết.
Ví dụ: Khi phân tích kết quả học tập của sinh viên
trường DHTN thì cần những dữ liệu : Mã sinh viên, họ
tên, ngày sinh, giới tính, điểm thi… Trước khi đưa vào
kho dữ liệu thì cần phải chọn Mã sinh viên làm khóa
ngoại trong các quan hệ liên kết và khóa ngoại này được
lưu trong bảng Fact.
4/25/2014 MÔ HÌNH KHO DỮ LIỆU 9
1.SƠ ĐỒ HÌNH SAO
Dimension chứa các thông tin mô tả, các dữ liệu cần thiết
cho việc thực hiện các giao tác nghiệp vụ theo một chiều
hay một phạm vi nào đó.
Ví dụ: Trong ứng dụng phân tích kết quả học tập của
sinh viên trường DHTN, các thông tin như: họ tên, ngày
sinh, giới tính, điểm thi,… được lưu trữ trên các bảng
Dimension
4/25/2014 MÔ HÌNH KHO DỮ LIỆU 10
1.SƠ ĐỒ HÌNH SAO
Phân loại Dimension:
3 Chiều phẳng (flat dimension)
3 Chiều phân cấp (hierarchical dimension)
4/25/2014 MÔ HÌNH KHO DỮ LIỆU 11
1.SƠ ĐỒ HÌNH SAO
9 Chiều phẳng (flat dimension): Các giá trị của
chiều có cùng mức, không giá trị nào đó là cha hay
con của giá trị khác
Dimension sinhvien
Holot Ten Phai Ngaysinh
4/25/2014 MÔ HÌNH KHO DỮ LIỆU 12
1.SƠ ĐỒ HÌNH SAO
9 Chiều phân cấp ( hierarchiacal dimension):
Các giá trị của chiều có quan hệ một – nhiều.
Dimension thời gian
Năm Ngày nghỉ Chu kỳ
Qúy Tuần
Tháng
Ngày
4/25/2014 MÔ HÌNH KHO DỮ LIỆU 13
MỐI QUAN HỆ GIỮA BẢN FACT VÀ DIMENSION
9 Fact chứa khóa của các Dimension.
9 Dimension thường có định danh duy nhất và chứa
những thông tin về chiều của bảng Fact.
9 Một sơ đồ hình sao đơn giản chỉ gồm 1 bảng Fact và
ít nhất 3 bảng Dimension.
9 Một sơ đồ hình sao phức tạp gồm hàng trăm bảng
Fact và bảng Dimension.
4
4/25/2014 MÔ HÌNH KHO DỮ LIỆU 14
MaCK Nam Quy Thang
001 2000 1 Một
002 2000 1 Hai
…. ………. …… ….
012 2000 4 Mười hai
MaKH HOTEN DIACHI
1004 Trần Hòa Hà Nội
1005 Lê An Hải Phòng
…. ………. ……
2010 Lê Nam ĐăkLăk
MaSP TenSP DVT
100 cam vắt LIT
105 Pepsi chai
…. ………. ….
201 Coca chai
MaSP MaCK MaKH Dongia Soluong
100 001 1004 15000 25
105 002 1005 12000 12
…. …. …. ….
100 001 1004 15000 25
1.SƠ ĐỒ HÌNH SAO
Bảng Demension:ChuKy
Bảng Demension:KhachHang
Bảng Demension:SanPham
Bảng FACT
4/25/2014 MÔ HÌNH KHO DỮ LIỆU 15
1. SƠ ĐỒ HÌNH SAO
9 Hỗ trợ rất đa dạng các thao tác, xử lý khá hiệu
quả những câu truy vấn.
9 Phù hợp với cách mà NSD nhận và sử dụng dữ
liệu.
9 Nguyên lý cơ bản của sơ đồ hình sao là một dạng
dư thừa dữ liệu cải thiện sự thực hiện các truy vấn.
9 Trực quan, dễ sử dụng, thể hiện khung nhìn đa
chiều về dữ liệu trong CSDL quan hệ.
5.ƯU ĐIỂM:
4/25/2014 MÔ HÌNH KHO DỮ LIỆU 16
1. SƠ ĐỒ HÌNH SAO
Vì bảng Fact được tổng hợp từ trước và được kết
hợp theo chiều nên xu hướng có rất nhiều hàng và
tăng trưởng một cách nhanh chóng Æ độ dư thừa
dữ liệu lớn.
6. NHƯỢC ĐIỂM:
4/25/2014 MÔ HÌNH KHO DỮ LIỆU 17
2. SƠ ĐỒ HÌNH TUYẾT RƠI
1.ĐẶC ĐIỂM
2. LƯỢC ĐỒ HÌNH TUYẾT RƠI
3.ƯU ĐIỂM
4. PHÂN BIỆT SƠ ĐỒ HÌNH SAO VÀ HÌNH TUYẾT RƠI
4/25/2014 MÔ HÌNH KHO DỮ LIỆU 18
2. SƠ ĐỒ HÌNH TUYẾT RƠI
ĐẶC ĐIỂM:
9 Là sự mở rộng của sơ đồ hình sao tại đó mỗi
cánh sao không phải là 1 bảng Deminsion mà là
nhiều bảng.
9 Các chiều được chuẩn hóa (chuẩn 3).
4/25/2014 MÔ HÌNH KHO DỮ LIỆU 19
2. SƠ ĐỒ HÌNH TUYẾT RƠI
3
4/25/2014 MÔ HÌNH KHO DỮ LIỆU 20
2. SƠ ĐỒ HÌNH TUYẾT RƠI
9 Cải thiện năng suất truy vấn.
9 Tối thiểu không gian đĩa cần thiết để lưu trữ dữ liệu.
9 Tăng tính linh hoạt của các ứng dụng bởi sự chuẩn hóa
ít mang bản chất theo chiều hơn.
ƯU ĐIỂM:
Ví dụ
4/25/2014 MÔ HÌNH KHO DỮ LIỆU 21
2. SƠ ĐỒ HÌNH TUYẾT RƠI
PHÂN BIỆT SƠ ĐỒ HÌNH SAO VỚI SƠ ĐỒ TUYẾT RƠI
SƠ ĐỒ HÌNH SAO SƠ ĐỒ TUYẾT RƠI
- Chưa tối thiểu không gian
đĩa cần thiết để lưu trữ data.
- Việc truy cập đến các
bảng đơn giản hơn.
- Chưa chuẩn hóa
- Tốc độ truy vấn chậm
- Tối thiểu không gian đĩa
cần thiết để lưu trữ data.
- Việc truy cập đến các
bảng phức tạp hơn.
- Đã chuẩn hóa .
- Tốc độ truy vấn nhanh
4/25/2014 MÔ HÌNH KHO DỮ LIỆU 22
3. SƠ ĐỒ KẾT HỢP
1.ĐẶC ĐIỂM
2. SƠ ĐỒ KẾT HỢP
3.ƯU ĐIỂM
4/25/2014 MÔ HÌNH KHO DỮ LIỆU 23
3. SƠ ĐỒ KẾT HỢP
ĐẶC ĐIỂM:
Là sự kết hợp giữa sơ đồ hình sao dựa trên bảng fact
và những bảng dimension không chuẩn hóa và sơ đồ
hình tuyết rơi trong đó tất cả các bảng Dimension đều
được chuẩn hóa.
4/25/2014 MÔ HÌNH KHO DỮ LIỆU 24
3. SƠ ĐỒ KẾT HỢP
VÍ DỤ:
4/25/2014 MÔ HÌNH KHO DỮ LIỆU 25
3. SƠ ĐỒ KẾT HỢP
ƯU ĐIỂM:
9 Cải thiện năng suất truy vấn.
9 Hỗ trợ rất đa dạng các thao tác, xử lý khá hiệu quả
những câu truy vấn.
9 Tạo ra một khung nhìn đa chiều về dữ liệu trong CSDL.
4/25/2014 MÔ HÌNH KHO DỮ LIỆU 26