Mô hình kho dữ liệu

9Dữ liệu không chuẩn hóa. 9Một bảng dữ kiện và các chiều bao quanh. 9Các truy vấn nhằm vào bảng dữ kiện và được cấu trúc bởi các bảng chiều. 9Cho phép một hệ thống các đối tượng có thể kết nối với nhiều đối tượng khác.

pdf26 trang | Chia sẻ: lylyngoc | Lượt xem: 2651 | Lượt tải: 4download
Bạn đang xem trước 20 trang tài liệu Mô hình kho dữ liệu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
1MÔ HÌNH KHO DỮ LIỆU BÁO CÁO 4/25/2014 MÔ HÌNH KHO DỮ LIỆU 2 4/25/2014 MÔ HÌNH KHO DỮ LIỆU 3 Nội dung báo cáo SƠ ĐỒ HÌNH TUYẾT RƠI ( SNOWFLAKE)2 SƠ ĐỒ HÌNH SAO ( STAR SCHEMA )31 SƠ ĐỒ KẾT HỢP 3 4/25/2014 MÔ HÌNH KHO DỮ LIỆU 4 1.SƠ ĐỒ HÌNH SAO 1.ĐẶC ĐIỂM 2. LƯỢC ĐỒ HÌNH SAO 3. FACT VÀ DIMENSION 4. MỐI QUAN HỆ GIỮA FACT VÀ DIMENSION 5.ƯU ĐIỂM 6. NHƯỢC ĐIỂM 4/25/2014 MÔ HÌNH KHO DỮ LIỆU 5 1.SƠ ĐỒ HÌNH SAO 9 Dữ liệu không chuẩn hóa. 9Một bảng dữ kiện và các chiều bao quanh. 9 Các truy vấn nhằm vào bảng dữ kiện và được cấu trúc bởi các bảng chiều. 9 Cho phép một hệ thống các đối tượng có thể kết nối với nhiều đối tượng khác. ĐẶC ĐIỂM: Ví dụ 4/25/2014 MÔ HÌNH KHO DỮ LIỆU 6 1.SƠ ĐỒ HÌNH SAO 34 4/25/2014 MÔ HÌNH KHO DỮ LIỆU 7 1.SƠ ĐỒ HÌNH SAO XÁC ĐỊNH VÀ PHÂN LOẠI DỮ LIỆU 9 Các sự kiện được tổ chức thành bảng Fact. 9 Phạm vi hay chiều của dữ liệu được tổ chức thành các bảng Dimension. 4/25/2014 MÔ HÌNH KHO DỮ LIỆU 8 1.SƠ ĐỒ HÌNH SAO Fact chứa các thông tin cơ sở ở mức giao tác ở trong nghiệp vụ mà các ứng dụng cần thiết. Ví dụ: Khi phân tích kết quả học tập của sinh viên trường DHTN thì cần những dữ liệu : Mã sinh viên, họ tên, ngày sinh, giới tính, điểm thi… Trước khi đưa vào kho dữ liệu thì cần phải chọn Mã sinh viên làm khóa ngoại trong các quan hệ liên kết và khóa ngoại này được lưu trong bảng Fact. 4/25/2014 MÔ HÌNH KHO DỮ LIỆU 9 1.SƠ ĐỒ HÌNH SAO Dimension chứa các thông tin mô tả, các dữ liệu cần thiết cho việc thực hiện các giao tác nghiệp vụ theo một chiều hay một phạm vi nào đó. Ví dụ: Trong ứng dụng phân tích kết quả học tập của sinh viên trường DHTN, các thông tin như: họ tên, ngày sinh, giới tính, điểm thi,… được lưu trữ trên các bảng Dimension 4/25/2014 MÔ HÌNH KHO DỮ LIỆU 10 1.SƠ ĐỒ HÌNH SAO Phân loại Dimension: 3 Chiều phẳng (flat dimension) 3 Chiều phân cấp (hierarchical dimension) 4/25/2014 MÔ HÌNH KHO DỮ LIỆU 11 1.SƠ ĐỒ HÌNH SAO 9 Chiều phẳng (flat dimension): Các giá trị của chiều có cùng mức, không giá trị nào đó là cha hay con của giá trị khác Dimension sinhvien Holot Ten Phai Ngaysinh 4/25/2014 MÔ HÌNH KHO DỮ LIỆU 12 1.SƠ ĐỒ HÌNH SAO 9 Chiều phân cấp ( hierarchiacal dimension): Các giá trị của chiều có quan hệ một – nhiều. Dimension thời gian Năm Ngày nghỉ Chu kỳ Qúy Tuần Tháng Ngày 4/25/2014 MÔ HÌNH KHO DỮ LIỆU 13 MỐI QUAN HỆ GIỮA BẢN FACT VÀ DIMENSION 9 Fact chứa khóa của các Dimension. 9 Dimension thường có định danh duy nhất và chứa những thông tin về chiều của bảng Fact. 9 Một sơ đồ hình sao đơn giản chỉ gồm 1 bảng Fact và ít nhất 3 bảng Dimension. 9 Một sơ đồ hình sao phức tạp gồm hàng trăm bảng Fact và bảng Dimension. 4 4/25/2014 MÔ HÌNH KHO DỮ LIỆU 14 MaCK Nam Quy Thang 001 2000 1 Một 002 2000 1 Hai …. ………. …… …. 012 2000 4 Mười hai MaKH HOTEN DIACHI 1004 Trần Hòa Hà Nội 1005 Lê An Hải Phòng …. ………. …… 2010 Lê Nam ĐăkLăk MaSP TenSP DVT 100 cam vắt LIT 105 Pepsi chai …. ………. …. 201 Coca chai MaSP MaCK MaKH Dongia Soluong 100 001 1004 15000 25 105 002 1005 12000 12 …. …. …. …. 100 001 1004 15000 25 1.SƠ ĐỒ HÌNH SAO Bảng Demension:ChuKy Bảng Demension:KhachHang Bảng Demension:SanPham Bảng FACT 4/25/2014 MÔ HÌNH KHO DỮ LIỆU 15 1. SƠ ĐỒ HÌNH SAO 9 Hỗ trợ rất đa dạng các thao tác, xử lý khá hiệu quả những câu truy vấn. 9 Phù hợp với cách mà NSD nhận và sử dụng dữ liệu. 9 Nguyên lý cơ bản của sơ đồ hình sao là một dạng dư thừa dữ liệu cải thiện sự thực hiện các truy vấn. 9 Trực quan, dễ sử dụng, thể hiện khung nhìn đa chiều về dữ liệu trong CSDL quan hệ. 5.ƯU ĐIỂM: 4/25/2014 MÔ HÌNH KHO DỮ LIỆU 16 1. SƠ ĐỒ HÌNH SAO Vì bảng Fact được tổng hợp từ trước và được kết hợp theo chiều nên xu hướng có rất nhiều hàng và tăng trưởng một cách nhanh chóng Æ độ dư thừa dữ liệu lớn. 6. NHƯỢC ĐIỂM: 4/25/2014 MÔ HÌNH KHO DỮ LIỆU 17 2. SƠ ĐỒ HÌNH TUYẾT RƠI 1.ĐẶC ĐIỂM 2. LƯỢC ĐỒ HÌNH TUYẾT RƠI 3.ƯU ĐIỂM 4. PHÂN BIỆT SƠ ĐỒ HÌNH SAO VÀ HÌNH TUYẾT RƠI 4/25/2014 MÔ HÌNH KHO DỮ LIỆU 18 2. SƠ ĐỒ HÌNH TUYẾT RƠI ĐẶC ĐIỂM: 9 Là sự mở rộng của sơ đồ hình sao tại đó mỗi cánh sao không phải là 1 bảng Deminsion mà là nhiều bảng. 9 Các chiều được chuẩn hóa (chuẩn 3). 4/25/2014 MÔ HÌNH KHO DỮ LIỆU 19 2. SƠ ĐỒ HÌNH TUYẾT RƠI 3 4/25/2014 MÔ HÌNH KHO DỮ LIỆU 20 2. SƠ ĐỒ HÌNH TUYẾT RƠI 9 Cải thiện năng suất truy vấn. 9 Tối thiểu không gian đĩa cần thiết để lưu trữ dữ liệu. 9 Tăng tính linh hoạt của các ứng dụng bởi sự chuẩn hóa ít mang bản chất theo chiều hơn. ƯU ĐIỂM: Ví dụ 4/25/2014 MÔ HÌNH KHO DỮ LIỆU 21 2. SƠ ĐỒ HÌNH TUYẾT RƠI PHÂN BIỆT SƠ ĐỒ HÌNH SAO VỚI SƠ ĐỒ TUYẾT RƠI SƠ ĐỒ HÌNH SAO SƠ ĐỒ TUYẾT RƠI - Chưa tối thiểu không gian đĩa cần thiết để lưu trữ data. - Việc truy cập đến các bảng đơn giản hơn. - Chưa chuẩn hóa - Tốc độ truy vấn chậm - Tối thiểu không gian đĩa cần thiết để lưu trữ data. - Việc truy cập đến các bảng phức tạp hơn. - Đã chuẩn hóa . - Tốc độ truy vấn nhanh 4/25/2014 MÔ HÌNH KHO DỮ LIỆU 22 3. SƠ ĐỒ KẾT HỢP 1.ĐẶC ĐIỂM 2. SƠ ĐỒ KẾT HỢP 3.ƯU ĐIỂM 4/25/2014 MÔ HÌNH KHO DỮ LIỆU 23 3. SƠ ĐỒ KẾT HỢP ĐẶC ĐIỂM: Là sự kết hợp giữa sơ đồ hình sao dựa trên bảng fact và những bảng dimension không chuẩn hóa và sơ đồ hình tuyết rơi trong đó tất cả các bảng Dimension đều được chuẩn hóa. 4/25/2014 MÔ HÌNH KHO DỮ LIỆU 24 3. SƠ ĐỒ KẾT HỢP VÍ DỤ: 4/25/2014 MÔ HÌNH KHO DỮ LIỆU 25 3. SƠ ĐỒ KẾT HỢP ƯU ĐIỂM: 9 Cải thiện năng suất truy vấn. 9 Hỗ trợ rất đa dạng các thao tác, xử lý khá hiệu quả những câu truy vấn. 9 Tạo ra một khung nhìn đa chiều về dữ liệu trong CSDL. 4/25/2014 MÔ HÌNH KHO DỮ LIỆU 26