Quản lý nguồn dữ liệu

Tổ chức dữ liệu trong môi trường truyền thống File •Cách dùng cơ sở dữ liệu để quản lý dữ liệu •Tạo Cơ sở dũ liệu •Khuynh hưóng phát triển của cơ sở dữ liệu

pdf48 trang | Chia sẻ: tranhoai21 | Lượt xem: 1669 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Quản lý nguồn dữ liệu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Bài 5 Quản Lý Nguồn Dữ Liệu 1 Nội Dung •Tổ chức dữ liệu trong môi trường truyền thống File •Cách dùng cơ sở dữ liệu để quản lý dữ liệu •Tạo Cơ sở dũ liệu •Khuynh hưóng phát triển của cơ sở dữ liệu 2 Mục tiêu  Tại sao doanh nghiệp gặp trở ngại trong việc tìm kiếm thông tin mà họ cần trong HTTT của mình?  Hệ quản trị CSDL giúp doanh nghiệp cải thiện tổ chức thông tin của họ như thế nào?  Các mô hình CSDL ảnh hưởng lên cách mà DN truy xuất & sử dụng thông tin như thế nào?  Yêu cầu về tổ chức & quản lý đối với môi trường CSDL là gì?  Các công nghệ & công cụ mới nào có thể làm cho CSDL hữu dụng & dễ truy xuất hơn? 3 Tổ chức dữ liệu trong môi trường truyền thống File Khái niệm & thuật ngữ:  Bit  Byte  Field  Record  File  Database 4 Tổ chức dữ liệu trong môi trường truyền thống File Khái niệm & thuật ngữ:  Entity  Attribute  Key field 5 Tổ chức dữ liệu trong môi trường truyền thống File Các vấn đề trong môi trường File:  Dữ liệu dư thừa: khi các chức năng khác nhau trong tổ chức thu thập cùng loại thông tin 1 cách riêng biệt  tên/mã khác nhau chỉ cùng 1 loại TT, TT khác nhau biểu diễn cùng tên/mã  phụ thuộc dữ liệu & chương trình: quan hệ trói buộc giữa DL lưu trong file & các CT cụ thể dùng để cập nhật & bảo trì các file đó  thay đổi nhỏ về DL như kích thước field buộc phải sửa đổi CT  Thiếu sự linh động: không thể tạo báo cáo bất thường hay yêu cầu TT ko tính trước nhanh chóng  Bảo mật kém: có thể ko biết ai là người truy xuất hay thay đổi DL  Thiếu sự chia sẽ dữ liệu & tính sẳn sàng: TT trong các file khác nhau có thể ko quan hệ với nhau; TT ko đi tự do qua các chức năng khác nhau 6 Tổ chức dữ liệu trong môi trường truyền thống File Xử lý tập tin truyền thống 7 Cách dùng cơ sở dữ liệu để quản lý dữ liệu CSDL :  Tập hợp các DL có quan hệ với nhau được tổ chức theo cách để thuận tiện cho việc tìm kiếm DL  Tập hợp các DL được tổ chức để phục vụ cho nhiều ứng dụng 1 cách hiệu quả bằng cách tập trung DL & tối thiểu sự dư thừa 8 Cách dùng cơ sở dữ liệu để quản lý dữ liệu Hệ quản trị CSDL:Là phần mềm cho phép tổ chức tập trung DL, quản lý DL hiệu quả, & cung cấp truy xuất đến DL lưu trữ bởi CT. Tạo & bảo trì CSDL Không xét đến phát biểu định nghĩa dữ liệu có trong CT truyền thống Hoạt động như giao diện giữa chương trình ứng dụng & các tập tin dữ liệu vật lý Phân ra xem DL theo logic hay vật lý 9 Cách dùng cơ sở dữ liệu để quản lý dữ liệu Môi trường CSDL 10 Cách dùng cơ sở dữ liệu để quản lý dữ liệu Thành phần CSDL:  Ngôn ngữ định nghĩa DL (Data definition language): xác định cấu trúc & nội dung CSDL & định nghĩa từng phần tử DL  Ngôn ngữ truy xuất DL (Data manipulation language): Lấy DL trong CSDL  Tự điển DL (Data dictionary): lưu trữ các định nghĩa các phần tử DL & tính chất DL 11 Cách dùng cơ sở dữ liệu để quản lý dữ liệu Ví dụ về phần tử DL trong tự điển DL 12 Cách dùng cơ sở dữ liệu để quản lý dữ liệu Các loại CSDL:  CSDL quan hệ (Relational DBMS)  CSDL mạng & phân cấp (Hierarchical and Network DBMS)  CSDL hướng đối tượng (Object- Oriented Databases) 13 Cách dùng cơ sở dữ liệu để quản lý dữ liệu CSDL quan hệ (Relational DBMS):  thể hiện DL như các bảng 2 chiều gọi là quan hệ  Quan hệ DL giữa các bảng dựa trên phần tử DL chung  VD: DB2, Oracle, MS SQL Server 14 Cách dùng cơ sở dữ liệu để quản lý dữ liệu Mô hình DL quan hệ 15 Cách dùng cơ sở dữ liệu để quản lý dữ liệu 3 thao tác cơ bản trong CSDL quan hệ:  Chọn (Select): tạo tập con gồm 1 số dòng theo điều kiện cụ thể  Kết (Join): Kết hợp các bảng quan hệ để cung cấp TT cho người dùng  Chiếu (Project): Cho phép người dùng tạo các bảng mới chỉ chứa các TT thích đáng 16 Cách dùng cơ sở dữ liệu để quản lý dữ liệu 3 thao tác cơ bản trong CSDL quan hệ 17 Cách dùng cơ sở dữ liệu để quản lý dữ liệu CSDL phân cấp (Hierarchical DBMS) Tổ chức DL theo cấu trúc cây Hỗ trợ quan hệ 1 cha nhiều con (one- to-many parent-child) Thịnh hành trong các HT lớn cũ 18 Cách dùng cơ sở dữ liệu để quản lý dữ liệu CSDL phân cấp (Hierarchical DBMS) 19 Cách dùng cơ sở dữ liệu để quản lý dữ liệu CSDL Mạng (Network DBMS)  Mô tả DL logic như quan hệ nhiều- nhiều (many-to-many) 20 Cách dùng cơ sở dữ liệu để quản lý dữ liệu CSDL Mạng (Network DBMS) 21 Cách dùng cơ sở dữ liệu để quản lý dữ liệu Nhược điểm CSDL mạng & phân cấp:  Lổi thời  Ít linh động hơn so với RDBMS  Thiếu hỗ trợ cho truy vấn bằng ngôn ngữ giống như tiếng Anh & truy vấn bất thường 22 Cách dùng cơ sở dữ liệu để quản lý dữ liệu CSDL Hướng đối tượng:  Hệ QT CSDL hướng đối tượng (Object- oriented DBMS): lưu trữ DL & thủ tục như các đối tượng để có thể lấy ra & chia sẽ 1 cách tự động  Hệ QT CSDL quan hệ đối tượng (Object- relational DBMS): cung cấp các khả năng của Hệ QT CSDL quan hệ & hướng đối tượng 23 Truy vấn CSDL: các lệnh SQL cơ bản  SELECT: các cột cụ thể  FROM: Bảng hay views  WHERE: điều kiện cụ thể Cách dùng cơ sở dữ liệu để quản lý dữ liệu 24 Kết quả lệnh SELECT Cách dùng cơ sở dữ liệu để quản lý dữ liệu 25 Kết quả lệnh SELECT có điều kiện 137 150 Door latch Door seal 22.50 6.00 CCách dùng cơ sở dữ liệu để quản lý dữ liệu 26 Lệnh Chiếu từ việc kết các bảng PART & SUPPLIER Cách dùng cơ sở dữ liệu để quản lý dữ liệu 27 Thiết kế CSDL:  Thiết kế quan niệm (Conceptual design): Mô hình rút gọn CSDL từ góc độ kinh doanh  Thiết kế vật lý (Physical design): Mô tả chi tiết nhu cầu thông tin kinh doanh Tạo Cơ sở dữ liệu 28  Sơ đồ thực thể kết hợp (Entity-relationship diagram): phương pháp lập tư liệu CSDL để minh họa các quan hệ giữa các thực thể CSDL  Chuẩn hóa (Normalization): tiến trình tạo ra các cấu trúc DL ổn định nhỏ từ các nhóm DL phức tạp Tạo Cơ sở dữ liệu 29 Figure 7-13 Tạo Cơ sở dữ liệu 30 Figure 7-14 Tạo Cơ sở dữ liệu 31 1 quan hệ đã được chuẩn hóa Tạo Cơ sở dữ liệu 32 CSDL tập trung (Centralized Database)  Sử dụng 1 hay nhiều bộ xử lý tập trung ở mạng client/server Tạo Cơ sở dữ liệu 33 CSDL phân tán (Distributed database)  Lưu trữ trong 1 hay nhiều vị trí vật lý  CSDL phân ra thành các phần khác nhau (Partitioned database)  CSDL lặp lại (Duplicated database) Tạo Cơ sở dữ liệu 34 Tạo Cơ sở dữ liệu 35 Các yêu cầu quản trị đối với HT CSDL Các phần tử chính trong môi trường CSDL:  Quản trị CSDL (Data Administration): xác định yêu cầu TT cho toàn TC, phát triển chính sách TT, hoạch định DL, phát triển từ điển DL & thiết kế CSDL logic, giám sát các chuyên viên IS & người dùng sử dụng DL như thế nào  Phương pháp mô hình hóa & hoạch định DL (Data Planning and Modeling Methodology)  Quản trị & công nghệ CSDL (Database Technology and Management)  Người dùng (Users) Tạo Cơ sở dữ liệu 36 Các yêu cầu quản trị đối với HT CSDL Tạo Cơ sở dữ liệu 37 Phân tích DL đa chiều Xử lý phân tích trực tuyến (On-line analytical processing - OLAP)  Phân tích DL đa chiều  Hỗ trợ lấy & phân tích số lớn DL từ nhiều góc độ  cần dùng CSDL đa chiều chuyên biệt hoặc công cụ tạo các DL đa chiều trong CSDL quan hệ Khuynh hướng phát triển của cơ sở dữ liệu 38 Mô hình DL đa chiều (Multidimensional Data Model) Khuynh hướng phát triển của cơ sở dữ liệu 39 Data warehouse  Hỗ trợ các công cụ truy vấn & báo cáo  Lưu trữ DL lịch sử & hiện thời  Hợp nhất DL để ra quyết định & phân tích quản trị Tổng kho DL & Khai phá DL Khuynh hướng phát triển của cơ sở dữ liệu 40 Các thành phần của Data Warehouse Khuynh hướng phát triển của cơ sở dữ liệu 41 Data mart  Tập con của data warehouse để trong CSDL riêng biệt cho 1 số người dùng cụ thể  Chứa các phần DL tổng hợp hay tập trung cao cho 1 chức năng/nhóm người dùng cụ thể Khuynh hướng phát triển của cơ sở dữ liệu Tổng kho DL & Khai phá DL 42 Datamining  Công cụ cho việc phân tích khối lượng rất lớn DL  Tìm các mẫu ẩn tàng & các luật quy nạp để dự báo khuynh hướng Khuynh hướng phát triển của cơ sở dữ liệu Tổng kho DL & Khai phá DL 43  Cải tiến & làm dễ dàng khả năng truy xuất TT  Khả năng mô hình hóa & tái lập mô hình DL Lợi ích của Data Warehouses Khuynh hướng phát triển của cơ sở dữ liệu 44 Hypermedia database  Tổ chức DL như mạng của các nốt  Kết nối các nốt theo cách được xác định bởi người dùng  Hỗ trợ văn bản, đồ họa, âm thanh, phim ảnh & các CT thực hiện Khuynh hướng phát triển của cơ sở dữ liệu CSDL & Web 45 A Hypermedia Database Khuynh hướng phát triển của cơ sở dữ liệu 46 Database server  Máy tính trong môi trường client/server chạy Hệ QT CSDL để xử lý các lệnh SQL & thực hiện các công việc quản trị CSDL Application server  Phần mềm kiểm soát tất cả các hoạt động ứng dụng CSDL & Web Khuynh hướng phát triển của cơ sở dữ liệu 47 Kết nối CSDL nội bô tới trang Web Khuynh hướng phát triển của cơ sở dữ liệu 48