Mục đích của hướng dẫn này là giới thiệu một phương pháp để phát triển các mô hình ánh xạ cho
các dự án kho dữ liệu (DWH) khi sử dụng chức năng có sẵn trong InfoSphere Data Architect
(IDA), Phiên bản 7.5.2. Việc thiết kế các ánh xạ cho quá trình trích xuất, chuyển đổi và tải dữ
liệu (ETL) là một phần vô cùng quan trọng của mỗi dự án kho dữ liệu. Do đó cần lưu trữ thiết kế
các ánh xạ này theo một định dạng đáp ứng một số yêu cầu như sau:
Có thể dễ dàng thay đổi ánh xạ.
Có thể tạo phiên bản các thay đổi.
Dễ dàng báo cáo các ánh xạ.
Có thể xuất khẩu sang các định dạng khác.
4 trang |
Chia sẻ: lylyngoc | Lượt xem: 1792 | Lượt tải: 1
Bạn đang xem nội dung tài liệu Phát triển các mô hình ánh xạ với InfoSphere Data Architect của IBM, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Phát triển các mô hình ánh xạ với InfoSphere Data
Architect của IBM
Giới thiệu
Mục đích của hướng dẫn này là giới thiệu một phương pháp để phát triển các mô hình ánh xạ cho
các dự án kho dữ liệu (DWH) khi sử dụng chức năng có sẵn trong InfoSphere Data Architect
(IDA), Phiên bản 7.5.2. Việc thiết kế các ánh xạ cho quá trình trích xuất, chuyển đổi và tải dữ
liệu (ETL) là một phần vô cùng quan trọng của mỗi dự án kho dữ liệu. Do đó cần lưu trữ thiết kế
các ánh xạ này theo một định dạng đáp ứng một số yêu cầu như sau:
Có thể dễ dàng thay đổi ánh xạ.
Có thể tạo phiên bản các thay đổi.
Dễ dàng báo cáo các ánh xạ.
Có thể xuất khẩu sang các định dạng khác.
Bạn sẽ tìm hiểu trong hướng dẫn này cách có thể đạt được các mục tiêu trên với IDA. Hướng dẫn
này mô tả tất cả các bước cần thiết để xây dựng mô hình ánh xạ đầu tiên của bạn và để tạo ra một
báo cáo cho mô hình này. Các bước mức cao là:
1. Tạo một dự án trong IDA.
2. Tạo mô hình dữ liệu nguồn (bằng cách sử dụng cơ sở dữ liệu SAMPLE của DB2).
3. Tạo mô hình dữ liệu đích.
4. Tạo các ánh xạ giữa các bảng nguồn và đích.
5. Phân tích mô hình của bạn bằng cách sử dụng các chức năng báo cáo.
Hướng dẫn này mô tả chi tiết từng bước trong năm bước trên. Cuối cùng, bạn sẽ có báo cáo ánh
xạ có ý nghĩa đầu tiên của mình theo định dạng PDF bằng cách sử dụng chức năng thừa hưởng
của công cụ IDA.
Tổng quan về sản phẩm và các điều kiện tiên quyết
InfoSphere Data Architect của IBM (trước đây gọi là Rational Data Architect - Kiến trúc sư dữ
liệu Rational) là một công cụ mô hình hóa và thiết kế tích hợp dữ liệu doanh nghiệp cung cấp
một giải pháp thiết kế dữ liệu hợp tác mà bạn có thể sử dụng để khám phá, mô hình hóa, thiết lập
quan hệ và tiêu chuẩn hóa các tài sản dữ liệu đa dạng và phân tán.
IDA dựa trên một sự tích hợp Eclipse chuẩn-mở.
Để làm theo toàn bộ hướng dẫn này bạn cần phải cài đặt như sau:
Phiên bản 7.5.2 của InfoSphere Data Architect.
IBM DB2 9.7 Enterprise Server Edition (Ấn bản Máy chủ doanh nghiệp DB2 9.7 của
IBM) với cơ sở dữ liệu mẫu của nó.
Cài đặt một cá thể của IBM DB2 Enterprise Edition (Ấn bản doanh nghiệp DB2 của
IBM) và cơ sở dữ liệu mẫu tiêu chuẩn và có thể truy cập trên cùng một máy tính.
Xem phần Tài nguyên để biết các liên kết đến các phiên bản dùng thử của cả hai DB2 và IDA.
Tạo một dự án trong IDA
Tất cả công việc thiết kế cần làm trong IDA được nhóm lại thành các dự án. Trong phần này, bạn
sẽ tìm hiểu cách sử dụng trình hướng dẫn của IDA để tạo ra một dự án mới cho mô hình ánh xạ
của bạn. Hãy hoàn thành các bước sau để tạo một dự án mới.
1. Chọn File > New > Project từ thanh trình đơn của IDA. Việc này khởi chạy trình hướng
dẫn New Project (Dự án mới) để giúp bạn tạo một dự án mới trong bàn làm việc, như
trong Hình 1.
Hình 1. Tạo một dự án mới
2. Duyệt qua danh sách các dự án và mở các thư mục để thấy tất cả các kiểu dự án mà bạn
có thể tạo ra. Để hỗ trợ xác định vị trí của một trình hướng dẫn cụ thể, có thể sử dụng
trường văn bản để chỉ hiển thị các trình hướng dẫn phù hợp với văn bản đã nhập.
3. Nhập data làm một từ khóa trong trường văn bản để hạn chế danh sách các dự án.
4. Chọn Data Design Project (Dự án thiết kế dữ liệu). Trình hướng dẫn Data Design khởi
chạy, như trong Hình 2. Trình hướng dẫn này hướng dẫn bạn qua các bước cài đặt cơ
bản.
Hình 2. Trình hướng dẫn Data Design Project
5. Nhấn Next.
6. Nhập một tên mới cho dự án, như là MyMappingTutorial, như trong Hình 3 và nhấn
Finish.
Hình 3. Đặt tên cho dự án thiết kế dữ liệu
7. Nhấn Yes khi được nhắc để mở phối cảnh dữ liệu.
Hình 4. Mở phối cảnh có liên quan
Bây giờ dự án mới của bạn đã sẵn sàng.