Tìm kiếm văn bản của DB2, Phần 1: Tìm kiếm toàn văn bản

Tìm kiếm văn bản của DB2 là một thành phần tích hợp của DB2 9.5 và do máy chủ IBM OmniFind™ Text Search (Tìm kiếm văn bản OmniFind của IBM) cung cấp. Nó cung cấp các tính năng sau đây:  Tìm kiếm toàn văn bản trong các tài liệu văn bản, HTML và XML, gồm cả tìm kiếm theo logic Bun (Boolean) và ký t ự đại diện.  Hỗ trợ SQL, SQL/XML và Xquery tích hợp đầy đủ, gồm cả tập con cú pháp XPath để tìm kiếm các tài liệu XML.  Xử lý ngôn ngữ với định nghĩa các từ đồng nghĩa tùy chọn.  Cập nhật chỉ mục không đồng bộ với tùy chọn lập lịch biểu.

pdf5 trang | Chia sẻ: lylyngoc | Lượt xem: 1758 | Lượt tải: 1download
Bạn đang xem nội dung tài liệu Tìm kiếm văn bản của DB2, Phần 1: Tìm kiếm toàn văn bản, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Tìm kiếm văn bản của DB2, Phần 1: Tìm kiếm toàn văn bản Tìm kiếm văn bản của DB2 là một thành phần tích hợp của DB2 9.5 và do máy chủ IBM OmniFind™ Text Search (Tìm kiếm văn bản OmniFind của IBM) cung cấp. Nó cung cấp các tính năng sau đây:  Tìm kiếm toàn văn bản trong các tài liệu văn bản, HTML và XML, gồm cả tìm kiếm theo logic Bun (Boolean) và ký tự đại diện.  Hỗ trợ SQL, SQL/XML và Xquery tích hợp đầy đủ, gồm cả tập con cú pháp XPath để tìm kiếm các tài liệu XML.  Xử lý ngôn ngữ với định nghĩa các từ đồng nghĩa tùy chọn.  Cập nhật chỉ mục không đồng bộ với tùy chọn lập lịch biểu. Hướng dẫn này trình bày cách sử dụng các tính năng cơ bản trong Tìm kiếm văn bản của DB2 để tìm kiếm trong các tài liệu văn bản thuần và các tài liệu XML được lưu trữ trong cơ sở dữ liệu và hướng dẫn bạn qua các nhiệm vụ sau đây:  Chuẩn bị thiết lập cơ sở dữ liệu.  Tạo các chỉ mục tìm kiếm-văn bản cho các tài liệu dữ liệu văn bản và các tài liệu XML.  Điền các chỉ mục tìm kiếm-văn bản.  Tìm kiếm trong văn bản thuần.  Xác định mối liên quan trong các kết quả.  Tìm kiếm trong các tài liệu XML.  Cập nhật các chỉ mục tìm kiếm-văn bản.  Kết thúc công việc. Về đầu trang Các yêu cầu và các điều kiện tiên quyết về hệ thống Để hoàn thành các bước sau, ít nhất là bạn phải có bản vá lỗi 1 (Fix Pack 1), phiên bản DB2 9.5 cho Linux, UNIX và Windows đã cài đặt trên hệ thống. Lưu ý rằng bạn không thể sử dụng Tìm kiếm văn bản của DB2 trong một môi trường cơ sở dữ liệu phân vùng trên một cá thể DB2 có nhiều phân vùng. Để đi qua hết hướng dẫn này khi sử dụng cách tiếp cận theo từng bước một, có thể thực hiện các lệnh như các lệnh tương tác CLP (Bộ xử lý dòng lệnh) của DB2 khi sử dụng lệnh db2 -t. Các lệnh quản trị chỉ mục tìm kiếm văn bản db2ts phải được chạy tại dấu nhắc của hệ điều hành. Tuy nhiên, các lệnh này có thể được thực hiện trong cùng một cửa sổ bằng cách sử dụng lệnh shell (!). Trong chế độ này, mọi câu lệnh cũng sẽ phải sử dụng ký tự kết thúc câu lệnh — là một dấu chấm phẩy (;). Để chạy các ví dụ trong bài này, hãy chắc chắn rằng bạn có quyền hạn DBADM trên máy chủ cơ sở dữ liệu DB2 mà bạn muốn sử dụng. Nếu bạn tạo ra cơ sở dữ liệu như được mô tả trong phần tiếp theo, quyền hạn này được gán tự động. Quyền hạn DBADM là cần thiết để quản lý các dịch vụ cá thể tìm kiếm-văn bản và để tạo và sửa đổi cơ sở dữ liệu được sử dụng trong các ví dụ Các bước thiết lập một cơ sở dữ liệu thử nghiệm 1. Quy định cơ sở dữ liệu mặc định. Tìm kiếm văn bản của DB2 cung cấp tùy chọn để thiết lập một biến môi trường quy định cơ sở dữ liệu nên được sử dụng cho các lệnh quản trị chỉ mục tìm kiếm-văn bản. Nếu các quyền hạn cần thiết của người dùng có sẵn để sử dụng, bạn có thể ban hành lệnh db2ts mà không cần chỉ rõ một mệnh đề connection (kết nối). Có thể thiết lập biến môi trường như sau: Liệt kê 1. Thiết lập DB2DBDFT để xác định cơ sở dữ liệu mặc định Linux/UNIX (ksh): export DB2DBDFT=mytstest Windows: SET DB2DBDFT=mytstest 2. Tạo một cơ sở dữ liệu. Trong bước này, tạo ra một cơ sở dữ liệu, thích hợp để lưu trữ các tài liệu XML. Hãy ban hành lệnh sau tại dấu nhắc lệnh CLP của DB2: Liệt kê 2. Lệnh để tạo cơ sở dữ liệu CREATE DATABASE mytstest USING CODESET UTF-8 TERRITORY US 3. Khởi động các dịch vụ cá thể tìm kiếm-văn bản. Để khởi động các dịch vụ cá thể tìm kiếm-văn bản, hãy sử dụng lệnh sau: Liệt kê 3. Lệnh để khởi động các dịch vụ cá thể tìm kiếm-văn bản db2ts "START FOR TEXT" Trên các hệ điều hành Linux và UNIX, lệnh này khởi động một trình tiện ích (daemon). Trình tiện ích này điều khiển lập lịch biểu các cập nhật chỉ mục tìm kiếm-văn bản trên máy chủ cơ sở dữ liệu DB2. Máy chủ tìm kiếm văn bản cũng được khởi động và chạy như một quá trình độc lập. Hãy khởi động trình tiện ích (daemon) và máy chủ tìm kiếm văn bản dưới tên ủy quyền của chủ sở hữu cá thể DB2. Trên các hệ điều hành Windows, lệnh này khởi động dịch vụ DB2TS. Dịch vụ DB2TS khởi động máy chủ tìm kiếm văn bản và từ đó điều khiển lập lịch biểu các cập nhật chỉ mục tìm kiếm-văn bản. Người dùng đang chạy lệnh này phải đáp ứng các yêu cầu của Windows về khởi động một dịch vụ. 4. Kích hoạt cơ sở dữ liệu để tìm kiếm văn bản. Tìm kiếm văn bản của DB2 quản lý thông tin về các chỉ mục tìm kiếm-văn bản để hỗ trợ các nhiệm vụ quản trị như các cập nhật chỉ mục hoặc tình trạng thu thập dữ liệu. Việc kích hoạt cơ sở dữ liệu sẽ tạo ra các bảng và các khung nhìn hệ thống có chứa thông tin này. Liệt kê 4. Lệnh để chạy cơ sở dữ liệu cho việc tìm kiếm văn bản db2ts "ENABLE DATABASE FOR TEXT" Lưu ý rằng nếu DB2DBDFT chưa được thiết lập, các lệnh kích hoạt cần kèm theo thông tin kết nối, như hiển thị trong ví dụ sau đây: Liệt kê 5. Lệnh để kích hoạt cơ sở dữ liệu cho văn bản có thông tin kết nối cụ thể db2ts "ENABLE DATABASE FOR TEXT CONNECT TO mytstest USER db2admin USING mypswd" 5. Kết nối tới cơ sở dữ liệu mytstest: Liệt kê 6. Kết nối tới cơ sở dữ liệu mytstest CONNECT TO mytstest 6. Tạo và điền vào một bảng: Liệt kê 7. Bảng books CREATE TABLE books ( isbn VARCHAR(18) NOT NULL PRIMARY KEY, author VARCHAR(30), title VARCHAR(128), year INTEGER, bookinfo XML) Lưu ý rằng để kích hoạt việc tạo các chỉ mục tìm kiếm-văn bản và chạy các truy vấn tìm kiếm-văn bản, cần phải quy định một khóa chính cho bảng dữ liệu. 7. Chèn dữ liệu sau đây vào bảng books: Liệt kê 8. Chèn dữ liệu vào bảng books INSERT INTO books VALUES ('123-014014014', 'Joe Climber', 'Climber''s Mountain Tops', 1995, XMLPARSE(DOCUMENT ' Joe Climber Climber''s Mountain Tops This vivid description of Joe Climber''s experiences when tackling the mountains of his native Mountainland lets you hold your breath when you follow Joe on his adventures in the regions where the air is thin and the weather is treacherous. Includes beautiful color photos of Mountainland''s mountain ranges. 1995 16.00 176 ')) INSERT INTO books VALUES ('678-014014078', 'Joe Smith', 'The Range', 1991, XMLPARSE(DOCUMENT ' Joe Smith The Range All you need to know about kitchen ranges. A pictured description based on the most recent ergonomics studies for everybody who is involved in food preparation in the home. 1991 6.00 76 ')) INSERT INTO books VALUES ('111-223334444', 'Sam Climber', 'Top of the Mountain: Mountain Lore', 1966, XMLPARSE(DOCUMENT ' Sam Climber Top of the Mountain: Mountain Lore Sam Climber has traveled through the world to gather stories about mountains. This compendium includes the best stories and is beautifully illustrated. 1966 20.00 449 ')) INSERT INTO books VALUES ('777-010101010', 'Samantha Smitt', 'The Database Compendium', 2001, XMLPARSE(DOCUMENT ' Samantha Smitt The Database Compendium Follow Samantha into the world of database management. Covers a wide range of the most popular database architectures. 2001 19.00 222 ')) INSERT INTO books VALUES ('123-918273645', 'Joanne Miller', 'The Travel Companion', 2005, XMLPARSE(DOCUMENT ' Joanne Miller The Travel Companion If you like to travel, this is the book for you. Joanne Miller has compiled her funny and often surprising diary entries about places and people which were previously published as travel log in ''Here and There'' 2005 31.00 321 '))