Bảng truy vấn cụ thể hóa (MQT) là một bảng được xác định dựa trên kết quả của một truy vấn.
Các dữ liệu được chứa trong MQT có nguồn gốc từ một hoặc nhiều bảng mà dựa vào chúng,
người ta cụ thể hoá định nghĩa của bảng truy vấn. Bảng Tóm tắt (hoặc bảng tóm tắt tự động,
AST), quen thuộc với những người sử dụng cơ sở dữ liệu thông dụng DB2 (UDB) của IBM
trong Linux, UNIX, và Windows (DB2 UDB), được coi là dạng đặc biệt của MQT. Việc chọn
đầy đủ là một phần của định nghĩa của một bảng tóm tắt, chứa mệnh đề GROUP BY để tổng hợp
dữ liệu từ các bảng được tham chiếu trong câu chọn này.
Bạn có thể nghĩ MQT như một loại khung nhìn cụ thể hóa. Cả khung nhìn lẫn các MQT được
xác định dựa trên một truy vấn. Truy vấn mà trên đó khung nhìn dựa vào được chạy bất cứ khi
nào một khung nhìn được tham chiếu; tuy nhiên, trên thực tế MQT lưu giữ các kết quả truy vấn
làm dữ liệu, và bạn có thể làm việc với các dữ liệu ở trong MQT thay vì các dữ liệu ở trong các
bảng nêu ra.
8 trang |
Chia sẻ: lylyngoc | Lượt xem: 1467 | Lượt tải: 1
Bạn đang xem nội dung tài liệu Các khái niệm cơ bản của DB2: Giới thiệu các bảng truy vấn cụ thể hóa, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Các khái niệm cơ bản của DB2: Giới thiệu các bảng
truy vấn cụ thể hóa
Bảng truy vấn cụ thể hóa (MQT) là một bảng được xác định dựa trên kết quả của một truy vấn.
Các dữ liệu được chứa trong MQT có nguồn gốc từ một hoặc nhiều bảng mà dựa vào chúng,
người ta cụ thể hoá định nghĩa của bảng truy vấn. Bảng Tóm tắt (hoặc bảng tóm tắt tự động,
AST), quen thuộc với những người sử dụng cơ sở dữ liệu thông dụng DB2 (UDB) của IBM
trong Linux, UNIX, và Windows (DB2 UDB), được coi là dạng đặc biệt của MQT. Việc chọn
đầy đủ là một phần của định nghĩa của một bảng tóm tắt, chứa mệnh đề GROUP BY để tổng hợp
dữ liệu từ các bảng được tham chiếu trong câu chọn này.
Bạn có thể nghĩ MQT như một loại khung nhìn cụ thể hóa. Cả khung nhìn lẫn các MQT được
xác định dựa trên một truy vấn. Truy vấn mà trên đó khung nhìn dựa vào được chạy bất cứ khi
nào một khung nhìn được tham chiếu; tuy nhiên, trên thực tế MQT lưu giữ các kết quả truy vấn
làm dữ liệu, và bạn có thể làm việc với các dữ liệu ở trong MQT thay vì các dữ liệu ở trong các
bảng nêu ra.
Các bảng truy vấn cụ thể hóa có thể cải thiện một cách đáng kể hiệu suất của các truy vấn, đặc
biệt là các truy vấn phức tạp. Nếu như trình tối ưu xác định rằng một truy vấn hoặc một phần của
một truy vấn có thể được giải bằng cách sử dụng một MQT, thì truy vấn có thể được viết lại để
tận dụng lợi thế của MQT này.
Có thể xác định MQT ở thời gian tạo bảng vì được hệ thống hay người dùng duy trì. Các phần
tiếp theo sẽ giới thiệu cho bạn hai loại MQT, cũng như bảng tóm tắt và bảng phân tầng. Các ví
dụ sau đây yêu cầu kết nối tới cơ sở dữ liệu SAMPLE; nếu chưa có cơ sở dữ liệu SAMPLE trong
hệ thống, thì bạn có thể tạo ra nó bằng cách nhập lệnh db2sampl từ bất kỳ dấu nhắc lệnh nào.
Các MQT được duy trì bởi hệ thống
Các dữ liệu trong loại này của bảng truy vấn cụ thể hóa được duy trì bởi hệ thống. Khi bạn tạo
MQT loại này, thì bạn có thể xác định dữ liệu bảng sẽ là loại dữ liệu REFRESH IMMEDIATE
(làm mới ngay) hoặc REFRESH DEFERRED (làm mới sau). Từ khóa REFRESH cho phép bạn
xác định cách dữ liệu được được duy trì. Làm mới sau có nghĩa là các dữ liệu trong bảng có thể
được làm mới bất kỳ lúc nào bằng cách sử dụng câu lệnh REFRESH TABLE. Các MQT, dù là
làm mới ngay hoặc về sau, được hệ thống duy trì, cũng không cho phép các hoạt động chèn, cập
nhật, hoặc xóa được thực hiện đối với chính chúng. Tuy nhiên, các MQT với REFRESH
IMMEDIATE được hệ thống duy trì được cập nhật với các thay đổi trên bảng nêu ra như kết quả
của các phép chèn, cập nhật, hoặc xóa.
Liệt kê 1 cho thấy ví dụ tạo ra một MQT REFRESH IMMEDIATE được hệ thống duy trì. Bảng
có tên EMP dựa trên các bảng EMPLOYEE và DEPARTMENT kể ra trong cơ sở dữ liệu
SAMPLE. Vì các MQT với REFRESH IMMEDIATE yêu cầu rằng ít nhất một khóa đơn từ mỗi
bảng được tham chiếu trong truy vấn xuất hiện trong danh sách chọn, trước tiên ta xác định một
ràng buộc đơn trên cột EMPNO trong bảng EMPLOYEE và trên cột DEPTNO trong bảng
DEPARTMENT. Mệnh đề DATA INITIALLY DEFERRED đơn giản ngầm ý các dữ liệu sẽ
không được chèn vào bảng như là một phần của câu lệnh CREATE TABLE. Sau khi được tạo,
MQT ở trạng thái chờ kiểm tra (xem bảng Demystifying và các trạng thái của không gian bảng),
và không thể được truy vấn cho đến khi câu lệnh SET INTEGRITY thực hiện đối với nó. Mệnh
đề IMMEDIATE CHECKED quy định rằng dữ liệu được kiểm tra đối với truy vấn xác định của
MQT và được làm mới; mệnh đề NOT INCREMENTAL định rằng việc kiểm tra tính toàn vẹn
được thực hiện trên toàn bộ bảng. Một truy vấn được thực hiện đối với bảng truy vấn cụ thể hóa
EMP cho thấy lúc này nó được điền đầy đủ dữ liệu.
Liệt kê 1. Tạo một MQT được hệ thống duy trì
connect to sample
...
alter table employee add unique (empno)
alter table department add unique (deptno)
create table emp as (select e.empno, e.firstnme, e.lastname, e.phoneno,
d.deptno,
substr(d.deptname, 1, 12) as department, d.mgrno from employee e, department
d
where e.workdept = d.deptno)
data
initially deferred refresh immediate set integrity for emp immediate
checked not
incremental
select * from emp
EMPNO FIRSTNME LASTNAME PHONENO DEPTNO DEPARTMENT MGRNO
------ ------------ --------------- ------- ------ ------------ ------
000010 CHRISTINE HAAS 3978 A00 SPIFFY COMPU 000010
000020 MICHAEL THOMPSON 3476 B01 PLANNING 000020
000030 SALLY KWAN 4738 C01 INFORMATION 000030
000050 JOHN GEYER 6789 E01 SUPPORT SERV 000050
000060 IRVING STERN 6423 D11 MANUFACTURIN 000060
000070 EVA PULASKI 7831 D21 ADMINISTRATI 000070
000090 EILEEN HENDERSON 5498 E11 OPERATIONS 000090
000100 THEODORE SPENSER 0972 E21 SOFTWARE SUP 000100
000110 VINCENZO LUCCHESSI 3490 A00 SPIFFY COMPU 000010
000120 SEAN O'CONNELL 2167 A00 SPIFFY COMPU 000010
000130 DOLORES QUINTANA 4578 C01 INFORMATION 000030
...
000340 JASON GOUNOT 5698 E21 SOFTWARE SUP 000100
32 record(s) selected.
connect reset
Về đầu trang
Các MQT được duy trì bởi người dùng
Các dữ liệu trong loại này của bảng truy vấn cụ thể hóa được người dùng duy trì. Chỉ có bảng
truy vấn cụ thể hóa REFRESH DEFERRED có thể được định nghĩa là MAINTAINED BY
USER, được người dùng duy trì. Câu lệnh REFRESH TABLE (sử dụng cho các MQT do hệ
thống duy trì) không thể dùng với các MQT do người sử dụng duy trì. Các MQT được người
dùng duy trì cho phép thực hiện các hoạt động chèn, cập nhật, hoặc xóa với chúng.
Liệt kê 2 cho thấy ví dụ tạo ra một MQT với REFRESH DEFERRED do người sử dụng duy trì.
Bảng tên là ONTARIO_1995_SALES_TEAM dựa trên các bảng EMPLOYEE và SALES trong
cơ sở dữ liệu SAMPLE. Như trên, mệnh đề DATA INITIALLY DEFERRED ngầm ý dữ liệu sẽ
không được chèn vào bảng như là một phần của câu lệnh CREATE TABLE. Sau khi được tạo,
MQT ở trạng thái chờ kiểm tra (Xem bảng Demystifying và các tình trạng của không gian bảng),
và không thể được truy vấn cho đến khi thực hiện câu lệnh SET INTEGRITY với nó. Mệnh đề
MATERIALIZED QUERY IMMEDIATE UNCHECKED quy định bảng phải bật chức năng
kiểm tra tính toàn vẹn, nhưng là để được đưa ra khỏi tình trạng chờ kiểm tra mà không bị kiểm
tra việc vi phạm tính toàn vẹn.
Tiếp theo, để điền một số dữ liệu vào MQT, chúng ta sẽ đưa vào các dữ liệu được xuất từ các
bảng EMPLOYEE và SALES. Truy vấn xuất phù hợp với truy vấn xác định cho MQT này. Sau
đó chúng ta sẽ chèn bản ghi khác vào bảng ONTARIO_1995_SALES_TEAM.
Truy vấn thực hiện đối với bảng truy vấn cụ thể hóa ONTARIO_1995_SALES_TEAM cho thấy
lúc này nó chưa được điền đầy đủ các dữ liệu nhập vào và đưa vào, chứng tỏ rằng các MQT
được người sử dụng duy trì thực sự có thể được sửa đổi trực tiếp.
Liệt kê 2. Tạo một MQT do người sử dụng duy trì
connect to sample
...
create table ontario_1995_sales_team as (select distinct e.empno, e.firstnme,
e.lastname, e.workdept, e.phoneno, 'Ontario' as region,
year(s.sales_date) as year from employee e, sales s
where e.lastname = s.sales_person and year(s.sales_date) = 1995
and left(s.region, 3) = 'Ont')
data
initially deferred refresh deferred maintained by user set integrity for
ontario_1995_sales_team materialized query immediate
unchecked
export to ontario_1995_sales_team.del of del
select distinct e.empno, e.firstnme, e.lastname, e.workdept, e.phoneno,
'Ontario' as region, year(s.sales_date) as year from employee e,
sales s
where e.lastname = s.sales_person and year(s.sales_date) = 1995
and left(s.region, 3) = 'Ont'
...
Number of rows exported: 2
import from ontario_1995_sales_team.del of del insert into
ontario_1995_sales_team
...
Number of rows committed = 2
insert into ontario_1995_sales_team
values ('006900', 'RUSS', 'DYERS', 'D44', '1234', 'Ontario', 1995)
select * from ontario_1995_sales_team
EMPNO FIRSTNME LASTNAME WORKDEPT PHONENO REGION YEAR
------ ------------ --------------- -------- ------- ------- -----------
000110 VINCENZO LUCCHESSI A00 3490 Ontario 1995
000330 WING LEE E21 2103 Ontario 1995
006900 RUSS DYERS D44 1234 Ontario 1995
3 record(s) selected.
connect reset
Về đầu trang
Bảng tóm tắt
Bạn nhớ lại bảng tóm tắt là loại bảng MQT đặc biệt mà lựa chọn đầy đủ chứa mệnh đề GROUP
BY nhằm tóm tắt các dữ liệu từ các bảng được tham chiếu bằng trong câu lựa chọn. Liệt kê 3 là
một ví dụ đơn giản để tạo bảng tóm tắt. Bảng tên là SALES_SUMMARY dựa trên bảng SALES
nêu ra trong cơ sở dữ liệu SAMPLE. Và mệnh đề DATA INITIALLY DEFERRED có nghĩa dữ
liệu sẽ không được chèn vào bảng như là một phần của câu lệnh CREATE TABLE. Mệnh đề
DATA INITIALLY DEFERRED ngầm định dữ liệu trong bảng có thể được làm mới bất kỳ lúc
nào bằng cách sử dụng câu lệnh REFRESH TABLE. Một truy vấn cho MQT ngay sau khi nó
được tạo, nhưng trước khi sử dụng câu REFRESH TABLE sẽ gây lỗi. Sau khi câu lệnh
REFRESH TABLE thực hiện, truy vấn chạy thành công.
Hoạt động chèn sau đó vào bảng SALES, sau việc làm mới bảng tóm tắt và một truy vấn đối với
các bảng tóm tắt, cho thấy thay đổi đối với bảng nêu ra được thể hiện trong bảng tóm tắt: tổng
doanh số của nhân viên bán hàng Lee trong khu vực Nam Ontario đã tăng lên 100. Ta có thể thấy
hành vi tương tự ứng với việc cập nhật hoặc xóa trong bảng SALES kể ra.
Ví dụ 3. Tạo một bảng tóm tắt
connect to sample
...
create table sales_summary as (select sales_person, region, sum(sales)
as total_sales
from sales group
by sales_person, region)
data initially deferred refresh
deferred
select * from sales_summary
SALES_PERSON REGION TOTAL_SALES
--------------- --------------- -----------
SQL0668N Operation not allowed for reason code "1" on table
"MELNYK.SALES_SUMMARY". SQLSTATE=57016
refresh table sales_summary
select * from sales_summary
SALES_PERSON REGION TOTAL_SALES
--------------- --------------- -----------
GOUNOT Manitoba 15
GOUNOT Ontario-North 1
GOUNOT Ontario-South 10
GOUNOT Quebec 24
LEE Manitoba 23
LEE Ontario-North 8
LEE Ontario-South 34
LEE Quebec 26
LUCCHESSI Manitoba 3
LUCCHESSI Ontario-South 8
LUCCHESSI Quebec 3
11 record(s) selected.
insert
into
sales values ('06/28/2005', 'LEE', 'Ontario-South', 100)
refresh table sales_summary
select * from sales_summary
SALES_PERSON REGION TOTAL_SALES
--------------- --------------- -----------
...
LEE Ontario-North 8
LEE Ontario-South 134
LEE Quebec 26
...
11 record(s) selected.
update
sales set sales = 50 where sales_date = '06/28/2005' and
sales_person = 'LEE'
and region = 'Ontario-South'
refresh table sales_summary
select * from sales_summary
SALES_PERSON REGION TOTAL_SALES
--------------- --------------- -----------
...
LEE Ontario-North 8
LEE Ontario-South 84
LEE Quebec 26
...
11 record(s) selected.
delete
from
sales where sales_date = '06/28/2005' and sales_person = 'LEE'
and region = 'Ontario-South'
refresh table sales_summary
select * from sales_summary
SALES_PERSON REGION TOTAL_SALES
--------------- --------------- -----------
...
LEE Ontario-North 8
LEE Ontario-South 34
LEE Quebec 26
...
11 record(s) selected.
connect reset
Về đầu trang
Các bảng phân tầng
Bạn có thể làm mới nhiều lên với MQT có REFRESH DEFERRED nếu nó có một bảng phân
tầng gắn liền với nó. Bảng phân tầng thu thập những thay đổi cần được áp dụng để đồng bộ
MQT với các bảng đi kèm. Bạn có thể tạo bảng phân tầng bằng cách sử dụng câu lệnh CREATE
TABLE; rồi khi các bảng kể ra của MQT được sửa đổi, các thay đổi được truyền và ngay lập tức
nối vào bảng phân tầng. Ý tưởng là sử dụng bảng phân tầng để từng bước làm mới MQT, hơn là
tái tạo MQT từ đầu. Sự bảo trì gia tăng đảm bảo hiệu suất được cải thiện đáng kể. Bảng phân
tầng được lược bớt đi khi các hoạt động làm mới hoàn tất.
Sau khi được tạo, bảng phân tầng ở trong trạng thái chờ (không bền); nó phải được đưa ra khỏi
trạng thái này trước khi nó có thể bắt đầu thu thập các thay đổi trên các bảng nêu ra. Bạn có thể
thực hiện điều này bằng cách sử dụng câu lệnh SET INTEGRITY.
Liệt kê 4 cho thấy ví dụ về cách sử dụng bảng phân tầng với bảng tóm tắt. Bảng tóm tắt tên là
EMP_SUMMARY dựa trên bảng nêu ra EMPLOYEE trong cơ sở dữ liệu SAMPLE. Bạn sẽ nhớ
lại rằng mệnh đề DATA INITIALLY DEFERRED có nghĩa là dữ liệu sẽ không được chèn vào
bảng như là một phần của câu lệnh CREATE TABLE. Mệnh đề REFRESH DEFERRED với
nghĩa các dữ liệu trong bảng có thể được làm mới bất kỳ lúc nào bằng cách sử dụng câu lệnh
REFRESH TABLE. Bảng phân tầng tên là EMP_SUMMARY_S kết hợp với bảng tóm tắt
EMP_SUMMARY. Mệnh đề PROPAGATE IMMEDIATE quy định rằng bất kỳ thay đổi nào
đối với bảng nêu ra như phần của chèn, cập nhật, hoặc xóa sẽ được xếp tầng vào bảng phân tầng
này. Câu lệnh SET INTEGRITY được dùng cho cả hai bảng để đưa chúng ra khỏi trạng thái chờ.
Không bất ngờ khi truy vấn đối với bảng tóm tắt tại lúc này không cho về dữ liệu nào. Câu lệnh
REFRESH TABLE cho ra cảnh báo, nhắc rằng "tính toàn vẹn của dữ liệu không gia tăng vẫn
chưa được xác minh." Đây không là điều bất ngờ. Một truy vấn khác đối với các bảng tóm tắt
cũng không cho ra dữ liệu. Tuy nhiên, sau khi chúng ta chèn một hàng mới của dữ liệu vào bảng
EMPLOYEE nêu ra, truy vấn đối với bảng phân tầng EMP_SUMMARY_S trả về một hàng,
tương ứng với dữ liệu vừa mới được chèn vào. Bảng phân tầng cũng có ba cột giống như bảng
tóm tắt bên dưới của nó, cộng thêm hai cột được hệ thống sử dụng: GLOBALTRANSID (ID của
sự giao tác tổng thể đối với mỗi hàng được nhân lên) và GLOBALTRANSTIME (dấu thời gian
của giao tác). Truy vấn khác đối với bảng tóm tắt không cho ra dữ liệu, nhưng sau khi câu lệnh
REFRESH TABLE thực hiện lần này, thì truy vấn chạy thành công.
Liệt kê 4. Sử dụng bảng phân tầng với bảng tóm tắt
connect to sample
...
create table emp_summary as (select workdept, job, count(*) as count
from employee group
by workdept, job)
data initially deferred refresh deferred create table emp_summary_s
for emp_summary propagate immediate set integrity
for emp_summary materialized query immediate
unchecked set integrity for emp_summary_s staging immediate unchecked
select * from emp_summary
WORKDEPT JOB COUNT
-------- -------- -----------
0 record(s) selected.
refresh table emp_summary
SQL1594W Integrity of non-incremental data remains unverified by the
database manager. SQLSTATE=01636
select * from emp_summary
WORKDEPT JOB COUNT
-------- -------- -----------
0 record(s) selected.
insert into employee
values ('006900', 'RUSS', 'L', 'DYERS', 'D44', '1234', '1960-05-05',
'FIELDREP', 5, 'M', '1940-04-02', 10000, 100, 1000)
select * from emp_summary_s
WORKDEPT JOB COUNT GLOBALTRANSID GLOBALTRANSTIME
-------- -------- ----------- -------------------... ------------------------
-----...
D44 FIELDREP 1 x'00000000000000CD'
x'20050822201344536158000000'
1 record(s) selected.
select * from emp_summary
WORKDEPT JOB COUNT
-------- -------- -----------
0 record(s) selected.
refresh table emp_summary
SQL1594W Integrity of non-incremental data remains unverified by the
database
manager. SQLSTATE=01636
select * from emp_summary
WORKDEPT JOB COUNT
-------- -------- -----------
D44 FIELDREP 1
1 record(s) selected.
connect reset