Các tập dữ liệu chứa các thông tin liên quan
đến một cơ quan, một tổ chức, một chuyên ngành
khoa học tự nhiên, xã hội được lưu trữ trong máy
tính theo một quy định nào đó cho phép người sử
dụng truy xuất hoặc sửa đổi tập tin ( data base).
48 trang |
Chia sẻ: lylyngoc | Lượt xem: 1742 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu Chương II: Tổng quan về cơ sở dữ liệu trong hệ thống thông tin địa lý, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Ch−¬ng II: Tæng quan vÒ c¬ së d÷
liÖu trong hÖ thèng th«ng tin ®Þa lý
1
1/5/2013
II.1.1.ĐN:
Các tập dữ liệu chứa các thông tin liên quan
đến một cơ quan, một tổ chức, một chuyên ngành
II.1. Hệ cơ sở dữ liệu (CSDL):
1/5/2013
2
khoa học tự nhiên, xã hội được lưu trữ trong máy
tính theo một quy định nào đó cho phép người sử
dụng truy xuất hoặc sửa đổi tập tin ( data base).
II.1.2.Hệ quản trị cơ sở dữ liệu
(HQTCSDL)
ĐN : Là phần chương trình để có thể xử lý, thay đổi
các tập dữ liệu .
Nhiệm vụ: Cung cấp cách lưu trữ, truy vấn thông
1/5/2013
3
tin trong cơ sở dữ liệu sao cho vừa thuận lợi vừa
hiệu quả.
Một số hệ quản trị hiện nay: database, SQL server,
micrsoft Access, posgis
Định nghĩa dữ liệu
Xây dựng dữ liệu
1/5/2013
4
Thao tác dữ liệu
Quản trị dữ liệu
Bảo vệ dữ liệu
II.1.3.Mô hình CSDL
1. Mô hình phân cấp (hierarchical models)
Là sự kết hợp của nhiều cấp độ cơ bản có liên
quan, trong thực tế nó là một cây theo thứ tự.
1/5/2013
5
Nhược điểm:
Có nhiều dư thừa dữ liệu trong tập dữ liệu
này sang một dữ liệu khác.
1/5/2013
6
Hình Biểu diễn bản đồ A bằng mô hình phân cấp
Trường
Khoa
1/5/2013
7
Môn học
Giảng viênSinh viên
2.Mô hình mạng(Network model)
Là tập hợp các mức độ cơ bản đã được
kết nối, loại cấu trúc này được xem như là
cấu trúc phân cấp có nhiều mạng kết nối.
Ưu điểm : Tiết kiệm thời gian tìm kiếm
1/5/2013
8
Nhược: Quan hệ giữa các dữ liệu phức
tạp,cấu trúc thì không thể nhìn thấy rõ
ràng
Dư thừa dữ liệu.
1/5/2013
9
Biểu diễn bản đồ A bằng mô hình lưới
Mô hình mạng
Trường
Khoa
1/5/2013
10
Môn học
Giảng viênSinh viên
Bảng đăng ký
Trong thực tế các dữ liệu thường không thể
mô tả chúng bằng mô hình phân cấp hoặc mô
hình mạng.
3. Mô hình quan hệ.
1/5/2013
11
Mô hình dữ liệu quan hệ dựa trên khái niệm
toán học với tên gọi (relation) và biểu diễn vật lý
là các bảng (table).
Mô hình quan hệ dữ liệu gồm 3 thành phần sau:
Cấu trúc dữ liệu (data structure) : Dữ liệu cấu
trúc theo dạng bảng bao gồm nhiều hàng và cột.
Ví dụ: cho bảng có tên sau “Quản lý SV”
ID Họ tên Điểm hoc tập Điểm rèn luyện
1/5/2013
12
110070001 Nguyễn Trường
6.7 Khá
110070002 Phan Thoại
7.0 Tốt
110070003 Lê Nguyễn Phương
8.9 Tốt
Thao tác dữ liệu ( data
manipulation) : Sử dụng ngôn ngữ
SQL để truy vấn dữ liệu chứa
trong bảng.
VD: Tìm mã sinh viên, họ tên sinh
1/5/2013
13
viên có điểm học tập ≥ 7.0 và
điểm rèn luyện thuộc loại “tốt”
ID Họ tên Điểm hoc tập Điểm rèn luyện
110070001 Nguyễn Trường
6.7 Khá
110070002 Phan Thoại
7.0 Tốt
1/5/2013
14
select ID, Họ tên from Quản lý SV
where Điểm học tập ≥ 7.0 and điểm rèn luyện = ‘tốt’
110070003 Lê Nguyễn Phương
8.9 Tốt
Toàn vẹn dữ liệu ( data
integrity): Các phương tiện dùng
để đặc tả các quy tắc nghiệp vụ
nhằm duy trì tính toàn vẹn của dữ
liệu khi thao tác
1/5/2013
15
- Trong mô hình quan hệ thì CSDL
được đặt trong các bảng có quan hệ với
nhau,
- Hệ QTCSDL có khả năng kết nối dữ
liệu từ nhiều bảng để tạo thành bảng duy
1/5/2013
16
nhất.
- Để phân biệt bảng ghi người ta chọn
ra một trường làm khóa chính ( khóa chính
không được trùng nhau hoặc rỗng)
Có 4 khả năng tồn tại giữa các bảng
- Quan hệ 1-1 :Khóa trường trong bảng là duy nhất,
không có sự trùng lặp trong các trường khóa
- Quan hệ nhiều - 1: cho phép bảng mới có nhiều
1/5/2013
17
giá trị trong trường khóa tương ứng của trường có
quan hệ của bảng hiện có.
- Quan hệ 1 – nhiều: Đòi hỏi trường khóa chính
của bảng mới là duy nhất nhưng khóa ngoại của
bảng mới có thể khớp với nhiều mục
- Quan hệ nhiều – nhiều : không có quan hệ tồn tại
giữa các trường khóa trong bảng
4. Mô hình quan hệ thực thể
(entity relationship model )
Mô hình này dựa trên quan niệm
về thế giới đối tượng được gọi là thực
thể, và mối quan hệ giữa chúng.Các
1/5/2013
18
thực thể mô tả trong CSDL bởi một
tập các thuộc tính
Ưu điểm: CSDL luôn nhất quán
Hỗ trợ thiết kế, tổ chức thông tin,
tương thích với mô hình quan hệ
5. Mô hình hướng đối tượng
Dựa trên cơ sở các gói dữ liệu
mà mã liên quan đến đối tượng.
Đây là mô hình hiện đại được
nhiều nước sử dụng và có nhiều
1/5/2013
19
ứng dụng trong ngôn ngữ lập trình
cũng như trong giải pháp về phần
cứng, phần mềm.
II.2.Cấu trúc CSDL trong GIS
CSDL chiếm khoảng 70 % giá trịHTTĐL
CSDL gồm 2 nhóm:
CSDL không gian
1/5/2013
20
CSDL thuộc tính
Hai loại dữ liệu này tuân theo một cấu
trúc hợp lý thuận lợi cho quản lý, lưu trữ,
sửa đổi, khai thác theo mục đích sử dụng.
Kho âng
g ian
Cô sô û d ö õ lie äu G IS
1/5/2013
21
CSDL trong gis
Thuo äc tín h
II.2.1. CƠ SỞ DỮ LIỆU KHÔNG GIAN
CSDL không gian: là CSDL có chứa
trong nó những thông tin về định
vị của đối tượng.
1/5/2013
22
Dữ liệu không gian có 3 dạng:
+) Dạng điểm:
+) Dạng đường:
+) Dạng vùng:
X,Y
X,Y
X,Y
X,Y
X,Y• Caáu tru ùc Vector
Caáu tru ùc Raster
1/5/2013
23
•
X,Y
Pixel
Coät
Doøng
Để quy các dữ liệu không gian về
3 loại trên , cần xác định:
- Vị trí của đối tượng
1/5/2013
24
- Đặc trưng của đối tượng
- Mối quan hệ giữa các đối tượng
Tất cả các yếu tố đối tượng trong HTTĐL đều
có thể được mô tả theo kiểu cấu trúc dữ liệu
vector và raster
A. Cấu trúc dữ liệu vector:
-) điểm : được mô tả bởi cặp tọa độ (x,y) trong
một hệ thống tọa độ nhất định
1/5/2013
25
Đặc điểm:
- Là toạ độ đơn (x,y)
- Không cần thể hiện chiều dài và diện tích
1/5/2013
26
Số liệu vector được biểu thị dưới dạng điểm (Point).
-) Dạng đường: Đường được xác định nhưmột tập
hợp dãy của các điểm
Đặc điểm:
• Là một dãy các cặp toạ độ
• Một arc bắt đầu và kết thúc bởi node
1/5/2013
27
• Các arc nối với nhau và cắt nhau tại node
• Hình dạng của arc được định nghĩa bởi các điểm
vertices
• Độ dài chính xác bằng các cặp toạ độ
1/5/2013
28
Số liệu vector được biểu thị dưới dạng Arc
-) Vùng:
Vùng được xác định bởi ranh giới các đường
thẳng. Các đối tượng địa lý có diện tích và đóng kín
bởi một đường được gọi là đối tượng vùng polygons
Đặc điểm:
- Polygons được mô tả bằng tập các đường (arcs) và
điểm nhãn (label points)
1/5/2013
29
- Một hoặc nhiều arc định nghĩa đường bao của vùng
- Một điểm nhãn label points nằm trong vùng để mô
tả, xác định cho mỗi một vùng.
B.Cấu trúc dữ liệu raster:
Mô hình dữ liệu dạng raster phản ánh toàn bộ vùng
nghiên cứu dưới dạng một lưới các ô vuông hay điểm ảnh
(pixcel).
Đặc điểm:
Mỗi một điểm ảnh (pixcel) chứa một giá trị.
Các điểm được xếp liên tiếp từ trái qua phải và từ trên xuống
1/5/2013
30
dưới.
Một tập các ma trận điểm và các giá trị tương ứng tạo
thành một lớp (layer).
Trong cơ sở dữ liệu có thể có nhiều lớp.
Mối liên hệ không gian giữa các đối
tượng trong mô hình topology
Điểm – điểm
Điểm - đường
Điểm - vùng
1/5/2013
31
Đường – đường
Đường - vùng
Vùng - vùng
Vùng – vùng đường – đường Đường - vùng
1/5/2013
32
1/5/2013
33
Nén ảnh là quá trình làm giảm lượng thông
tin dư thừa trong dữ liệu gốc.
Có 2 phương pháp nén:
1/5/2013
34
- Nén chính xác : Nén không mất thông tin,
phương pháp này cho ta chính xác dữ liệu gốc
sau khi nén.
- Nén có mất thông tin : Với dữ liệu này ta sẽ
không thu được dữ liệu như bản gốc sau khi nén.
ĐN: CSDL thuộc tính (dữ liệu phi không gian) :
Là cơ sở phản ánh tính chất của các đối tượng
khác nhau
1/5/2013
35
Đặc điểm:
+) Dữ liệu thuộc tính bao gồm:
- Dữ liệu định tính
- Dữ liệu định lượng.
+) Cấu trúc dữ liệu thuộc tính có dạng bảng:
Cột ( trường )
Giá trị
1/5/2013
36
Dòng
thuộc
tính
+) Ngoài ra dữ liệu không gian còn
bao gồm các hình thức trình bày
chuẩn của mỗi yếu tố ( màu sắc,
lực nét, kiểu đường…).
+) DL thuộc tính có thể nhập từ
1/5/2013
37
các bảng dữ liệu, các tệp văn bản,
hoặc từ các phần mềm khác.
Với cùng một đối tượng , có thể liên kết dữ
liệu không gian và dữ liệu thuộc tính .
Mối liên kết có thể được thực hiện bằng 2
1/5/2013
38
cách:
- Đặt dữ liệu thuộc tính vào đúng vị trí dữ liệu
không gian.
- Sắp xếp dữ liệu không gian và dữ liệu thuộc
tính theo cùng một trình tự, sau đó gán mã duy
nhất cho cả hai dữ liệu.
II.3.1. Thu thập dữ liệu
a. Thu thập dữ liệu địa lý:
-Thu thập dữ liệu bằng đo đạc mặt đất
1/5/2013
39
- Thu thập dữ liệu từ ảnh hàng không và ảnh vệ tinh
- Số hóa bản đồ đang có giá trị sử dụng
b. Thu thập các dữ liệu thuộc tính
- Thu thập số liệu từmạng lưới tổ chức ngành, cơ quan
điều tra cơ bản của ngành.
Một CSDL nếu sẽ không có giá trị sử dụng nếu
không cập nhật thông tin.
Việc cập nhật thường theo chu kỳ của các tư liệu
1/5/2013
40
ảnh hàng không, ảnh vệ tinh, số liệu thống kê.
2.4.1. Bảo toàn dữ liệu
1.An toàn dữ liệu
An toàn về mặt vật lý
1/5/2013
41
An toàn về mặt logic
2. Bảo toàn dữ liệu trong quá trình cập
nhật, sửa đổi dữ liệu.
3. Mất dữ liệu
Mất dữ liệu thường do hỏng phần mềm hoặc
phần cứng của máy.
Thông thường dữ liệu thường phải được lưu
trong usb, đĩa CD, ổ cứng khác…
1/5/2013
42
4. Bảo mật thông tin
Hệ thống dữ liệu cần có cơ chế bảo vệ khả
năng truy nhập dữ liệu.
Bài tập
Câu 1: So sánh cấu trúc raster và cấu trúc vector
(Nêu rõ ưu nhược điểm từng cấu trúc) ?
1/5/2013
43
Câu 2 : Sử dụng cấu trúc vector, Rastor trong
những trường hợp nào ?
Câu 3 : Cấu trúc dữ liệu dạng gì?
1/5/2013
44
1/5/2013
45
1/5/2013
46
1/5/2013
47
Câu 4: Cho các thông số của con sông như sau,
hãy chỉ ra dữ liệu không gian , dữ liệu thuộc tính
( định tính , định lượng ) của con sông đó?
Hình dạng, chiều dài,chiều rộng, diện tích,
tọa độ điểm dọc theo đường mép nước, tốc độ
dòng chảy, màu sắc, lực nét, kiểu đường,
1/5/2013
48