Chương II: Tổng quan về cơ sở dữ liệu trong hệ thống thông tin địa lý

Các tập dữ liệu chứa các thông tin liên quan đến một cơ quan, một tổ chức, một chuyên ngành khoa học tự nhiên, xã hội được lưu trữ trong máy tính theo một quy định nào đó cho phép người sử dụng truy xuất hoặc sửa đổi tập tin ( data base).

pdf48 trang | Chia sẻ: lylyngoc | Lượt xem: 1721 | Lượt tải: 2download
Bạn đang xem trước 20 trang tài liệu Chương II: Tổng quan về cơ sở dữ liệu trong hệ thống thông tin địa lý, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Ch−¬ng II: Tæng quan vÒ c¬ së d÷ liÖu trong hÖ thèng th«ng tin ®Þa lý 1 1/5/2013 II.1.1.ĐN: Các tập dữ liệu chứa các thông tin liên quan đến một cơ quan, một tổ chức, một chuyên ngành II.1. Hệ cơ sở dữ liệu (CSDL): 1/5/2013 2 khoa học tự nhiên, xã hội được lưu trữ trong máy tính theo một quy định nào đó cho phép người sử dụng truy xuất hoặc sửa đổi tập tin ( data base). II.1.2.Hệ quản trị cơ sở dữ liệu (HQTCSDL) ĐN : Là phần chương trình để có thể xử lý, thay đổi các tập dữ liệu . Nhiệm vụ: Cung cấp cách lưu trữ, truy vấn thông 1/5/2013 3 tin trong cơ sở dữ liệu sao cho vừa thuận lợi vừa hiệu quả. Một số hệ quản trị hiện nay: database, SQL server, micrsoft Access, posgis Định nghĩa dữ liệu Xây dựng dữ liệu 1/5/2013 4 Thao tác dữ liệu Quản trị dữ liệu Bảo vệ dữ liệu II.1.3.Mô hình CSDL 1. Mô hình phân cấp (hierarchical models) Là sự kết hợp của nhiều cấp độ cơ bản có liên quan, trong thực tế nó là một cây theo thứ tự. 1/5/2013 5 Nhược điểm: Có nhiều dư thừa dữ liệu trong tập dữ liệu này sang một dữ liệu khác. 1/5/2013 6 Hình Biểu diễn bản đồ A bằng mô hình phân cấp Trường Khoa 1/5/2013 7 Môn học Giảng viênSinh viên 2.Mô hình mạng(Network model) Là tập hợp các mức độ cơ bản đã được kết nối, loại cấu trúc này được xem như là cấu trúc phân cấp có nhiều mạng kết nối. Ưu điểm : Tiết kiệm thời gian tìm kiếm 1/5/2013 8 Nhược: Quan hệ giữa các dữ liệu phức tạp,cấu trúc thì không thể nhìn thấy rõ ràng Dư thừa dữ liệu. 1/5/2013 9 Biểu diễn bản đồ A bằng mô hình lưới Mô hình mạng Trường Khoa 1/5/2013 10 Môn học Giảng viênSinh viên Bảng đăng ký Trong thực tế các dữ liệu thường không thể mô tả chúng bằng mô hình phân cấp hoặc mô hình mạng. 3. Mô hình quan hệ. 1/5/2013 11 Mô hình dữ liệu quan hệ dựa trên khái niệm toán học với tên gọi (relation) và biểu diễn vật lý là các bảng (table). Mô hình quan hệ dữ liệu gồm 3 thành phần sau:  Cấu trúc dữ liệu (data structure) : Dữ liệu cấu trúc theo dạng bảng bao gồm nhiều hàng và cột. Ví dụ: cho bảng có tên sau “Quản lý SV” ID Họ tên Điểm hoc tập Điểm rèn luyện 1/5/2013 12 110070001 Nguyễn Trường 6.7 Khá 110070002 Phan Thoại 7.0 Tốt 110070003 Lê Nguyễn Phương 8.9 Tốt Thao tác dữ liệu ( data manipulation) : Sử dụng ngôn ngữ SQL để truy vấn dữ liệu chứa trong bảng. VD: Tìm mã sinh viên, họ tên sinh 1/5/2013 13 viên có điểm học tập ≥ 7.0 và điểm rèn luyện thuộc loại “tốt” ID Họ tên Điểm hoc tập Điểm rèn luyện 110070001 Nguyễn Trường 6.7 Khá 110070002 Phan Thoại 7.0 Tốt 1/5/2013 14 select ID, Họ tên from Quản lý SV where Điểm học tập ≥ 7.0 and điểm rèn luyện = ‘tốt’ 110070003 Lê Nguyễn Phương 8.9 Tốt  Toàn vẹn dữ liệu ( data integrity): Các phương tiện dùng để đặc tả các quy tắc nghiệp vụ nhằm duy trì tính toàn vẹn của dữ liệu khi thao tác 1/5/2013 15 - Trong mô hình quan hệ thì CSDL được đặt trong các bảng có quan hệ với nhau, - Hệ QTCSDL có khả năng kết nối dữ liệu từ nhiều bảng để tạo thành bảng duy 1/5/2013 16 nhất. - Để phân biệt bảng ghi người ta chọn ra một trường làm khóa chính ( khóa chính không được trùng nhau hoặc rỗng) Có 4 khả năng tồn tại giữa các bảng - Quan hệ 1-1 :Khóa trường trong bảng là duy nhất, không có sự trùng lặp trong các trường khóa - Quan hệ nhiều - 1: cho phép bảng mới có nhiều 1/5/2013 17 giá trị trong trường khóa tương ứng của trường có quan hệ của bảng hiện có. - Quan hệ 1 – nhiều: Đòi hỏi trường khóa chính của bảng mới là duy nhất nhưng khóa ngoại của bảng mới có thể khớp với nhiều mục - Quan hệ nhiều – nhiều : không có quan hệ tồn tại giữa các trường khóa trong bảng 4. Mô hình quan hệ thực thể (entity relationship model ) Mô hình này dựa trên quan niệm về thế giới đối tượng được gọi là thực thể, và mối quan hệ giữa chúng.Các 1/5/2013 18 thực thể mô tả trong CSDL bởi một tập các thuộc tính Ưu điểm: CSDL luôn nhất quán Hỗ trợ thiết kế, tổ chức thông tin, tương thích với mô hình quan hệ 5. Mô hình hướng đối tượng Dựa trên cơ sở các gói dữ liệu mà mã liên quan đến đối tượng. Đây là mô hình hiện đại được nhiều nước sử dụng và có nhiều 1/5/2013 19 ứng dụng trong ngôn ngữ lập trình cũng như trong giải pháp về phần cứng, phần mềm. II.2.Cấu trúc CSDL trong GIS  CSDL chiếm khoảng 70 % giá trịHTTĐL  CSDL gồm 2 nhóm: CSDL không gian 1/5/2013 20 CSDL thuộc tính  Hai loại dữ liệu này tuân theo một cấu trúc hợp lý thuận lợi cho quản lý, lưu trữ, sửa đổi, khai thác theo mục đích sử dụng. Kho âng g ian Cô sô û d ö õ lie äu G IS 1/5/2013 21 CSDL trong gis Thuo äc tín h II.2.1. CƠ SỞ DỮ LIỆU KHÔNG GIAN CSDL không gian: là CSDL có chứa trong nó những thông tin về định vị của đối tượng. 1/5/2013 22 Dữ liệu không gian có 3 dạng: +) Dạng điểm: +) Dạng đường: +) Dạng vùng: X,Y X,Y X,Y X,Y X,Y• Caáu tru ùc Vector Caáu tru ùc Raster 1/5/2013 23 • X,Y Pixel Coät Doøng Để quy các dữ liệu không gian về 3 loại trên , cần xác định: - Vị trí của đối tượng 1/5/2013 24 - Đặc trưng của đối tượng - Mối quan hệ giữa các đối tượng Tất cả các yếu tố đối tượng trong HTTĐL đều có thể được mô tả theo kiểu cấu trúc dữ liệu vector và raster A. Cấu trúc dữ liệu vector: -) điểm : được mô tả bởi cặp tọa độ (x,y) trong một hệ thống tọa độ nhất định 1/5/2013 25 Đặc điểm: - Là toạ độ đơn (x,y) - Không cần thể hiện chiều dài và diện tích 1/5/2013 26 Số liệu vector được biểu thị dưới dạng điểm (Point). -) Dạng đường: Đường được xác định nhưmột tập hợp dãy của các điểm Đặc điểm: • Là một dãy các cặp toạ độ • Một arc bắt đầu và kết thúc bởi node 1/5/2013 27 • Các arc nối với nhau và cắt nhau tại node • Hình dạng của arc được định nghĩa bởi các điểm vertices • Độ dài chính xác bằng các cặp toạ độ 1/5/2013 28 Số liệu vector được biểu thị dưới dạng Arc -) Vùng: Vùng được xác định bởi ranh giới các đường thẳng. Các đối tượng địa lý có diện tích và đóng kín bởi một đường được gọi là đối tượng vùng polygons Đặc điểm: - Polygons được mô tả bằng tập các đường (arcs) và điểm nhãn (label points) 1/5/2013 29 - Một hoặc nhiều arc định nghĩa đường bao của vùng - Một điểm nhãn label points nằm trong vùng để mô tả, xác định cho mỗi một vùng. B.Cấu trúc dữ liệu raster: Mô hình dữ liệu dạng raster phản ánh toàn bộ vùng nghiên cứu dưới dạng một lưới các ô vuông hay điểm ảnh (pixcel). Đặc điểm: Mỗi một điểm ảnh (pixcel) chứa một giá trị. Các điểm được xếp liên tiếp từ trái qua phải và từ trên xuống 1/5/2013 30 dưới. Một tập các ma trận điểm và các giá trị tương ứng tạo thành một lớp (layer). Trong cơ sở dữ liệu có thể có nhiều lớp. Mối liên hệ không gian giữa các đối tượng trong mô hình topology Điểm – điểm Điểm - đường Điểm - vùng 1/5/2013 31 Đường – đường Đường - vùng Vùng - vùng Vùng – vùng đường – đường Đường - vùng 1/5/2013 32 1/5/2013 33 Nén ảnh là quá trình làm giảm lượng thông tin dư thừa trong dữ liệu gốc. Có 2 phương pháp nén: 1/5/2013 34 - Nén chính xác : Nén không mất thông tin, phương pháp này cho ta chính xác dữ liệu gốc sau khi nén. - Nén có mất thông tin : Với dữ liệu này ta sẽ không thu được dữ liệu như bản gốc sau khi nén. ĐN: CSDL thuộc tính (dữ liệu phi không gian) : Là cơ sở phản ánh tính chất của các đối tượng khác nhau 1/5/2013 35 Đặc điểm: +) Dữ liệu thuộc tính bao gồm: - Dữ liệu định tính - Dữ liệu định lượng. +) Cấu trúc dữ liệu thuộc tính có dạng bảng: Cột ( trường ) Giá trị 1/5/2013 36 Dòng thuộc tính +) Ngoài ra dữ liệu không gian còn bao gồm các hình thức trình bày chuẩn của mỗi yếu tố ( màu sắc, lực nét, kiểu đường…). +) DL thuộc tính có thể nhập từ 1/5/2013 37 các bảng dữ liệu, các tệp văn bản, hoặc từ các phần mềm khác. Với cùng một đối tượng , có thể liên kết dữ liệu không gian và dữ liệu thuộc tính . Mối liên kết có thể được thực hiện bằng 2 1/5/2013 38 cách: - Đặt dữ liệu thuộc tính vào đúng vị trí dữ liệu không gian. - Sắp xếp dữ liệu không gian và dữ liệu thuộc tính theo cùng một trình tự, sau đó gán mã duy nhất cho cả hai dữ liệu. II.3.1. Thu thập dữ liệu a. Thu thập dữ liệu địa lý: -Thu thập dữ liệu bằng đo đạc mặt đất 1/5/2013 39 - Thu thập dữ liệu từ ảnh hàng không và ảnh vệ tinh - Số hóa bản đồ đang có giá trị sử dụng b. Thu thập các dữ liệu thuộc tính - Thu thập số liệu từmạng lưới tổ chức ngành, cơ quan điều tra cơ bản của ngành. Một CSDL nếu sẽ không có giá trị sử dụng nếu không cập nhật thông tin. Việc cập nhật thường theo chu kỳ của các tư liệu 1/5/2013 40 ảnh hàng không, ảnh vệ tinh, số liệu thống kê. 2.4.1. Bảo toàn dữ liệu 1.An toàn dữ liệu An toàn về mặt vật lý 1/5/2013 41 An toàn về mặt logic 2. Bảo toàn dữ liệu trong quá trình cập nhật, sửa đổi dữ liệu. 3. Mất dữ liệu Mất dữ liệu thường do hỏng phần mềm hoặc phần cứng của máy. Thông thường dữ liệu thường phải được lưu trong usb, đĩa CD, ổ cứng khác… 1/5/2013 42 4. Bảo mật thông tin Hệ thống dữ liệu cần có cơ chế bảo vệ khả năng truy nhập dữ liệu. Bài tập Câu 1: So sánh cấu trúc raster và cấu trúc vector (Nêu rõ ưu nhược điểm từng cấu trúc) ? 1/5/2013 43 Câu 2 : Sử dụng cấu trúc vector, Rastor trong những trường hợp nào ? Câu 3 : Cấu trúc dữ liệu dạng gì? 1/5/2013 44 1/5/2013 45 1/5/2013 46 1/5/2013 47 Câu 4: Cho các thông số của con sông như sau, hãy chỉ ra dữ liệu không gian , dữ liệu thuộc tính ( định tính , định lượng ) của con sông đó? Hình dạng, chiều dài,chiều rộng, diện tích, tọa độ điểm dọc theo đường mép nước, tốc độ dòng chảy, màu sắc, lực nét, kiểu đường, 1/5/2013 48