Chương 3 – Cấu trúc dữ liệu GIS

Mô tả mô hình dữ liệu Vector và cho ví dụ Mô tả mô hình dữ liệu Raster và cho ví dụ Mô tả mô hình dữ liệu TIN Giải thích “topology” Mô tả các định dạng chính sử dụng trong GIS

ppt93 trang | Chia sẻ: lylyngoc | Lượt xem: 2172 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Chương 3 – Cấu trúc dữ liệu GIS, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
HỆ THỐNG THÔNG TIN ĐỊA LÝ (GIS) (Ch3 – Cấu trúc dữ liệu GIS) Phan Trọng Tiến Department of Software Engineering Hanoi University of Agriculture Office location: 3rd floor, Administrative building Office phone: (04)38276346, Ext: 132 Website: Email:ptgtien@hua.edu.vn or phantien84@gmail.com Giới thiệu các mô hình dữ liệu trong GIS Sau bài học này sinh viên có thể: Mô tả mô hình dữ liệu Vector và cho ví dụ Mô tả mô hình dữ liệu Raster và cho ví dụ Mô tả mô hình dữ liệu TIN Giải thích “topology” Mô tả các định dạng chính sử dụng trong GIS Mục tiêu Các đối tượng đồ họa Các đối tượng hiển thị trên bản đồ được gọi là các đối tượng đồ họa hay các đối tượng. Các đối tượng có thể là tự nhiên hoặc do con người tạo ra nó. Các đối tượng đồ họa Vectors Points or Nodes Lines or Arcs Polygons Raster Cells or Pixels Images Digital Orthophotography Các loại dữ liệu GIS Images Vector Raster (GRID) Attributes TIN (Triangulated Irregular Network) Annotation © Paul Bolstad, GIS Fundamentals Các loại dữ liệu GIS © Paul Bolstad, GIS Fundamentals Dữ liệu không gian RASTER VECTOR Thế giới thực Source: Defense Mapping School National Imagery and Mapping Agency Các bản đồ điện tử ở hai định dạng Raster và Vector Các nguồn dữ liệu Raster Ảnh vệ tinh Ảnh số trực giao (Digital Orthophotography) Một ảnh được quét, dùng các công cụ toán học sửa, bỏ đi, dịch chuyển để có các hiệu quả mong muốn đó là các đối tượng luôn hiển thị vuông góc với mặt đất. Ảnh trực giao cho ta ảnh giống như thực trạng của trái đất. Image Copyright 1993 Nassau County, NY Thiết lập bởi màu sắc của các pixel Cách đơn giản một mảng các pixel được xếp theo các hàng và các cột Các Pixel là được tô màu, nhưng không miêu tả các đối tượng một cách rõ ràng Rasters có thể có giá trị đi kèm. Source: Defense Mapping School National Imagery and Mapping Agency Các bản đồ dạng Raster (images) Đặc điểm của Raster Trông giống trang bản đồ giấy Giá thành rẻ và dễ sản xuất Chạy dễ dàng trên PC Có sẵn mọi nơi. Nhược điểm: Mốc tính toán có hoặc không theo hệ tọa độ WGS84 Không cho phép tự động loại bỏ chế độ nền hay sự trợ giúp phân tích của máy tính. Lưu trữ không hiệu quả Source: Defense Mapping School National Imagery and Mapping Agency Dữ liệu dạng Vector Source: Defense Mapping School National Imagery and Mapping Agency Một cách lưu trữ thông minh dữ liệu GIS, ở đó các đối tượng thế giới thực được miêu tả bằng các điểm (Point), đường (Line) và vùng (Polyline). Một đối tượng được miêu tả bởi các thuộc tính và các tọa độ. Ví dụ: Các bản đồ số hóa Dữ liệu GIS Trong GIS chứa thông tin. GIS kết hợp bản đồ với hệ quản trị cơ sở dữ liệu. Vì vậy khi phân tích dữ liệu không gian chỉ cần “click” trên đối tượng địa lý và tìm thông tin về nó. Hoặc có thể tryu vấn trong database để tìm thông tin về tất các các đối tượng thỏa mãn điều kiện lọc. Thông tin về một đối tượng GIS được gọi là thuộc tính (attribute) Liên kết các thuộc tính và đồ họa Liên kết các thuộc tính với đồ họa Trong ví dụ này, ngưởi dùng truy vấn chọn ra tất cả các thuộc tính mà được phân loại các gia đình = 210, và các vùng tìm thấy có màu đỏ Dữ liệu Vector được phân lớp Spatial Data Analysis • • • • • • • • • • • 2 5 1 4 7 6 Lake Features: Line Points: Connected Detached Area Text • Lake Dữ liệu GIS đặt riêng biệt trên các theme Network Analysis Source: Defense Mapping School National Imagery and Mapping Agency Sự thay đổi về mô hình Có thể nhìn thấy sự khác nhau giữa bản đồ giấy và bản đồ số (phụ thuộc vào phần mềm) Database cho phép truy vấn và chọn các layer Phóng to các chi tiết Phức tạp, đắt tiền và tốn nhiều thời gian để làm ra sản phẩm Source: Defense Mapping School National Imagery and Mapping Agency Các mô hình dữ liệu Raster và Vector Miêu tả Vector X-AXIS 500 400 300 200 100 600 500 400 300 200 100 Y-AXIS River House 600 Trees Trees B B B B B B B B G G BK B B B G G G G G Miêu tả Raster 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 Real World G G Source: Defense Mapping School National Imagery and Mapping Agency Dữ liệu GIS được lưu trữ trong các lớp riêng biệt như Point, Line, Polygon Mô hình dữ liệu Vector © Paul Bolstad, GIS Fundamentals Cấu trúc dữ liệu Vector Có mối quan hệ giữa các kiểu dữ liệu vector. Mỗi kiểu thường độc lập trên một kiểu khác nhau. Khi miêu tả dữ liệu GIS theo định dạng vector, dữ liệu phải được lưu trữ: Points: là các đối tượng vô hướng có vị trí không gian, miêu tả các đối tượng GIS như vị trí, hoặc cây … Lines: miêu tả đối tượng một chiều, có vị trí, có chiều dài như đường, sông. Lines được tạo bởi việc kết nối các điểm với nhau. Một đường bắt đầu và kết thúc tại một điểm gọi là nút (node), và các điểm tạo nên đường gọi là đỉnh (Vertices). Polygons/Area: miêu tả đối tượng hai chiều, có vị trí, có chiều dài, và có cả chiều rộng như đường danh giới của cánh đồng, đất đai, hoặc hồ … Nó được tạo bởi việc kết nối các đường, điểm bắt đầu của polygon cũng là điểm kết thúc Point Line Polygon Points Point là đối tượng vô hướng có vị trí và thuộc tính thông tin nhưng quá nhỏ để được biểu diễn bằng vùng. Tỷ lệ bản đồ quyết định một đối tượng là điểm hay không. Ứng dụng kiểu điểm Các mẫu đất Kiểu PH Chất gây ôi nhiễm (Contaminants) Vị trí các cột đèn Các vị trí xảy ra tai nạn Các trung tâm Khối/Đoạn Địa chỉ Chủ sở hữu Các cột đèn Các trung tâm Lines or Arcs Lines là các đối tượng một chiều, có vị trí, có chiều dài nhưng không có vùng như đường, sông. Lines được tạo bởi việc kết nối các điểm với nhau. Một đường bắt đầu và kết thúc tại một điểm gọi là nút (node), và các điểm tạo nên đường gọi là đỉnh (Vertices). Ứng dụng Lines or Arcs Đường phố Street Name Address Ranges Hệ thống nước Pipe size Pipe Material Date Installed Sông suối Depth Quality Flow Rate Đường phố Polygons Polygons là đối tượng hai chiều, có vị trí, có chiều dài, và có cả chiều rộng (hay có diện tích) Ứng dụng Polygons Các mảnh đất Parcel ID Number Dimensions and Area Đường danh giới Type Permeability Vùng lũ lụt Polygons Polygons Mô hình dữ liệu Vector Điểm: Được thể hiện bằng một cặp toạ độ Đường: Được thể hiện bằng một chuỗi các cặp toạ độ Vùng: Được thể hiện bằng một chuỗi các cặp toạ độ và cặp toạ độ đầu và cặp toạ độ cuối trùng nhau. Cấu trúc dữ liệu Vector Điểm: Được thể hiện bằng một cặp toạ độ Đường: Được thể hiện bằng một chuỗi các cặp toạ độ Vùng: Được thể hiện bằng một chuỗi các cặp toạ độ và cặp toạ độ đầu và cặp toạ độ cuối trùng nhau. Sù thÓ hiÖn d÷ liÖu d¹ng Vector Mçi ®iÓm ®­îc thÓ hiÖn b»ng 1 cÆp täa ®é Mçi ®­êng thÓ hiÖn b»ng 1 chuçi c¸c cÆp täa ®é Mçi vïng ®­îc thÓ hiÖn b»ng 1 chuçi c¸c cÆp täa ®é, cã cÆp täa ®Çu vµ cÆp täa cuèi trïng nhau. MÔ HÌNH VECTOR Dữ liệu ở dạng Vector được tổ chức ở 2 mô hình: Mô hình Spagheti Mô hình quan hệ không gian Topology Mô hình dữ liệu Vector Spaghetti Là mô hình dữ liệu đơn giản, các đối tượng chỉ được lưu trữ bằng các cặp toạ độ. Thông tin về quan hệ không gian. Thông tin thuộc tính. Không mô tả được mối quan hệ không gian giữa các đối tượng, vì thế các phép phân tích, tính toán không gian đều thực hiện khó khăn. Dữ liệu dạng vùng, đường ranh giới giữa 2 vùng được ghi nhận 2 lần, mỗi lần cho một vùng. Ưu điểm của mô hình là đơn giản, dễ trình bày, biên tập, in ấn...vì vậy vẫn được sử dụng rộng rãi để thành lập bản đồ. Phần mềm điển hình là Mapinfo. Mô hình dữ liệu Vector Spaghetti Mô hình dữ liệu Vector Topology Là một mô hình phức tạp, các đối tượng được quản lý không chỉ bởi toạ độ mà còn bằng cả mối quan hệ không gian giữa các đối tượng. Mô tả trọn vẹn các thông tin của các đối tượng không gian bao gồm: Thông tin về vị trí không gian (Spatial data): Thông tin được thể hiện theo mô hình vector, bằng các tọa độ mô tả vị trí, hình dạng, đường biên của các đối tượng. Thông tin về quan hệ không gian (Relational Spatial data – Topology). Mô hình dữ liệu Topology thể hiện QHKG dưới 3 kiểu quan hệ là: Liên thông với nhau: thể hiện dưới dạng file đường - điểm nối (Arc-Node topology) Kề nhau: thể hiện dưới dạng file mô tả đường bao (Polygon-Arc topology) Nằm trong nhau, phủ nhau. - Thông tin về vị trí trong không gian + Dữ liệu không gian các đối tượng vùng là một tập các đối tượng đường định nghĩa đường bao vùng và một điểm nhãn. + Điểm nhãn nằm trong đối tượng vùng có ý nghĩa để xác định cho vùng này. Mô hình dữ liệu Vector Topology Thông tin về quan hệ không gian + Dữ liệu không gian các đối tượng vùng là một tập các đối tượng đường định nghĩa đường bao vùng và một điểm nhãn. + Mô hình Topology dùng các quan hệ không gian để định nghĩa các đặc tính không gian của các đối tượng Mô hình dữ liệu Vector Topology Tính liên tục Tính kề nhau Đầu, cuối giao của đường Tính tạo vùng Mô hình dữ liệu Vector Topology - Các đường ranh giới thửa không được phép giao nhau, phải luôn cắt nhau tại đầu hoặc cuối đường ( tại điểm nút NODE). Áp dụng mô hình topology khi xây dựng CSDL không gian - Đường ranh giới tạo thành đường bao thửa đất luôn đảm bảo tính khép kín tuyệt đối về toạ độ. Mô hình dữ liệu Vector Topology DỮ LIỆU KHÔNG GIAN CHUẨN Sai §óng Cơ sở dữ liệu chuẩn là dữ liệu không còn lỗi như: bắt quá, bắt chưa tới, vùng chưa khép…. Liên kết dữ liệu thuộc tính Bảng dữ liệu (Attributes) © ESRI Là thông tin cho phép miêu tả một thực thể đã được trình bày ở đối tượng đồ họa. Dữ liệu thuộc tính Thông tin về đối tượng đồ họa Dữ liệu thuộc tính Mỗi phần thông tin thuộc tính liên quan tới một phần đối tượng đồ họa Các trường thuộc kiểu dữ liệu truyền thống của CSDL Images Photos Video Courtesy Village of Garden City Liên kết các thuộc tính Dữ liệu GIS được lưu trữ dưới dạng lưới các ô (cells) hay pixel Ảnh viễn thám, ảnh quét (scanner) luôn ở dạng Raster Mô hình dữ liệu Raster Dữ liệu Raster Tập dữ liệu GIS Về sử dụng đất/Độ bao phủ đất Các Chỉ số thực vật Sự ổn định đất Ảnh số Ảnh về các tòa nhà Khung cảnh các tai họa Sự thiệt hại mùa vụ Các hình ảnh về sự vận động Ảnh trực giao Các ảnh trên không đã được chỉnh sửa Dữ liệu Raster Là một mảng hai chiều các ô (pixel). Mỗi ô có chiều cao và chiều rộng cố định và cùng kích thước, trải trên một hình chữ nhật. Bảng dữ liệu thuộc tính Rasters có giá trị số nguyên các ô định (số lượng các ô cùng giá trị) được ghi trong bảng dữ liệu thuộc tính. Mỗi bản ghi thuộc tính là duy nhất với mỗi giá trị của ô. Bạn có thể thêm các trường tới bảng dữ liệu Các kiểu dữ liệu miêu tả trong ô Dữ liệu được lưu trữ trong raster có thể được phân loại một trong các loại sau: Dữ liệu tên (Nominal data): dữ liệu được phân loại theo tên. Dữ liệu số thứ tự (Ordinal data): dữ liệu được phân loại theo tên và khoảng giá trị. Khoảng dữ liệu (Interval data): sắp xếp theo thứ tự số và có các khoảng khác nhau có ý nghĩa. Dữ liệu tỷ lệ (Ratio data) Các kiểu dữ liệu miêu tả trong ô Các kiểu dữ liệu miêu tả trong ô Kiểu Nominal và Ordinal dùng miêu tả theo các phân loại khác nhau, là cách tốt nhất miêu tả các ô dữ liệu kiểu integer. Kiểu Interval và Ratio mô tả các giá trị liên tiếp, dùng với các ô dữ liệu là kiểu real. PIXEL là đơn vị nhỏ nhất trong ảnh. Cơ sở hệ thống GIS là raster, thông tin thuộc tính có thể được khởi gán tới mỗi pixel. PIXEL (PICTURE ELEMENT) © ESRI, Modeling Our World Cách biểu diễn Raster Raster có thể có một hoặc nhiều nhãn. Giá trị của mỗi ô có thể mang các giá trị khác nhau. Có một vài cách để hiển thị raster với giá trị của ô. Hiển thị nhãn đơn (single-band) Hiển thị nhãn bội (multi-band) Hiển thị nhãn đơn Hiển thị nhãn bội Cấu trúc dữ liệu Raster Ma trận các ô bằng nhau Vấn đề về độ phân giải WHEAT HAY APPLES Raster và Vector Phải được cân nhắc kỹ Tính rời rạc của thực thể đang mô tả Ứng dụng mong đợi (Các chức năng) Nguồn dữ liệu Quan tâm sự lưu trữ Độ phân giải Màu sắc Mô hình Raster và Vector Source: Defense Mapping School National Imagery and Mapping Agency Một câu hỏi đặt ra:” Định dạng nào là tốt nhất mô tả các đối tượng trong GIS, raster hay vector”. Câu trả lời là một trong hai hoặc cả hai. Đó là, dùng một trong hai mô hình dữ liệu là tốt nhất trong mỗi trường hợp hoặc cả hai mô hình đều thực hiện các vai trò nhất định trong GIS. Trong ví dụ, nguồn dữ liệu vector miêu tả đường bờ biển xuất hiện có nhiều chi tiết hơn, và độ chính xác lớn hơn. Dữ liệu Vector có thể lưu trữ thông tin trong nhiều định dang hơn dữ liệu Raster, và cũng làm việc tốt với đối tượng thuộc về chiều dài như luồng các mạng. Tuy nhiên, các mô hình dữ liệu Raster rất tốt miêu tả thông tin liên tục trong tự nhiên như nhiệt độ nơi mà giá trị nhiệt độ có thể khác với nơi liền kề. Vector – Những ưu điểm và nhược điểm Thuận lợi Miêu tả tốt thực tế Gắn kết nhiều cấu trúc dữ liệu Topology có thể được mô tả trong mạng Đồ họa chính xác Nhược điểm Cấu trúc dữ liệu phức tạp Mô phỏng khó khăn Một vài phân tích không gian là khó khăn hoặc không thể thi hành. Raster – Ưu điểm và nhược điểm Ưu điểm Cấu trúc dữ liệu đơn giản Dễ phủ lên nhau Có nhiều kiểu phân tích không gian khác nhau Không thay đổi kích thước và hình dáng Công nghệ rẻ Nhược điểm Số lượng lớn dữ liệu Không đẹp Thay đổi hệ quy chiếu là khó khăn Tỷ lệ khác nhau giữa các lớp có thể là cơn ác mộng Có thể mất thông tin ở những vùng giao nhau Các chức năng Raster © Paul Bolstad, GIS Fundamentals Các phương pháp nén dữ liệu Raster Mục đích: Giảm kích thước lưu trữ. Có các phương pháp: Phương pháp nén theo đường biên vùng (Chain Code) Phương pháp nén theo hàng cột (Run-length code) Phương pháp nén theo khối (Block code) Phương pháp nén cây tứ phân (Quadtree code) Phương pháp nén theo đường biên vùng (Chain Code) 0 1 2 3 Phương pháp nén theo đường biên vùng (Chain Code) Ưu điểm: Là phương pháp nén dữ liệu raster hiệu quả. Dễ dàng tiến hành tính chu vi và diện tích, nhận biết lồi lõm, thay đổi hướng đột ngột. Nhược điểm: Khó khăn trong phân tích chồng xếp. Dư thừa dữ liệu vì đường biên lưu trữ hai lần. Phương pháp nén theo hàng cột (Run-length code) Các điểm trên mỗi đơn vị bản đồ được lưu trữ theo hàng từ trái qua phải từ cell đầu đến cell cuối. Hàng Cột Hàng 1: 2,3 5,7 Hàng 2: 2,7 Hàng 3: 4, 6 Hàng 4: 4, 6 Hàng 5 : 2, 6 Hàng 6: 2, 6 Hàng 7: 4, 8 Hàng 8: 6, 8 Phương pháp nén theo hàng cột (Run-length code) Ưu điểm: Thích hợp cho việc lưu trữ dữ liệu trong máy tính có bộ nhớ ít. Nhược điểm: Khó khăn trong quá trình xử lý và phân tích dữ liệu. Phương pháp nén theo khối (Block code) Ví dụ trên có thể viết dưới dạng nén block code 2n x 2n như sau: 7 block 1 đơn vị ô vuông 7 block 4 đơn vị ô vuông Phương pháp này có hiệu quả với các vùng có diện tích lớn và hình dạng các đường biên đơn giản, có thể kiểm tra sự co giãn về hình dạng của vùng. Phương pháp nén cây tứ phân (Quadtree code) Phương pháp nén cây tứ phân (Quadtree code) Thể hiện sự chia liên tục của dạng ma trận 2n x 2n thành dạng cây 4 nhánh ưu điểm của phương pháp nén hình cây: - Dễ tính toán diện tích chu vi của các vùng có hình dạng chuẩn - Có thể giam bớt sự lưu trũ với các độ phân giải khác nhau Nhược điểm : - Khó khăn cho việc chọn các mô hình, giải pháp - Một vùng có thể chia thành rất nhiều phần gây khó khăn cho việc truy nhập DL TIN(Triangulated Irregular Network) TIN là một mô hình dữ liệu được sử dụng để miêu tả các đối tượng ba chiều. Các điểm miêu tả bởi các giá trị x,y,z. Dùng các phương thức tính toán hình học, các điểm được kết nối vào nhau gọi là phép đạc tam giác. Các đường của các tam giác gọi là các cùng và miền phía trong gọi là bề mặt (facet) TIN(Triangulated Irregular Network) Mô hình TIN có một vài điểm phức tạp hơn dạng Point, Line, Polygon trong mô hình Vector, hay mô hình Raster, nó thực sự hữu ích miêu tả độ cao. Ví dụ thể hiện lợi ích của TIN: Lưới Raster có thể thể hiện toàn bộ bề mặt của miền địa lý. Nếu chúng ta muốn hiển thị chi tiết thì ta phải chia lưới này thành các ô nhỏ hơn -> nhưng với một bề mặt tương đối bằng phẳng -> tốn bộ nhớ Với TIN chúng ta không phải dùng nhiều điểm trên miền bằng phẳng, nhưng cũng có thể thêm nhiều điểm ở vùng dốc nơi chúng ta muốn hiển thị nhiều chi tiết hơn. Cấu trúc dữ liệu TIN Cấu trúc dữ liệu TIN dựa trên hai phân tử cơ bản: Các điểm với giá trị x,y,z Các cung nối các điểm này. Phép đạc tam giác TIN thỏa mãn theo tiêu chuẩn Delaunay Tiêu chuẩn Delaunay Vòng tròn ngoại tiếp không chứa một nút của bất kỳ phần tử nào khác. Vòng tròn ngoại tiếp của một tam giác là vòng tròn đi qua các đỉnh. Các thành phần TIN Nodes Edges Triangles Hull Topology TIN là một tập hợp các tam giác liền kề, không bị chồng nhau. ArcGIS hỗ trợ cả hai mô hình độ cao: TIN and lattice (lưới). Các thành phần TIN Nodes: là cơ sở xây dựng các khối của TIN. Các nút bắt đầu từ các điểm và các đỉnh cung chứa từ các nguồn dữ liệu nhâp vào. Edges: Mỗi nút được nối với nút gần nhất theo tiêu chuẩn Delaunay. Mỗi cung có hai nút nhưng môt nút có thể có hai hoặc nhiều cung. Triangles: Mỗi bề mặt tam giác miêu tả một phần của bề mặt TIN Hull (bao): được hình thành bới một hoặc nhiều polygon bao gồm toàn bộ tập dữ liệu các điểm sử dụng xây dựng nên TIN. Các Polygon Hull định nghĩa vùng nội suy của TIN Topology: là cấu trúc hình học của TIN định nghĩa mối quan hệ giữa các nút, các cung và mối quan hệ giữa các tam giác liền kề. Trong ARC/INFO, TIN được lưu trữ trong một thư mục gồm các file. Tuy nhiên, TIN không bao chứa và không kết hợp với file thông tin (INFO). Thư mục TIN chứa 7 file bao gồm thông tin về bề mặt TIN. Các file này được mã hóa theo dạng nhị phân và không đọc được ở chế độ hiển thị văn bản. © ESRI, Modeling Our World © ESRI, Modeling Our World Chú giải (Annotation) Là văn bản (text) hoặc nhãn (labels) vẽ trên bản đồ mà miêu tả hoặc nhận diện một đối tượng hoặc thêm thông tin khác tới bản đồ Chú giải (Annotation) Text Thông tin được đặt trên bản đồ cung cấp thêm thông tin về một đối tương đồ họa. Ký hiệu (Symbols) Là cách thức mà các đối tượng đồ họa hiển thị trong GIS Các ký hiệu giúp nhận diện các đặc điểm và cung cấp thông tin về chúng. q c , P X Ký hiệu (Symbols) Courtesy Village of Garden City Annotation, Symbology, and Text Vấn đề về tỷ lệ trong đối tượng mô tả Phụ thuộc vào tỷ lệ mô tả, một đối tượng có thể nhận nhiều mẫu khác nhau Buildings Vẽ công trình công cộng – building outline USGS Quad Sheet – point location City USGS Quad Sheet – Polygon of city boundary Rand McNally Map – Point representing city location Tập hợp dữ liệu số miêu tả rõ ràng các đối tượng liền kề, chứa trong nhau và tính liên tục giữa các đối tượng bản đồ mà có thể lưu trữ và thao tác trên máy tính. Topology Topology © Paul Bolstad, GIS Fundamentals