Chương 5: Xây dựng và chỉnh lý dữ liệu trong hệ thống thông tin địa lý

Để làm việc được với HTTTĐL bước đầu tiên là xây dựng một cơsở dữ liệu bản đồ số. Việc xây dựng một cơsở dữ liệu của hệ thông tin địa lý là một vấn đề quan trọng nhất và tiêu tốn thời gian nhiều nhất trong việc triển khai thực hiện

pdf49 trang | Chia sẻ: lylyngoc | Lượt xem: 1579 | Lượt tải: 2download
Bạn đang xem trước 20 trang tài liệu Chương 5: Xây dựng và chỉnh lý dữ liệu trong hệ thống thông tin địa lý, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Please purchase a personal license. Định nghĩa cơ sở dữ liệu5.1 Thu thập và lựa chọn cơ sở dữ liệu5.2 Nhập dữ liệu5.3 Quản lý, bổ sung, chỉnh sữa và lưu trữ DL5.4 Các sai số trong HTTTĐL5.5 CHƯƠNG 5: XÂY DỰNG VÀ CHỈNH LÝ DỮ LIỆU TRONG HỆ THỐNG THÔNG TIN ĐỊA LÝ 5.1 Định nghĩa cơ sở dữ liệu Để làm việc được với HTTTĐL bước đầu tiên là xây dựng một cơ sở dữ liệu bản đồ số. Việc xây dựng một cơ sở dữ liệu của hệ thông tin địa lý là một vấn đề quan trọng nhất và tiêu tốn thời gian nhiều nhất trong việc triển khai thực hiện. Vậy cơ sở dữ liệu trong HTTTĐL là gì? 5.1 Định nghĩa cơ sở dữ liệu Cơ sở dữ liệu trong HTTTĐL là một tập hợp lớn các số liệu trong máy tính, được tổ chức sao cho có thể mở rộng, sửa đổi và tra cứu nhanh chóng đối với các ứng dụng khác nhau. Số liệu có thể được tổ chức thành một tập tin hay file hoặc nhiều file hoặc thành các tập hợp trên máy tính. Hay nói cách khác nó là một nhóm xác định các dữ liệu, được tổ chức trong một cấu trúc của một phần mềm quản lý cơ sở dữ liệu. Đó chính là tập hợp của các dữ liệu không gian và phi không gian được liên kết và quản lý chặt chẽ bởi phần mềm HTTTĐL. 5.2 Thu thập, lựa chọn cơ sở dữ liệu Một cơ sở dữ liệu của HTTĐL có thể chia ra làm hai loại số liệu cơ bản: - Số liệu không gian - Số liệu phi không gian. Mỗi một loại có những đặc điểm riêng và chúng khác nhau về yêu cầu lưu giữ số liệu, hiệu quả, xử lý và hiển thị. Vì vậy việc lựa chọn, thu thập cơ sở dữ liệu cho HTTĐL bao gồm việc thu thập, lựa chọn hai loại số liệu này. 5.2 Thu thập, lựa chọn cơ sở dữ liệu S liu không gian là những mô tả số của hình ảnh bản đồ, chúng bao gồm toạ độ, quy luật và các ký hiệu dùng để xác định một hình ảnh bản đồ cụ thể trên tờ bản đồ. Các dữ liệu này là những thông tin mô tả về đặc tính hình học của các đối tượng địa lý như hình dạng, kích thước, vị trí… tồn tại trong thế giới thực của chúng. Vì tính đa dạng và phức tạp về đặc tính hình học của các đối tượng địa lý trên thực tế, cho nên người ta phải thực hiện trừu tượng hoá các đối tượng đó và quy chúng về các loại đối tượng hình học cơ bản để lưu trữ và thể hiện trên bản đồ cũng như trong cơ sở dữ liệu. Số liệu không gian được thu thập trực tiếp ngoài thực tế hoặc từ những tài liệu đã có sẵn. 5.2 Thu thập, lựa chọn cơ sở dữ liệu S liu phi không gian là những diễn tả đặc tính, số lượng, mối quan hệ của các hình ảnh bản đồ với vị trí địa lý của chúng. Các số liệu phi không gian được gọi là dữ liệu thuộc tính, chúng liên quan đến vị trí địa lý hoặc các đối tượng không gian và liên kết chặt chẽ với chúng trong hệ thống thông tin địa lý thông qua một cơ chế thống nhất chung. 5.2 Thu thập, lựa chọn cơ sở dữ liệu Trong HTTTĐL SL thuộc tính thể hiện ở 4 dạng: - Đặc tính của đối tượng: Là những đặc điểm tính chất của đối tượng có thể thực hiện các phép liên kết chặt chẽ với các thông tin không gian. - Số liệu hiện tượng địa lý: miêu tả những thông tin, các hoạt động thuộc vị trí xác định. - Chỉ số địa lý: Tên, địa chỉ, khối, phương hướng định vị… liên quan đến các đối tượng địa lý. - Quan hệ giữa các đối tượng trong không gian: thể hiện ở sự liên kết, khoảng tương thích, mối quan hệ đồ hình giữa các đối tượng. Để tạo thành một tờ BĐ hoàn chỉnh bao giờ cũng phải có đầy đủ hai loại SL: - Số liệu không gian - Số liệu phi không gian Hai loại số liệu này có mối quan hệ chặt chẽ với nhau tạo nên sự thống nhất chung trong cơ sở dữ liệu. 5.3 NHẬP DỮ LIỆU KHÁI NIỆM NHẬP DL LÀ GÌ? Nhập dữ liệu: Là quá trình mã hoá dữ liệu và ghi nhận chúng vào cơ sở dữ liệu. Có 2 loại dữ liệu được nhập là: - Dữ liệu không gian: Chỉ ra vị trí địa lý của DL - Dữ liệu thuộc tính: Mô tả các DL không gian Dữ liệu được đưa vào CSDL thông qua các chức năng đầu vào của HTTTĐL. Nhập DL là 1 quá trình rất quan trọng của hệ thống, nó ảnh hưởng đến độ chính xác và tính logic của dữ liệu trong CSDL, do đó các thiết bị nhập dữ liệu cũng như các phần mềm nhập dữ liệu đều phải đảm bảo độ chính xác. NHẬP DỮ LIỆU THUỘC TÍNH NHẬP DỮ LIỆU KHÔNG GIAN LIÊN KẾT GIỮA DL KHÔNG GIAN VÀ THUỘC TÍNH CÁC GIAI ĐOẠN NHẬP DL CHO HTTTĐL GĐ1 GĐ2 GĐ3 GIAI ĐOAN I: NHẬP DỮ LIỆU KHÔNG GIAN DỮ LIỆU KHÔNG GIAN Miêu tả Vector X-AXIS 500 400 300 200 100 600500400300200100 Y-AXIS River House 600 Trees Trees B B B B B B B B G G BK B B B G G G G G Miêu tả Raster 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 Real World G G DỮ LIỆU DẠNG VECTOR DỮ LIỆU KHÔNG GIAN DỮ LIỆU DẠNG RASTER NHẬP DỮ LIỆU KHÔNG GIAN Nguån d÷ liÖu kh«ng gian ®Çu vµo lµ g×??? BẢN ĐỒ GIẤY DỮ LIỆU KHÔNG GIAN ĐẦU VÀO DỮ LIỆU KHÔNG GIAN ĐẦU VÀO VẼ BẰNG TAY ẢNH HÀNG KHÔNG, ẢNH VỆ TINH DỮ LIỆU KHÔNG GIAN ĐẦU VÀO Máy kinh vĩ Máy Toàn Đạc Điện Tử NHẬP DỮ LIỆU KHÔNG GIAN Tùy thuộc vào cấu trúc dữ liệu (vector hay raster), dữ liệu đầu vào hay phần mềm quản trị CSDL đang sử dụng mà dùng các phương pháp nhập dữ liệu không gian khác nhau: - Nhập dữ liệu bằng tay - Sử dụng bàn số hóa - Sử dụng máy quét (scanner) - Số hóa trực tiếp trên ảnh quét - Nhập dữ liệu bằng các thiết bị khác I. NHẬP DỮ LIỆU DẠNG VECTOR I. NHẬP DỮ LIỆU DẠNG VECTOR Nguồn đầu vào tạo ra dữ liệu dạng vector - Số liệu đo đạc ngoại nghiệp (tọa độ X,Y) - Bản đồ giấy, các bản vẽ Nhập trực tiếp bằng tay1 Sử dụng bàn số hóa2 Số hóa trực tiếp trên ảnh quét3 Sử dụng thiết bị ĐĐ tự động mặt đất4 I. NHẬP DỮ LIỆU DẠNG VECTOR CÁC PP NHẬP DL  Nhập trực tiếp bằng tay Dữ liệu này là: + Điểm + Đường + Vùng Chúng được nhập từ bàn phím theo các tọa độ chính xác hoặc nhập từ các tệp dữ liệu.  Sử dụng bàn số hóa Bàn số hoá gồm 2 phần: + Bàn từ tính + Chuột cảm ứng Để nhập DL người ta đặt BĐ giấy lên bàn số hoá, khai báo các mốc toạ độ khống chế và kích chuột vào các đối tượng trên BĐ để nhận toạ độ. Số hóa bằng bàn số là quá trình đưa dữ liệu trên bản đồ giấy vào máy tính nhờ sự hỗ trợ của bàn số hóa.  Số hóa trực tiếp trên ảnh quét Sử dụng PP này sẽ tạo được các bản đồ sát với thực tế, độ chính xác cao và đỡ tốn kém về kinh phí, thời gian. Các phần mềm có thể sử dụng: MicrStation, Mapinfor, Autorcads... Các dữ liệu vector được nhập bằng cách số hoá từ dữ liệu raster (ảnh quét) thông qua các phần mềm thành lập bản đồ.  Sử dụng thiết bị đo đạc tự động mặt đất Ở Việt Nam hiện nay, đang sử dụng 1 số phần mềm kèm theo các thiết bị đo đạc tự động để tạo ra BĐ dạng vector từ số liệu đo đạc tự động mặt đất. Dữ liệu vector có thể được nhập trực tiếp từ các thiết bị đo đạc tự động ngoài mặt đất (máy GPS, máy toàn đạc điện tử), công việc này được thực hiện nhờ sự trợ giúp của các chương trình, phần mềm máy tính.  Sử dụng thiết bị đo đạc tự động mặt đất + Phần mềm FAMIS: Là phần mềm có khả năng xử lý số liệu đo ngoại nghiệp, xây dựng, quản lý bản đồ và hồ sơ địa chính. + Phần mềm SDR: Là phần mềm xử lý trị đo. SDR kết hợp với máy toàn đạc điện tử và sổ đo điện tử tạo ra một hệ thống làm việc đồng bộ cho phép khép kín dây chuyền tự động hoá quá trình đo đạc thành lập bản đồ. II. NHẬP DỮ LIỆU DẠNG RASTER Đối với cấu trúc dữ liệu Raster mọi điểm, đường, vùng đều được thể hiện là các cell (pixell).  Nhập dữ liệu raster bằng tay  Sử dụng máy quét (scanner)  Nhập bằng các thiết bị khác (bộ cảm)  Nhập dữ liệu raster bằng tay Phương pháp này được thực hiện như sau: - Đầu tiên chọn kích cỡ lưới ô. - Sau đó chồng lên bản đồ. Qúa trình phân loại các ô vuông sẽ được thực hiện bằng tay. Giá trị tại từng ô nhận được từ bản đồ sẽ được ghi lại vào máy tính. Nhập dữ liệu Raster bằng tay  Sử dụng máy quét (Scanner) Sử dụng máy Scaner để chuyển hình ảnh từ các tài liệu thành dạng raster.  Sử dụng máy quét (Scanner) Nếu Scanner với độ phân giải thấp, kích cỡ các pixel sẽ lớn, tốc độ scan nhanh, khối lượng dữ liệu giảm nhưng độ chính xác không cao, hình ảnh không rõ nét. Nếu scanner với độ phân giải cao, kích cỡ pixel sẽ nhỏ, độ chính xác cao, hình ảnh rõ nét nhưng quá trình scan rất chậm và dung lượng dữ liệu lớn. Máy Scaner là dụng cụ để đo độ phản xạ ánh sánh của mỗi pixel và ghi chúng lại theo một khuôn dạng nhất định. Kích cỡ của các pixel có thể thay đổi.  Nhập bằng các thiết bị khác (bộ cảm) Tuy nhiên hầu hết các dữ liệu được quét từ bộ cảm có format không phù hợp với dạng được nhập vào HTTTĐL cho nên chúng cần được xử lý sơ bộ. Hiện nay có rất nhiều chương trình dùng cho phân tích dữ liệu viễn thám có kết hợp với hệ thông tin địa lý để xử lý dữ liệu ở dạng này. Dữ liệu không gian đã ở dạng RASTER có được từ các ảnh vệ tinh, máy bay nhờ các bộ cảm thu nhận được. GIAI ĐOAN II: NHẬP DỮ LIỆU THUỘC TÍNH  Nhập dữ liệu thuộc tính Dữ liệu thuộc tính là những tính chất đặc điểm riêng mà thực thể không gian cần đến để thể hiện trong HTTTĐĐ, chúng không phải là các dữ liệu thuộc tính. Ví dụ: Một con đường cần được số hoá như một tập các pixel nối với nhau trong cấu trúc dữ liệu raster hoặc là một thực thể dạng đường trong cấu trúc vector. Và đường trong HTTTĐL còn được thể hiện với một màu nào đó hoặc ký hiệu hoặc một vài con số đi kèm theo. Các con số đi kèm này có thể là kiểu của đường, dạng bề mặt đường, phương pháp xây dựng, ngày xây dựng...  Nhập dữ liệu thuộc tính Các dữ liệu này sẽ có một trường khóa chung với thực thể mà nó gắn với. Khi cần thì lần theo trường khoá chung này sẽ tìm được những dữ liệu có liên quan đến thực thể. Tất cả các dữ liệu này đều được gán chung cho một thực thể do đó sẽ rất hiệu quả nếu chúng ta ghi và quản lý chúng riêng. Đầu vào của CSDL thuộc tính: Là loàn bộ các loại giấy tờ, sổ sách có liên quan đến quản lý và sử dụng. Bảng dữ liệu thuộc tính gồm các trường DL sau: + Mã đối tượng + Diện tích (đối với các dữ liệu dạng vùng) + Chiều dài (đối với các dữ liệu dạng đường) + Số tờ + Loại đất... Tuỳ thuộc vào từng loại BĐ và mục đích sử dụng mà ta xây dựng các trường dữ liệu cho phù hợp.  Nhập dữ liệu thuộc tính  Nhập dữ liệu thuộc tính + Nhập trực tiếp: Dữ liệu nhập thẳng vào bảng thuộc tính của cơ sở dữ liệu thông qua các phần mềm của HTTTĐL (Mapinfo, ArcView...). + Nhập gián tiếp: Dữ liệu thuộc tính được nhập qua bàn phím máy tính thông qua các phần mềm để lưu trữ và xử lý (excel, word). Sau đó được chuyển vào HTTTĐL thông qua các phần mềm của hệ thống. Các số liệu sau khi đã được số hoá phải được kiểm tra độ chính xác của nó. Dữ liệu không gian: Có thể kiểm tra bằng cách so sánh bản số hoá với bản vẽ trên giấy bóng can, cần kiểm tra sai sót cục bộ và tính phù hợp khi liên kết dữ liệu. Dữ liệu thuộc tính: Có thể kiểm tra bằng cách in ra và so sánh các nội dung bằng mắt thường. Có thể dùng chương trình kiểm tra độ chính xác các liên kết. Nó thiết kế theo kiểu khi gặp sai số thì sẽ đánh dấu lại. Bằng cách như vậy ta sẽ loại bỏ những sai số thông thường. 5.4. QUẢN LÝ, BỔ SUNG, CHỈNH SỬA VÀ LƯU TRỮ DỮ LIỆU Khi dữ liệu nhập vào bị sai hoặc thiếu, nhiều thông tin địa lý thay đổi theo thời gian thì phải tiến hành bổ sung, sửa chữa, thay đổi lại cơ sở dữ liệu. Những DL thuộc tính hay không gian trên bản đồ được bổ sung sửa chữa bằng cách thay đổi, thêm bớt những ô đã số hoá. Trường hợp bị sai, lỗi, thay đổi nhiều thì cần số hoá lại ghi đè lên dữ liệu cũ. Những bổ sung trong cơ sở dữ liệu vector có thể thực hiện bằng cách sử dụng khoá trong dữ liệu để ghép tách các phần theo yêu cầu. 5.4. QUẢN LÝ, BỔ SUNG, CHỈNH SỬA VÀ LƯU TRỮ DỮ LIỆU Lưu trữ dữ liệu: Việc xây dựng một cơ sở dữ liệu số rất tốn kém, đồng thời nó có thể sử dụng lâu dài vì vậy phải lưu trữ dữ liệu. Nó thực chất là việc chuyển đổi thông tin số hoá trong máy ra các môi trường nhớ cố định để được bảo vệ tốt hơn. Trong hầu hết các trường hợp, dữ liệu được lưu trữ trong các môi trường từ như băng từ, đĩa từ... thông thường kết quả số hoá được ghi lưu ít nhất ở cơ sở 2. 5.4. QUẢN LÝ, BỔ SUNG, CHỈNH SỬA VÀ LƯU TRỮ DỮ LIỆU 5.5. CÁC SAI SỐ TRONG HTTTĐL Khi nói đến sai số trong HTTTĐL thì sẽ không tính đến sai số số liệu gốc (như sai số đo ngoại nghiệp, sai số của bản đồ gốc...) mà chỉ đề cập đến những sai số do chính những thao tác kỹ thuật của công nghệ này gây ra như định vị bản đồ bị sai, sử dụng hệ toạ độ sai, số hoá bị sai, bị thừa bị bỏ sót... Sai số trong HTTTĐL chủ yếu xuất hiện trong quá trình mã hoá và nhập DL không gian, thuộc tính. Các sai số trong HTTTĐL có thể gồm: - Không hoàn thành dữ liệu không gian do đã bỏ sót các điểm, đường hoặc vùng khi nhập dữ liệu thủ công (do quét bỏ sót dữ liệu gián đoạn giữa xử lý chuyển đổi raster và vector hay do chuyển đổi raster, vector của dữ liệu được quét làm hỏng) - Dữ liệu không gian sai vị trí: Có thể sắp xếp theo thứ tự từ sai số vị trí nhỏ sang sai số vị trí lớn. Dạng này thường là kết quả của số hoá không cẩn thận, có thể do kết quả của bản gốc hoặc do thay đổi tỷ lệ trong suốt quá trình số hoá. 5.5. CÁC SAI SỐ TRONG HTTTĐL - Các dữ liệu bị sai tỷ lệ: Nếu tất cả dữ liệu bị sai tỷ lệ, thì chủ yếu do việc số hoá sai tỷ lệ. Trong hệ thống vector tỷ lệ rất dễ bị thay đổi. - Dữ liệu không gian có thể bị méo vì bản đồ cơ bản dùng số hoá không đúng tỷ lệ: Hầu hết các ảnh chụp hàng không không đúng tỷ lệ trên toàn bộ ảnh do góc nghiêng của máy bay, do địa hình khác nhau và do khoảng cách từ ống kính đến đối tượng khác nhau ở một vùng. - Liên kết sai giữa dữ liệu không gian và phi không gian: thường do mã nhận dạng sai được nhập vào trong khi mã hoá không gian. 5.5. CÁC SAI SỐ TRONG HTTTĐL Tóm lại để giảm thiểu các sai số do các nguyên nhân đã phân tích ở trên thì từng công đoạn cần phải kiểm tra kỹ lưỡng từ khâu kiểm tra chất lượng tài liệu phục vụ số hoá đến định vị bản đồ và tất cả các khâu thực hiện trong suốt quá trình xử lý. Khi kiểm tra cần tuân theo nguyên tắc kiểm tra chéo và áp dụng những kỹ thuật đặc biệt để phát hiện sai số. CÂU HỎI ÔN TẬP CHƯƠNG 5 1. Trình bày các cách nhập dữ liệu không gian? 2. Trình bày các cách nhập dữ liệu thuộc tính? 3. Thế nào là cơ sở dữ liệu không gian và cơ sở dữ liệu thuộc tính? Hãy thao tác cách nhập CSDL không gian và cách nhập CSDL thuộc tính trên máy tính? 4. Trình bày các sai số trong HTTTĐL? Cách khắc phục? 5. Nếu bạn có bản đồ hiện trạng sử dụng đất dạng số ở thời điểm trước, bạn cần phải làm gì để có được bản đồ hiện trạng sử dụng đất của thời điểm hiện tại? 6. Hãy nêu các bước xây dựng cơ sở dữ liệu và cho ví dụ đối với lớp thông tin dạng vùng, đường, điểm? 7. Có mấy kiểu đối tượng trên bản đồ số? Có thể để chung các đối tượng dạng vùng và các đối tượng dạng đường trên cùng một lớp thông tin được không? Tại sao? Cho ví dụ và phân tích?
Tài liệu liên quan