Quy Trình Xây Dựng Cơ Sở Dữ Liệu Trong Gis

- Việc lưu trữ được đòi hỏi ít hơn hệ thống cơ sở dữ liệu raster

- Bản đồ gốc có thể được hiện diện ở sự phân giải gốc của nó.

- Đặc tính phương pháp như là các kiểu từng, đường sá, sông suối, đất đai có thể được khôi phục lại và tiến triển 1 cách đặc biệt.

- Điều này dễ hơn để kết hợp trạng thái khác nhau của phương pháp mô tả dữ liệu với 1 đặc tính phương pháp đơn.

- Hệ số hoá các bản đổ không cần được khôi phục lại từ hình thức raster.

- Dữ liệu lưu trữ có thể được tiến triển trong bản đồ kiểu dạng đường thẳng mà không 1 raster để sự khôi phục vector.

Ngoài ra, mô hình dữ liệu vector cho ta nhiều thao tác hơn trên các đối tượng so với mô hình raster. Việc tính diện tích, đo khoảng cách của các đối tượng được thực hiện bằng các tính toán hình học từ toạ độ của các đối tượng thay vì việc tính toán trên các điểm ảnh của mô hình raster. Một số thao tác ở mô hình này cũng thực hiện nhanh hơn như tìm đường đi trong mạng lưới giao thông dựa trên lý thuyết đồ thị. Tuy nhiên, ở một số thao tác khác thì mô hình này sẽ chậm hơn so với mô hình raster, chẳng hạn khi thực hiện nạp chồng các lớp của bản đồ, các thao tác vùng đệm. Bên cạnh đó, dữ liệu vector tồn tại một số hạn chế như: Vị trí của điểm đỉnh cần được lưu trữ 1 cách rõ ràng; mối quan hệ của những điểm này phải được định dạng trong 1 cấu trúc thuộc về địa hình học; thuật toán cho việc hoàn thành chức năng thì hoàn toàn tương đương trong hệ thống cơ sở dữ liệu raster là quá phức tạp và việc hoàn thành có lẽ là không xác thực; sự thay đổi 1 cách liên tiếp dữ liệu thuộc về không gian không thể được hiện diện như raster.

b. Hệ thống Raster

Raster được định nghĩa như là ma trận không gian của các phần tử dạng ảnh gọi là các pixel. Các pixel có kích thước đồng nhất về mặt hình học, chúng là các ô vuông nhỏ và được xếp theo các dòng và các cột giống như một lưới ô vuông (hình 10). Ma trận không gian từ các ô ảnh này được mã hoá và lưu trữ trong máy tính theo qui luật nhất định, thông qua vị trí của từng ô ảnh (vị trí dòng cột) và giá trị số của chính ô ảnh đó. Ma trận không gian này thường được tham chiếu tới hệ qui chiếu tọa độ.


Có thể bạn quan tâm!

Xem toàn bộ 121 trang tài liệu này.

Hình 1 9 Ma trận không gian của một file GIS raster cấu trúc từ các pixel Vị trí 1

Hình 1.9: Ma trận không gian của một file GIS raster cấu trúc từ các pixel

Vị trí của pixel trong một ma trận không gian được xác định bằng vị trí so với vị trí gốc của ảnh đó. Pixel đầu tiên ở cột thứ nhất ( kể từ trái sang phải) và thứ nhất (kể từ trên xuống). Pixel cuối cùng ở dòng cuối và cột cuối của file ảnh. Nếu vị trí của mỗi một ô ảnh pixel được tham chiếu với vị trí địa lý thật của nó trong một hệ tọa độ Cartesian trên Trái đất thì nó được định vị. Giá trị số của chính pixel đó sẽ diễn tả một hoặc nhiều thuộc tính không gian của đối tượng nghiên cứu. Tất cả các thông số tọa độ và thuộc tính của đối tượng được ghi nhận bằng các phần mềm chuyên dụng là các phần mềm Raster GIS hoặc phần mềm xử lý ảnh số (thực chất là modul GIS). Raster GIS là hệ GIS dùng để thu thập, xử lý, phân tích, mô hình hóa các dữ liệu raster. Giá trị của pixel chỉ tính chất của đối tượng không gian. Ba đối tượng không gian chính là điểm, đường và vùng được thể hiện trong raster GIS sẽ khác hẳn trong vector GIS. Độ lớn của pixel theo chiều x, y sẽ là độ phân giải không gian của ma trận Raster (trong viễn thám gọi là độ phân giải của ảnh). Một đường trong thế giới thực (ví dụ đường dây điện, đường ống dẫn nước ) được thể hiện trên mô hình raster như là tổ hợp của một dãy pixel có cùng giá trị liên tiếp nhau. Đối với một file dữ liệu raster GIS cần có một file thông báo về tổ chức của fiel dữ liệu này goị là file tiền dữ liệu dưới dạng văn bản. File văn bản ghi lại tóm tắt về cấu trúc của file dữ liệu trong đó sẽ chỉ ra số dòng, số cột, hệ tọa độ được dùng, vị trí tọa độ của pixel có trong ảnh giá trị lớn nhất của pixel trong file ảnh. File văn kiện dữ liệu này gọi là file đi trước hay Header file. Nó chỉ ra kiểu cấu trúc của file dữ liệu lưu trữ theo cấu trúc raster. File này có nhiều kiểu lưu trữ khác nhau, có thể ở dạng nhị phân (binary), dạng nén, dạng ASCII (American Standard Code for interchange). Dạng ASCII là dữ liệu GIS được mã hóa dưới dạng văn bản. Các file này có thể

đọc được bằng các chương trình soạn thảo văn bản, nhưng để hiển thị một file dữ liệu không gian dạng này cần phải có phần mềm GIS để thực hiện. Dạng ASCII là dạng trung gian để có thể chuyển đổi file từ một hệ GIS này sang một hệ GIS khác hoặc sang một trình không thuộc GIS có thể đọc được. Các giá trị thuộc tính có thể được ghi nhận tách biệt trong bảng cơ sở dữ liệu. Giá trị của pixel được tham chiếu đến bảng cơ sở dữ liệu này. Trên thực tế mỗi pixel có một cặp tọa độ X,Y duy nhất. Một đối tượng không gian có kích thước nhỏ hơn một pixel, ví dụ lớn hơn một nửa pixel, sẽ được coi như là một pixel trọn vẹn và có giá trị về diện tích và tọa độ của chính pixel mà nó nằm trong. Vì vậy, độ phân giải của pixel đóng vai trò hết sức quan trọng về độ chính xác của dữ liệu raster GIS. Trên Hình 10 minh họa sự khác biệt giữ vector GIS và raster GIS. Ở dạng vector, một đường được tạo nên bởi các vectors có hướng nối các điểm vectex (a), còn trong mô hình cấu trúc raster GIS con đường đó là tập của các pixels.

Kích thước của pixel trong raster phụ thuộc nhiều vào độ phân giải dữ liệu. Pixel phải có kích thước đủ nhỏ để có thể thu thập được chi tiết dữ liệu, nhưng cũng phải có kích thước đủ lớn để có thể phân tích dữ liệu một cách thuận tiện.


a b


Hình 1 10 Sự khác biệt giữa vector và raster trong thể hiện cấu trúc line Nguồn 2

Hình 1.10: Sự khác biệt giữa vector và raster trong thể hiện cấu trúc line


*Nguồn dữ liệu raster

Ảnh chụp từ vệ tinh, ảnh chụp từ máy bay, ảnh quét, ảnh chụp. Trong đó ảnh chụp từ vệ tinh là cách lấy dữ liệu tốn kém nhất nhưng lại có ý nghĩa to lớn trong việc nghiên cứu tình hình biến đổi của các sự vật trên trái đất theo thời gian. Ảnh chụp từ máy bay giúp ta vẽ bản đồ một cách chi tiết. Ngoài ra ta còn raster còn có thể được tạo ra bằng cách chuyển đổi từ nhiều nguồn dữ liệu khác như vector hay TIN.

Cấu trúc dữ liệu Raster GIS có hai kiểu chính: cấu trúc dữ liệu raster đơn giản và cấu trúc dữ liệu raster phân cấp. Trong cấu trúc dữ liệu raster, point có

thể được biểu diễn bằng một cell. Line được biểu diễn bởi một tập các cell có hướng xác định, độ rộng của line bằng chiểu rộng của một cell. Polygon được biểu diễn bởi một dãy các cell nằm kề sát nhau.


Hình 1 11 Biểu diễn các đối tượng cơ sở trong Raster 1 2 2 2 Mô hình thông tin 3

Hình 1.11: Biểu diễn các đối tượng cơ sở trong Raster.

1.2.2.2.Mô hình thông tin thuộc tính

Số liệu phi không gian hay còn gọi là thuộc tính là những mô tả về đặc tính, đặc điểm và các hiện tượng xảy ra tại các vị trí địa lý xác định. Một trong các chức năng đặc biệt của công nghệ GIS là khả năng của nó trong việc liên kết và xử lý đồng thời giữa dữ liệu bản đồ và dữ liệu thuộc tính. Thông thường hệ thống thông tin địa lý có 4 loại số liệu thuộc tính:

- Đặc tính của đối tượng: liên kết chặt chẽ với các thông tin không gian có thể thực hiện SQL (Structure Query Language) và phân tích

- Số liệu hiện tượng, tham khảo địa lý: miêu tả những thông tin, các hoạt động thuộc vị trí xác định.

- Chỉ số địa lý: tên, địa chỉ, khối, phương hướng định vị, …liên quan đến các đối tượng địa lý.

- Quan hệ giữa các đối tượng trong không gian, có thể đơn giản hoặc phức tạp (sự liên kết, khoảng tương thích, mối quan hệ đồ hình giữa các đối tượng).

Để mô tả một cách đầy đủ các đối tượng địa lý, trong bản đồ số chỉ dùng thêm các loại đối tượng khác: điểm điều khiển, toạ độ giới hạn và các thông tin mang tính chất mô tả (annotation).

Annotation: Các thông tin mô tả có các đặc điểm:

• Có thể nằm tại một vị trí xác định trên bản đồ

• Có thể chạy dọc theo arc

• Có thể có các kích thước, màu sắc, các kiểu chữ khác nhau


nhau.

• Nhiều mức của thông tin mô tả có thể được tạo ra với ứng dụng khác


• Có thể tạo thông tin cơ sở dữ liệu lưu trữ thuộc tính

• Có thể tạo độc lập với các đối tượng địa lý ïcó trong bản đồ

• Không có liên kết với các đối tượng điểm, đường, vùng và dữ liệu thuộc

tính của chúng

Bản chất một số thông tin dữ liệu thuộc tính như sau:

- Số liệu tham khảo địa lý: mô tả các sự vật hoặc hiện tượng xảy ra tại một vị trí xác định. Chúng mô tả các danh mục hoặc các hoạt động như cho phép xây dựng, báo cáo tai nạn, nghiên cứu y tế, … liên quan đến các vị trí địa lý xác định. Các thông tin tham khảo địa lý đặc trưng được lưu trữ và quản lý trong các file độc lập và hệ thống không thể trực tiếp tổng hợp chúng với các hình ảnh bản đồ trong cơ sở dữ liệu của hệ thống. Tuy nhiên các bản ghi này chứa các yếu tố xác định vị trí của sự vật hay hiện tượng.

- Chỉ số địa lý: được lưu trong hệ thống thông tin địa lý để chọn, liên kết và tra cứu số liệu trên cơ sở vị trí địa lý mà chúng đã được mô tả bằng các chỉ số địa lý xác định. Một chỉ số có thể bao gồm nhiều bộ xác định cho các thực thể địa lý sử dụng từ các cơ quan khác nhau như là lập danh sách các mã địa lý mà chúng xác định mối quan hệ không gian giữa các vị trí hoặc giữa các hình ảnh hay thực thể địa lý. Ví dụ: chỉ số địa lý về đường phố và địa chỉ địa lý liên quan đến phố đó.

- Mối quan hệ không gian: của các thực thể tại vị trí địa lý cụ thể rất quan trọng cho các chức năng xử lý của hệ thống thông tin địa lý. Các mối quan hệ không gian có thể là mối quan hệ đơn giản hay lôgic, ví dụ tiếp theo số nhà 101 phải là số nhà 103 nếu là số nhà bên lẻ hoặc nếu là bên chẵn thì cả hai đều phải là các số chẵn kề nhau. Các quan hệ không gian có thể được mã hoá như các thông tin thuộc tính hoặc ứng dụng thông qua giá trị toạ độ của các thực thể.

- Mối quan hệ giữa dữ liệu không gian và phi không gian: thể hiện phương pháp chung để liên kết hai loại dữ liệu đó thông qua bộ xác định, lưu trữ đồng thời trong các thành phần không gian và phi không gian. Các bộ xác định có thể đơn giản là một số duy nhất liên tục, ngẫu nhiên hoặc các chỉ báo địa lý hay số

liệu xác định vị trí lưu trữ chung. Bộ xác định được lưu trữ cùng với các bản ghi toạ độ hoặc mô tả số khác của các hình ảnh không gian và cùng với các bản ghi số liệu thuộc tính liên quan.

Sự liên kết giữa hai loại thông tin cơ bản trong cơ sở dữ liệu GIS thể hiện theo sơ đồ sau:


Hình 1 12 Mối quan hệ giữa thông tin bản đồ và thông tin thuộc tính Nguồn 4

Hình 1.12: Mối quan hệ giữa thông tin bản đồ và thông tin thuộc tính (Nguồn: Nguyễn Thế Thận, Trần Công Yên, 2000)

1.3 Quy trình xây dựng cơ sở dữ liệu trong GIS

1.3.1. Quy trình xây dựng cơ sở dữ liệu trong GIS

Hình 1.13 :Quy trình xây dựng cơ sở dữ liệu trong GIS


Các tham khảo ban đầu

(Xác định vùng nghiên cứu, mục tiêu, nội dung của CSDL GIS)


Khời đầu

Các lựa chọn

Các lớp thông tin, lưới chiếu, tỷ lệ bản đồ, phần mềm xử lý và lưu trữ


Thu thập bản đồ, số liệu

Nhóm dữ liệu không gian


Bản đồ nền

Bản đồ chuyên đề

QUY TRÌNH XÂY DỰNG CSDL GIS

ảnh vệ tinh

ảnh máy bay

...........


THU THẬP DỮ LIỆU

Nhóm dữ liệu thuộc tính


Bảng biểu thống kê

Báo cáo khoa học

Tài liệu nghiên cứu

...........




NHẬP VÀ KẾT NỐI DỮ LIỆU VÀO CSDL GIS

Tổ chức CSDL

Hệ thống hoá các lớp thông tin nền, chuyên đề...


Lưu trữ, quản lý DL

Xác định các thông tin thuộc tính cho từng đối tượng. Mã hoá các giá trị thuộc tính




BIÊN TẬP, KIỂM TRA HIỆU CHỈNH CSDL



LƯU TRỮ VÀ QUẢN LÝ DỮ LIỆU

Để xây dựng CSDL GIS cần tuân theo các bước cơ bản sau :

a. Giai đoạn khởi đầu :

Trong giai đoạn này cần phải xác định phạm vi khu vực nghiên cứu và phải xác định rõ : CSDL nhằm mục đích gì, cho ai dùng và bao gồm những nội dung gì. Từ đó sẽ quyết định những nội dung tiếp theo trong quy trình xây dựng CSDL GIS. Tùy từng mục đích khác nhau mà CSDL sẽ có cấu trúc khác nhau, dữ liệu sẽ được tổ chức khác nhau và có các thuộc tính khác nhau. Từ những mục tiêu trên sẽ quyết định lựa chọn các lớp thông tin cần có trong CSDL, lựa chọn lưới chiếu, tỷ lệ bản đồ và lựa chọn phần mềm sử dụng trong CSDL GIS.

b. Thu thập bản đồ, số liệu cần thiết :

Đây là bước quan trọng. Những tài liệu thu thập là các bản đồ nền, bản đồ chuyên đề, các tài liệu ảnh vệ tinh, ảnh máy bay của khu vực nghiên cứu, các bảng biểu thống kê, các báo cáo khoa học, các tài liệu nghiên cứu có liên quan đến mục đích và nội dung của CSDL.

Những tài liệu này được chia thành hai nhóm chính. Đó là các dữ liệu không gian (dữ liệu bản đồ) và dữ liệu thuộc tính thể hiện đặc trưng của các đối tượng nghiên cứu. Điều này còn liên quan đến sự lựa chọn phương pháp lưu trữ dữ liệu.

c. Tổ chức CSDL :

Bước này bao gồm :

- Hệ thống hóa các lớp thông tin trong CSDL (lớp thông tin nền, lớp thông tin chuyên đề). Tùy theo mục đích, yêu cầu mà lựa chọn và hệ thống hóa dữ liệu thành các lớp thông tin, có thể là các lớp thông tin dạng raster, dạng vector (điểm, đường, vùng) hoặc là dạng text...

- Xác định các thông tin thuộc tính cho từng đối tượng địa lý. Những thông tin thuộc tính được sắp xếp theo đặc điểm và tính chất của dữ liệu để lựa chọn phương pháp lưu trữ. Với những thông tin định lượng, quản lý bằng số nguyên, số thập phân hay số thực. Còn với các thông tin định tính, miêu tả hay phân loại thì mã hóa các giá trị thuộc tính hoặc đặc tả bằng ký tự.

..... Xem trang tiếp theo?
⇦ Trang trước - Trang tiếp theo ⇨

Ngày đăng: 20/04/2023