第二章 地理数据概念

 

GIS项目中的第一步是生成数字化的地图数据库. 要数字化操作地图, 你首先必须明确该存储哪些信息, 数据结构怎样, 记录怎样存储, 以及你希望怎样使用你的地图数据库. GIS的数据模型使你可以在计算机中表示地图. 一旦你掌握了数字地图是怎样生成和存储的, 你就可以开始构造你自己项目的数据库了.

本章主要讨论一下的问题:

  • 两种最基本的地图信息: 空间信息和属性信息.
  • 主要的地理特征类型: 点, 线, 面.
  • 计算机怎样以x,y坐标的形式存储地理信息的.
  • 拓扑以及其作用.
  • 属性信息是怎样在计算机中以表格存储的
  • 空间信息和属性信息是怎样通过共同标识项连接的

地图的基本概念

地图信息分为两大类:

  • 空间信息: 描述地理特征的位置和形状, 以及与其它空间特征之间的关系.
  • 属性信息: 描述地理特征相关的属性.

地图特征:地图通过地图符号表示和传达特征的信息. 点用来代表象井,电杆这些特征的位置; 线用来表示路, 溪流, 水管这样的线性特征; 面表示的则是象湖泊, 郡县边界, 调查区域这样的特征.

  • 点特征: 一个离散的位置, 用一个特殊的符号或者标签表示, 是谓点特征. 它定义的是边界或者面积太小而不能用线或面来表示的地图对象. 也可以用来表示没有面积的位置, 如山顶位置.
  • 线特征: 指一系列的有序坐标点位, 连接起来代表地图上太窄而不能用面来表示的对象. 同时, 线也可以用来表示没有宽度的特征, 如等高线. 在ArcInfo中, 线被称为arc.
  • 面特征: 表示一个封闭的对象, 其边界所包围的是一个同性质的区域, 如州, 国家, 或者水体.

空间关系:地图同时也图示化地表示了各特征之间的空间关系, 当然这种关系要使用者自己去翻译解释. 例如, 通过一张地图, 你可以告诉别人一个城市是否与湖泊紧邻, 可以知道两个城市之间的距离, 以及最近的道路, 找到最近的医院以及到那里的最佳路线; 通过等高线可以估计一个湖泊的水面高程,等等. 地图并没有明白地表示出这些信息, 你只能够自己从地图中提取解释这些信息.

代号和标签描述的属性信息:地图显示出特征所在的位置以及其特性(即属性), 这样你才能比较容易地作出解释. 地图上特征的属性是用图形符号表示的. 例如, 不同的道路是用不同宽度,模式和颜色的线条以及标签来标绘的; 溪流用蓝色的线条表示, 并注记其名字; 医院位置用"十"字形符号表示出; 湖泊通常用蓝色填充; 森林用青色表示, 等等. 通过这种方式, 地理特征就可以和其属性信息一起显示出来.

存储地理数据

数字地图数据库也存储两种类型的信息: 空间信息和属性信息. 计算机存储包含表示地图特征的一系列的文件. GIS的功能主要体现在它能够连接这两种不同的信息并维护特征之间的空间关系.

表格数据和图形数据之间的集成开辟了观察和分析数据的新方式. 你可以通过地图而取得存放于表格中的属性信息, 也可以根据表格中存放的信息来生成地图. 例如, 你可以把鼠标指向地图中的任一目标并显示其相关的描述信息, 也可以通过存储于表格中的信息来生成新的地图. 这样计算机就必须同时以其可以识别和处理的文件格式来存储图形和表格数据.

在计算机中表示地图:地球表面上的各种特征都被表示为二维地图平面上的点线面. 地图上使用x,y坐标系统来表示特征在地表的位置.

所有的点都以单独的x,y点位来记录. 线以一系列有序的x,y坐标来记录表示. 面用一系列的封闭的线段来表示. 通过使用x,y坐标, 你可以用一系列的坐标值来表示点线面, 而不再需要用图形或图像来表示了.表示面的点坐标其首尾应该是同一个点. 点坐标值有两种方式: 地图页面坐标或者真实世界坐标. 地球上三维点通过投影转换到二维平面. 地图单位和真实世界坐标之间通过坐标转换完成.

多个特征的表示:计算机中存储表示单一特征的坐标值是很容易的. 如果你有很多的特征, 每个特征可以赋予一个序列号或标识号.这样就可以有序地记录各个特征的坐标值.

拓扑是什么??? 现在你已经知道了点线面可以用来表示地图特征. 但是如前面已经提及的, 你还需要从地图上得到额外的关于特征之间的空间关系. 比如,通过地图, 你需要找到从机场到旅馆的道路; 同理, 你可以知道两个地块是相邻的, 其旁边又是哪条街道. 你是通过识别道路的连通性, 区域的邻接性, 以及与线状地物之间的相邻来得出这些结论的.

在数字化的地图中, 这些结论是通过拓扑关系来得出的. 拓扑是精确地描述空间关系的数学过程. 其基本的理论是很简单的. ArcInfo中用到的最基本的拓扑概念有三:

  • 连通性: 弧段是通过节点相连接的
  • 多边形定义: 相互连接的线段围成的闭合区域称为多边形
  • 邻接性: 弧段有方向性, 有其左边和右边

生成和存储拓扑关系有很多好处. 拓扑能更有效的存储数据, 从而可以处理更大的数据集或处理速度更快. 当拓扑关系建立以后, 你就能够执行模拟水流网络分析, 合并有相同属性的相邻的多边形, 执行地理特征的叠加操作等.

连通性: 弧段-节点拓扑

弧段上的点称为结点, 定义了弧段的形状. 弧段的端点称为节点. 每条弧段都有两个节点: 始节点和终节点. 弧段只在节点处相连接. 通过追踪通过任一节点的弧段, ArcInfo可以知道哪些弧段是相连接的. 例如, 弧段3,4,5共有一个节点, 系统就可以知道从弧段3 可以直接转入弧段5, 而不能直接转到弧段9, 因为弧段9和3没有共同的节点.

多边形定义: 多边形-弧段拓扑

多边形是用一系列的互相连接并闭合的x,y坐标对来表示的. 一些系统以这种格式来存储多边形. 但是ArcInfo存储用来定义多边形的弧段.一系列能构成多边形的弧段被存储起来, 并用于建立拓扑关系. 而这些弧段也单独存储起来并在需要的时候用来表示多边形(如绘制多边形的时候). 这样尽管弧段号会出现多次, 但是每条弧段只存储了一次, 这样可以减少数据量, 同时可以确保相邻的多边形不会重叠.

邻接性: 左右多边形拓扑关系

由于每条弧段都是有方向的, ArcInfo保存每条弧段的左右多边形号. 共享同一弧段的多边形是邻接的. 注意外多边形的定义.

地图信息的组织:你现在已经知道了地理数据是以一系列表示点线面的x,y坐标对来存储的. 你也明白拓扑是怎样用来描述空间特征的关系的. 现在, 我们看看信息是怎样组织的.

地图特征是以一系列的逻辑层或主体来组织的. 一张地图可以分成溪流,土壤,水井,行政区等多个层次. 而且, 小的区域, 如一幅地图所表示的区域, 可以合并起来称为大的区域, 即研究区.

ArcInfo Coverages:每个层在ArcInfo中都被称为coverage. 一个coverage可以包含有拓扑关系的地理特征以及与特征相联系的属性信息. 我们已经讨论了点,线, 面这些特征. coverage还包含另外的一些特征, 如标签点和TIC.

点特征与标签点: 在ArcInfo中, 点有两种用途: 在点coverage中标识点状地物, 如水井, 学生, 或犯罪地点. 而标签点是用在多边形coverage中标识多边形的点, 通常放置于多边形中. 多边形通过标签点与其属性连接.

TIC: TIC代表其真实世界坐标已知的地面上的点. coverage使用共同的TIC点使各个层能很好地注册坐标, 也用于管理相邻的地图单.

Coverage特征总结表

特征类型 描述 属性表 例子
弧段 用有序的一系列点定义, 代表线状特征 AAT 街道,等高线,电线
节点 弧段的终点, 或几条弧段相连的地方 NAT 电线杆, 阀门
标签点 用x,y表示的点, 表示地物或标识多边形 PAT 水井, 山顶
多边形 由相连弧段(边界)所定义的区域, 包括岛或湖 PAT 土壤, 土地利用
由多边形特征组成的区域 PAT.subclass 野生动物活动区
TIC 地理控制点, 用于坐标注册和转换 TIC
注记 用于描述地理特征的文字串 TAT.subclass 地名, 街道名
路径 由一或多个弧段或部分弧段组成的线性特征 RAT.subclass 等高线, 街道, 管道
用于定义路径的弧段或部分弧段 SEC.subclass 路径的组成单位

属性数据在计算机中的表示: 属性数据在计算机中用一系列的数字或文字来表示和存储. 如

  • 街道类型: 1--高速公路, 2--干线, 3--主道, 4--居民道路, 5--未铺面的路
  • 路表特征有: 水泥道路, 沥青道路, 砾石道路
  • 道路宽度: 用米来表示
  • 车道数: 具体数目
  • 道路名称: 用文字串来表示

显然, 道路在计算机中就可以这样存储:

道路类型 路表特征 道路宽度 车道数 路名
2 沥青 16 4 五一路
1 水泥 32 8 泉厦路
4 水泥 10 2 学区路

ArcInfo将这些属性用特定格式的表格存储在INFO下, 称为INFO表.当然, ArcInfo也可以利用其它格式的关系型数据表格.

特征与属性的连接:如我们前面所说的, GIS的能力就在于它能够将空间数据和属性数据连接起来. 这些连接主要特征为:

  • 地图上的特征与属性表格中记录一对一的关系
  • 每个特征被赋予一个独一无二的数字标识. 通过这个标识来连接特征与属性.即: USER-ID.
  • 这个数字标识分别存储于记录点坐标的文件中和特征属性表格中.

ArcInfo自动维护和保持这种连接. 通过这种连接, 你可以从地图上查询显示相应的属性, 也可以根据属性来生成制作地图.

关系操作--连接和合并:上面所讲的显然不只是用于追踪特征和属性之间的联系. 你可以连接任何两个有共同属性的表格. 相关是通过公共项来建立两个表格之间的暂时的联系. 在相关的情形下, 表格的每一个记录都与另一个表格的一条相同有公共项值记录相连接. 通过相关可以通过将没有存储在同一个表格中的数据联系起来而"扩展"属性表格.

与相关只是暂时连接两个数据表格不同, 合并操作是通过公共项将两个表格合并成一个.

ArcInfo可以连接或者合并包含属性信息的INFO数据文件. 如果采用的是相关, 则表格可以单独地维护和更新.

尽管概念简单, 相关和合并却是GIS的基础. 它们被频繁地使用. 例如进行空间叠加操作时, 每一个新生成的特征都含有用于生成它的特征的属性. 多边形叠加是一个空间合并, 记录的匹配是根据与它们相关联的特征的位置而非两个表格的共同项进行的. 例如, 将土地利用图与土壤类型图叠加, 新生成的每块图斑都同时包含有土壤类型和土地利用的信息.

在地图显示过程中, 你将可以用相关表格中存储的特征属性值来绘制地图. 例如, 你可以将土地利用划分为住宅, 商业, 工业三类, 每种类型在关联表格中赋予不同的填充符号代号. 在显示地图时, 每种利用方式都可以用不同的填充符号表示出来.

在这种多对一的相关中, 一个表格中的很多记录可能只与另外一个表格中的某一个记录相关联. 这样可以减少需要的数据存储空间.

除了coverage之外, ArcInfo还采用了一系列的数据模型来表示空间数据. 每种模型都有其长处和短处. ArcInfo支持的地理数据格式包括:

data set Structure Spatial objects Attribute table Uses
Coverages
  • vector
  • arc-node
  • topological
  • georelational
  • label points
  • arcs
  • nodes
  • polygons
  • annotations
  • routes
  • sections
  • tics
  • PAT
  • AAT
  • NAT
  • PAT
  • TAT
  • RAT
  • SEC
  • TIC
  • Cartographic database
  • Automation and update of spatial data
  • Linear feature modeling
  • Base map of cartography
  • Spatial database management
Grids
  • raster
  • georalational
  • cells
  • VAT
  • Spatial analysis and modeling
  • Spatail process modeling (runoff, file spread, orridorcalcualtion ) Surface representation
  • Scanning for data automation
Tins

surface triangulated irregular network

  • xyx nodes
  • edges
  • triangles
None
  • Surface representation (especially terrrain)
  • Surface modeling and display (e.g., 3-D display, profiles
Lattices surface digital elevation model, grid, raster xyz points None
  • Surface representation
  • Surface modeling and display (e.g., cut-fill shaded relief, 3-D display, slope/aspect)
Images

raster

  • pixels
  • bands
None
  • Images and map picture
  • Images as attributes
  • Data automation
  • Display
  • Change detection
  • Multimedia database
Drawings CAD entities layers None
  • Drawing and map backdrops
  • Drawings as attributes

本章结束.