1、尺度与比例尺 尺度(scale)是指在研究某一物体或现象时所采用的空间或时间单位,又可指某一现象或过程在空间和时间上所涉及到的范围和发生的频率。简言之,尺度就是客体在其“容器”中规模相对大小的描述。尺度问题包括空间尺度和时间尺度两方面内容。尺度往往以粒度和幅度来表达。粒度原是物理学的概念,指对“微粒大小的平均度量”,在这里被借用作研究对象的最小可辨识单元;幅度是指研究对象在空间或时间上持续的范围或长度。尺度是与地理现象相关的最基本的但也是较难以理解和容易混淆的概念之一。由于不可能观察地理世界的所有细节,因此,尺度已成为各种地理信息的重要特征。加之地理现象和过程的尺度行为并非按比例线性均匀变化,因此需要研究地理实体的空间形态和过程随尺度变化的规律。 在不同的学科领域中,尺度的含义是不同的。在测绘学、地图制图学和地理学中通常把尺度表述为比例尺(英文也是scale),地图比例尺就是地图上的尺寸与它所表达的实际尺寸之间的比率。但是在GIS环境中,比例尺的概念发生了一定的变化,它使多比例尺表达成为可能,空间数据库可以包含很多种不同比例尺的地图。这时的比例尺应该称之为地理比例尺或空间比例尺,它不仅隐含着传统意义上的距离比率的含义,而且反映的是一种空间抽象的程度。数字环境下的“比例尺”用“空间分辨率”来代替最好不过。 2、数据融合、地图合并与自动综合 数据融合(fusion)是由于近年来人类面临着“数据与知识”的巨大挑战,人们渴望利用更多的信息做出正确的决策、判断应运而生的术语。就遥感界而言,数据融合的主要目的是通过对不同空间、时间序列和不同探测机理的遥感数据融合,来增强遥感图像的几何、时间和光谱分辨率,提高对目标的识别能力。目前关于数据融合的定(含)义,比较全面、确切的阐述是:数据融合是一种多层次、多方面的处理过程,通过这个过程对多源数据进行检测、相关、估计和组合,以达到精确的状态估计和身份估计,以及完整、及时的态势评估和威胁评估(Wald,1998)。可见,数据融合不仅仅是数据的简单的复合,而是强调信息的优化,以突出有用的专题信息,消除或抑制无关的信息,改善目标识别的图像环境,从而增加解译的可靠性,减少模糊性、改善分类、扩大应用范围和效果。融合后的数据失去数据的特征,而产生新的综合数据。融合数据产生了质的变化,甚至产生了新的数据。图像融合的具体目标在于提高空间分辨率、改善几何精度、增强特征显示能力、改善分类精度、提供变化检测能力、替代或修补图像数据的缺陷等。 地图合并(merge,conf1ation)是指同一地区两幅或两幅以上不同的地图合并成一幅图,新生成的地图在某些方面如点位精度、详细程度或现势性等比各源图都好。conflation一词来源于拉丁文conf1are,意思是绑在一起。在国外的GIS教科书中conflation被定义为地图编绘过程中的一个操作,即协调各图层中相关地物的位置。现实世界中,同一地物的数据往往被不同的部门重复采集,这些重复采集的数据不仅比例尺、点位精度可能不同,而且经常是数据内容、属性信息都不同,为了充分利用已有的信息,减少数据采集的高额开销,GIS部门经常需要将这些不同来源的数据合并在一起使用,这就产生了地图合并技术。美国人口调查局TIGER数据库的属性信息丰富而点位精度相对较差。为了进一步发挥TIGER数据库的作用,上世纪80年代中期开始与美国地质测量局(USGS)合作,利用USGS高精度的DLG来更新TICER数据库,这是世界上最早的地图合并研究。 随着GIS应用领域的不断扩展和需求层次的日益提高,人们越来越多地需要在不同分辨率、不同空间尺度上对地理现象进行观察、理解和描述,即越来越多地需要对多尺度的空间数据进行分析、处理和表达。GIS中,同时存在几种不同比例尺的空间数据的现象被称为GIS的多比例尺性,相应的GIs被称为“多比例尺GIS”或“多分辨率GIS”。多比例尺GIS主要有两种表达形式,第一种是一库多版本,即在GIS中建立一个比较大的比例尺的主导数据库,其他比例尺(一般都小于主导数据库比例尺)的数据将由主导数据库中的数据直接转换而来,形成多个版本的空间数据库,这种形式也称为“基于主导数据库的多种表达”;第二种是多库多版本,即在GIS中建立对应于多种比例尺的多个数据库,这也称为“多重表达数据库”。可以想象,第二种形式存在许多弊端:建库耗资巨大,数据库维护和更新困难,产生大量数据冗余,同一实体的多个表示之间的不一致性使跨尺度分析时可能导致严重的数据矛盾。因此,第一种形式是GIS的奋斗目标,这也就是地图自动综合产生的背景。地图自动综合(generalization)就是从一个原始的数据库(即主导数据库,其比例尺一般较大)中抽取重要的和相关的空间信息,以预定的比例尺将其表示在较小的数据库中,并生成可视化地图产品的过程。这个研究主题是Tobler(1996)提出的,他提出了计算机制图综合处理的一些基本原则。显然,地图自动综合是一种非常有效的方式,它可以降低数据采集、存贮、检查和更新的费用,同时也可以提高数据库的稳定性和潜在价值。目前,自动综合是困扰地图学和GIS界实现空间数据自动处理和合理可视化的国际性难题。 3、GIS集成与3S集成 集成是英语integration一词的中译文,有结合、综合、一体化的含义。英国拉夫堡大学Weston教授对于集成有一个简洁的定义:“集成是将基于信息技术的资源及应用(计算机硬件/软件、接口及机器)集聚成一个协同工作的整体”,“集成包含功能交互、信息共享及数据通讯”。组成系统各个部分集成在一起的功能应大于各组成部分单独功能之和,即“1+1>2”。因此,集成是一种有机的结合、在线的连接、实时的处理和系统的整体性。集成的核心在于组成系统各部分之间的有机结合,将分散的系统集成形成一个统一的整体,以取得系统的协同利益。GIS集成应该是全方位的,主要包括:空间数据和属性数据的集成、多源数据的集成、基于元数据的GIS集成、GIS与应用模型的集成、GIS与知识规则库的集成、GIS与超媒体的集成、GIS与应用平台的集成等。 众所周知,3S是目前对地观测系统中空间信息获取、存贮、管理、更新、分析和应用的三大支撑技术。随着3S技术研究和应用的不断深人,科技人员和应用部门都逐步认识到单独地运用其中一种技术往往不能满足综合性工程的需要,不能提供所需的对地观测、信息处理、分析模拟的综合能力。于是,近年来3S技术的集成越来越受到关注并加大力度开展研究,以更有效地解决全球变化、精准农业、生态环境保护、交通运输等诸方面的问题。近几年,国际上3S的研究和应用向集成化(或综合化)方向发展。3S集成是一种“复合技术”,涉及多个领域的技术,是一项难度大的高新技术,在理论和技术上有许多问题需要系统研究解决,但应用前景十分广阔。 4、数据挖掘与知识发现(DM&KD) 数据库急剧增长与人们对数据库处理和理解困难之间形成了强烈的反差。“人们被数据淹没,但却饥饿于知识”正是这一反差的生动写照。戈尔在“数字地球”的演讲中描述这种挑战,“充分利用这些浩瀚的数据的困难在于把数据变得有意义——即把原始数据变成可理解的信息。今天,我们经常发现我们拥有很多数据,却不知道如何处置”。数据挖掘与知识发现(Data Mining and Know1edge Discovery,简称DMKD)就是在数据和数据库急剧膨胀的背景下应运而生的,是随着人工智能和数据库技术的发展而出现的一门新技术。 DMKD起源于从数据库发现知识(Knowledge Discover in Database,简称KDD),它首次出现在1989年8月举行的第十一届国际联合人工智能学术会议上。KDD的定义为“从数据中发现隐含的、先前不知道的、潜在的有用信息的非凡过程”。在《知识发现与数据挖掘进展》(论文集)中,Fayyad等人重新给KDD和数据挖掘下定义。KDD的新定义为:KDD是从数据中辨别有效的、新颖的、潜在有用的、最终可理解的模式过程。数据挖掘(DM)的定义为:数据挖掘是KDD中通过特定的算法在可接受的计算效率限制内生成特定模式的一个步骤。这样数据挖掘就成为KDD的难点和关键步骤。但人们倾向于将二者不加区别地联合使用(即DMKD),或更简单地使用数据挖掘(DM)。 5、虚拟与仿真 虚拟技术即虚拟现实(virtual Reality)技术,指运用计算机技术生成一个逼真的、具有视觉、听觉、触觉等效果的可交互、动态世界,人们可以对该虚拟世界中的虚拟实体进行操作和考察。 仿真(imitation,simulation)技术与虚拟现实技术有很多相同的地方,但存在一定的差别,仿真技术的特点是:①用户对虚拟的物体只有视觉或听觉,没有触觉;②用户没有亲临其境的感觉,只是旁观者的感觉;③不存在交互作用;④如用户推动计算机环境中的物体,不会产生符合物理的、力学的行为或动作。 6、数据库与数据仓库 谈到数据仓库(data warehouse),很容易将它理解为存储着涵盖现在与过去数据的超大型数据库,这一理解是十分狭窄的,因为这不是区分传统数据库和数据仓库的关键。过去关系型数据库(RDB)强调数据的增加、删除和修改的快速与稳定,以及大量数据的变动或修改可以借助于数据库系统的管理能力来保证安全。数据仓库的设计理念是强调迅速地获得大量数据并对数据具有分析能力。目前,数据仓库一词尚没有统一的定义,著名的数据仓库专家W.H.Inmon在其著作《Building the Data Ware-house》一书中给予如下描述:数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。对于数据仓库的概念可以从两个层次予以理解,首先,数据仓库用于支持决策,面向分析型数据处理,它不同于现有的操作型数据库;其次,数据仓库是对多个异构数据源的有效集成,集成后按照主题进行了重组,并包含历史数据,存放在数据仓库中的数据一般不再修改。 |