1.01k likes | 1.14k Views
计算机地图制图原理. 空间数据与地图数据库. 参考教材: 1.《 计算机地图制图原理 》 徐庆荣等 编著 武汉测绘科技大学 1997 年 12 月 2.《 地理信息系统教程 》 胡鹏,黄杏元等 编著 武汉大学出版社 2002 年 2 月. 主要内容. 第一部分 空间数据基本特征及其表示 第二部分 地图数据结构 第三部分 地图数据库系统. 第一部分 空间数据基本特征及其表示. 分为三个部分来讲: 一 . 空间数据的主要内容 二 . 拓扑关系介绍 三 . 多边形拓扑的建立. 一 空间数据主要内容. 1.1 地理空间数据的定义
E N D
计算机地图制图原理 空间数据与地图数据库 参考教材: 1.《计算机地图制图原理》 徐庆荣等 编著 武汉测绘科技大学 1997年12月 2.《地理信息系统教程》 胡鹏,黄杏元等 编著 武汉大学出版社 2002年2月
主要内容 • 第一部分 空间数据基本特征及其表示 • 第二部分 地图数据结构 • 第三部分 地图数据库系统
第一部分 空间数据基本特征及其表示 分为三个部分来讲: 一.空间数据的主要内容 二.拓扑关系介绍 三.多边形拓扑的建立
一 空间数据主要内容 1.1 地理空间数据的定义 1.2 空间数据的地理参照系和控制基础 1.3 空间数据的特征 1.4 GIS的数据质量 1.5 空间数据标准
1.1 地理空间数据的定义A 地理空间数据是指以地球表面空间位置为参照,描述自然、社会和人文经济景观的数据。 • 这些数据可以是图形、图像、文字、表格和数字等,由系统建立者通过数字化仪、扫描仪、键盘、磁带机或其它系统通讯输入GIS,是GIS所表达的现实世界经过模型抽象的实质性内容。 常用的数据有:图像数据(如:遥感卫星像片、航片的影像数据);地图数据(如:普通地图、专题地图的各个要素);地理统计数据(如:人口分布、作物分布等);环境监测数据。
1.2 地理空间数据的定义B GIS的空间数据包括三个互相联系的方面: 1.在某个已知坐标系中的位置:即用几何坐标标识地理实体的空间位置,如经纬度、平面直角坐标、极坐标等,采用数字化仪输入时,常采用数字化仪直角坐标或屏幕直角坐标。 2.实体间的空间相关性:地理事物点、线、面实体间的空间联系,用拓扑关系(Topology)来表示。 3.与几何位置无关的属性(At tribute):指地理事物或现象的性质(描述)。属性分为定性和定量的两种: 定性——包括名称、类型、特性等,如气候类型、土地利用等。 定量——包括数量和等级等,如面积、长度、土地等级。
1.3 地理参照系和控制基础A 一.地球的形状 地球近似球体,其表面高低不平,极其复杂。 在测量工作中,把一个假想的,与静止的海水面重合并向陆地延伸且包围整个地球的特定重力等位面称为大地水准面。常用平均海水面代替静止的海水面。 大地水准面、铅垂线——测量工作外业所依据的基准面和基准线; 总地球椭球和参考地球椭球:我国1952年以前采用海福特椭球,1953年改用克拉索夫斯基椭球,1978年以后改用国际椭球,并以此为基础建立了我国新的、独立的大地坐标系—1980国家大地坐标系。
1.4 地理参照系和控制基础B 二.坐标系 1.坐标系是指确定地面点或空间目标所采用参考系。与测量相关的坐标系是地理坐标系和平面坐标系。 2.地理坐标系(L,B) 两种测量方法:天文测量与大地测量。我国1954年北京坐标系和1980年国家大地坐标系。 3.平面坐标系:球面->平面(涉及到地图投影)。 三.高程系 1.高程是指高程基准面起算的地面点的高度。 2.我国原来是1956年黄海高程系;现在是1985国家高程基准。
1.5 空间数据的特征 一. 空间数据有三个特点 1.定位信息:也称度量信息、几何数据或者图形数据。 2.非定位信息:也称语义信息、属性数据或者描述数据。 3.时间信息:无论是定位信息或是非定位信息,都是某一个时刻采集的空间信息。所以空间与时间相互联系不能分割。 二.物体之间的相互关系 物体间的关系分为两种:空间相关关系和属性相关关系。空间相关关系是指顺序空间关系(方向)、度量空间关系(距离)、拓扑空间关系(实体间的相邻、关联和包含)三类。
1.6 GIS的数据质量 1.定义:GIS的数据质量是指GIS中空间数据(几何数据和属性数据)的可靠性,通常采用空间数据的误差来度量。 2.目的:是建立一套空间数据的分析和处理体系,包括误差源的确定、误差的鉴别和度量方法、误差传播模型、控制和消弱误差等。在未来的社会中提供GIS的合格证制度。 3.研究角度:从应用来看,GIS数据质量包含两大类问题。当GIS录入数据的误差和各种操作中引入的误差已知时,计算GIS最终产品的误差大小的过程叫正演问题;根据用户对GIS产品提出误差限值,确定录入数据质量叫反演问题。
1.7 空间数据标准 1.定义 空间数据标准指空间数据的名称、代码、分类编码、数据类型、经度、单位、格式等的标准形式。 2.空间元数据 元数据(Metadata):数据的数据,是关于数据和信息资源的描述性信息。 典型例子:图书馆的图书卡片就是所有书籍的件单元数据,它记录料每本书的编号、题目、作者、关键字和出版日期等属性。 3.OpenGIS :Open Geodata Interperability Specification 开放的地学数据互操作规范
二 拓扑关系介绍 2.1 拓扑的来源 2.2 为什么要研究地图上的拓扑关系 2.3 建立拓扑关系的基本概念 2.4 基本的拓扑关系 2.5 拓扑关系的表示 2.6 Arc/Info中拓扑关系的构建
2.1 拓扑的来源 1.拓扑的来源 “拓扑(Topology)”一次来自希腊文,它的原意是“形状的研究”。拓扑学时几何学的一个分支,它研究在拓扑变换下能够保持不变的几何属性——拓扑属性。 例子:设想一块高质量的橡皮,它的表面是欧几里的平面,这块橡皮可以任意被拉伸、压缩,但是不能够被扭转或折叠。在橡皮的表面上有由结点、弧、环、面组成的可能任意图形。我们对橡皮进行拉伸、压缩,在橡皮进行这些变换的过程中,图形的一些属性消失,一些属性将继续保持存在。设想象皮表面有一个多边形,里面有一个点。当拉伸、压缩橡皮时,点依旧在多边形中,点和多边形的位置关系不会发生变化,但是多边形的面积会发生变化。所以:“点的内置”是拓扑属性,而面积不是拓扑属性,拉伸和压缩就是拓扑变换。
2.2 为什么要研究地图上的拓扑? 1.拓扑概念: 拓扑学是研究图形在保持连续状态下变形时的那些不变的性质,也成为“橡皮板几何学”。 2.描述目标间关系需要 在地图上仅用距离和方向参数描述地图上的目标之间的关系总是不圆满的。 因为图上两点之间的距离和方向会随着地图投影的不同而发生变化,故仅用距离和方向参数还不能够确切地表示它们之间的空间关系。(如下图)
Longitude/Latitude投影 Gauss-Krivger投影 从上图可以看出,用拓扑关系表示,不论怎么变化,其邻接、关联、包含等关系都不改变。拓扑关系能够从质的方面和整体的概念上反映空间实体的空间结构关系。 研究拓扑关系对于地图数据处理和正确显示将是十分重要的。
2.3 拓扑关系的基本概念 地图要素可以抽象为点、线、面来表示,这种归纳正好适合于建立拓扑关系和建立拓扑表示。 1.若地图平面上反映一定意义的零维图形的附近没有其它图形与之联系,则称这个零维图形为独立点(Point)。如水井 2.若在某个有一定意义的零维图形附近还存在另外有意义的零维图形与之联系,则称这个零维图形为结点(Node)。 3.地图平面上连接两结点的有一定意义的一维图形称为边(Edge),也叫弧段(Arc)。例如:连个城市之间的道路 4.由一些边围成的有一定意义的闭合区域称为面(Area)。
2.4 基本的拓扑关系 基本拓扑关系分为拓扑邻接关系、拓扑关联关系和拓扑包含关系。 拓扑邻接和拓扑关联是用来描述网结构元素(比如结点、弧段、面域)之间的两类二元关系。 拓扑邻接关系存在于同类型元素之间(注意是“偶对集合”)。一般用来描述面域邻接。 拓扑关联关系存在于不同类型元素之间。一般用来描述结点与边、边与面的关系。 拓扑包含关系用来说明面域包含于其中的点、弧段、面域的对应关系。包含关系有同类的,也有不同类的。
2.5 拓扑关系的表示 拓扑关系的表示分为:显示表示和隐式表示。 1.显示表示:就是将网结构元素(结点、弧段、面域)间的拓扑关系数据化,并作为地图数据的一部分给以存储,这就叫拓扑关系的显式表示。 2.隐式表示:不直接存储拓扑关系,而是由几何数据临时推导生成所需的拓扑关系,这就叫拓扑关系的隐式表示。 计算导出耗时的那部分拓扑关系用显式表示;其余的用隐式表示。 例子1:隐式表示(书上P196) 例子2:显示表示,美国人口统计局的双重独立地图编码。
2 e6 e4 5 1 A e5 C e7 e1 e3 6 E B e8 e11 e9 D e2 3 4 e10 7 双重独立地图编码(DIME) 1.地图网络编码 2.结点坐标文件 3.拓扑结构文件
e1 e2 1 e3 e4 e5 2 3 4 e6 e7 e8 e9 7 5 6 e10 e12 e11 8 1.Arc/Info中的“弧段与结点之间的拓扑结构”
A e1 e2 Polygon-arc表 e5 D E e9 e6 e7 e3 C e10 F e8 B e4 Arc坐标表 2.Arc/Info多边形与弧线拓扑结构
左右多边形表 A e1 e2 e5 D E e9 e6 e7 e3 C e10 F e8 B e4 Arc坐标表 3.Arc/Info中左右多边形拓扑结构(存储在Arc文件中)
2.6 Arc/Info拓扑结构小结 Arc/Info利用拓扑结构在两个简单的坐标要素——弧线和结点的基础上表示附加的地理信息。也就是说:地理数据作为X,Y坐标对序列来存储,分别代表点、线、多边形。这些地理特征之间的关系通过拓扑结构来表达。相关的表格数据存储在表格中,通过内部标识号连接到地理特征上。 拓扑结构数据模型可以更有效地存储数据,它提供了进行高级地理分析框架。例如:拓扑结构模型由组成多边形边界的弧的列表来构建多边形。当两个多边形共享一条公共边时,系统只存储公共弧坐标值一次。 一个非拓扑结构数据模型把每个封闭的多边形作为一个独立的实体存储,邻接多边形公用的一条弧必须输入并存储两次,这通常通过数字化两次或者弧的拷贝来完成。这种重复数据是地理分析更为困难,因为系统不能够观察出这两个多边形的拓扑关系。非拓扑结构模型是许多CAD、绘图和制图系统支持的常见模型。
2.7 拓扑关系是空间数据处理 拓扑关系的建立属于空间数据处理的内容。 空间数据获取有各种不同的方法,但无论哪种方法获取的数据都可能存在这样或者那样的问题和误差,如数字化错误、数据格式不一致、比例尺或投影不统一、数据冗余等。 因此:只有通过空间数据的处理才能使空间数据符合GIS数据库的要求,才能实现GIS的各种功能。 空间数据处理的主要内容包括:图形编辑、自动拓扑、坐标变换、数据压缩、结构转换、数据内插等。
三 建立多边形拓扑 3.1 弧段的组织 3.2 结点的匹配 3.3 检查多边形是否闭合 3.4 建立多边形
3.1 弧段的组织 边(弧段)的组织:把弧段按一定顺序存储,如X坐标或者Y坐标的顺序,便于检索和查找,然后按顺序编号。 弧段的端点相交: 要求结点匹配 弧段的中间相交: 要求中间断开
3.2 结点匹配 结点匹配 结点匹配是指把一定限产诶的弧段的端点作为一个节点,其坐标值取多个端点的平均值,如图,然后,对结点顺序编号。
3.3 检查多边形是否闭合 检查多边形闭合可以通过判断一条弧的端点是否有与之匹配的端点来进行。 a P 图中弧段a的端点P没有与之匹配的端点,因此无法使用这条弧与其它弧组成闭合多边形。 可能的原因是:结点匹配限差的问题造成端点未匹配;数字化误差较大,甚至数字化错误,这些都可以通过图形编辑或重新匹配来确定。另外如果该弧段本来就是悬挂弧线,不需要拓扑,做一个标记即可。
3.4 构建拓扑多边形 3.4.1 基本常识 3.4.2 多边形拓扑关系自动建立的两个算法 3.4.2.1 弧段跟踪法 3.4.2.2 栅格填充法
B B 右边 左边 右边 左边 A A 3.4.1 基本常识(1) 1.顺时针方向构建多边形 所谓顺时针方向构建多边形是指多边形在弧段的右侧。这需要定义弧线的方向。
d c b a 3.4.1 基本常识(2) 2.最靠右边的弧段 最靠右边的弧段是指从弧段的一个端点出发,在这个弧段的方向上最靠右边的一条弧段。 如图:弧段a最靠右边的弧段是d. 找最靠右边的弧段可以通过计算弧段的方向和夹角来实现。
负 正 3.4.1 基本常识(3) 3.多边形面积的计算 设构成多边形的坐标串为(Xi,Yi)(i=1,2,3,…n),则多边形的面积可以用如下公式求出: 其中,当i=n时,yn+1=y1,xn+1=x1;当i=1时,y0=yn。根据该公式,当多边形右顺时针方向构成时,面积为正;否则为负。
3.4.2.1 弧段跟踪法 此法是基于弧段的邻接关系,按照一定规则沿弧段跟踪形成各个闭合环,然后采用内点匹配法得到各个环与内点的包含关系,最后根据多边形结构特点,确定环与内点的圈定关系,即是建立多边形面域与弧段的关联关系。 具体分为如下几步: 1.弧段邻接关系的建立 2.环的生成 3.建立环与内点的包含关系 4.建立环与内点的圈定关系
弧段邻接关系的建立 如果两条弧段具有相同的端点,则定义这两条弧段具有邻接关系。 5 6 记录规则:邻接于弧段同一端点的各个邻接弧段按顺时针方向顺序记录;按照数字化方向,如果邻接弧段是首点邻接,则在其前面冠以正号,否则冠以负号。 1 2 4 A 7 3 8 弧段邻接关系表
弧段2 弧段3 弧段4 弧段1 前端 前端 前端 前端 弧段2 弧段3 弧段1 弧段4 最靠左边的弧段 最靠左边的弧段 最靠左边的弧段 最靠左边的弧段 弧段4 弧段1 弧段2 弧段3 后端 后端 后端 后端 环的生成 5 6 + 1 2 4 A + 7 3 - 8 从弧段2开始跟踪,则圈定多边形A的环记录为:(+2,+1,-4,+3) +
建立环与内点的包含关系 Ⅲ Ⅳ Ⅵ Ⅴ 3 2 Ⅱ Ⅹ 6 Ⅶ Ⅸ 5 4 Ⅷ Ⅰ 1 按环记录中的关键字,可将该环上各弧段坐标数据读出,对所有内点匹配,便能确定环与各内点的包含关系。
环号与内点的圈定关系1 从图中可以看出:一个多边形可能有一个或多个环,但是一个多边形只有一个内点(数字化的时候输入)。所以,环与内点的拓扑关系可能是一对一或多对一的关系。 Ⅲ Ⅳ Ⅵ Ⅴ 3 2 Ⅱ Ⅹ 6 Ⅶ 按照右图建立的环与内点的包含关系是纯几何上,也就是多对多的几何包含关系。 Ⅸ 5 4 Ⅷ Ⅰ 1 拓扑结构需要确定一对一的点环关系,就是一个内点就要代表一个多边形。所以需要找出环是属于某一内点所代表的多边形的。即是建立多边形与轮廓的关联关系。
4 5 2 3 6 1 环号与内点的圈定关系2 Ⅰ 将包含关系表示成一颗形式化的树。 从底层向上在关系树中不断搜索环与内点的圈定关系(一对一或多对一的关系),并从关系树中“剪去”的过程。 Ⅲ Ⅱ Ⅶ Ⅳ Ⅵ Ⅴ Ⅷ 点与环的对应关系就确定了。 Ⅹ Ⅸ 5 4 2 3 1 6
3.4.2.2 栅格填充法 1.这是一种矢量-栅格混合处理方法。 根据多边形轮廓边(弧段)几何信息以及多边形“内点”信息,利用栅格填充法从“内点”出发向四周搜索,找出包围该面域的各个轮廓边,从而构成面与各边的关联关系,由各多边形的关联关系便能方便地导出“边”的左右侧面域的邻接关系。 2.栅格填充法的基本思想 参考书籍《计算机地图制图原理》 P201
理解栅格填充法的难点 1.栅格填充法的基本假设 2.算法中的分级填充 3.算法中的结点处理 4.算法中的方向判断 见教材《计算机地图制图原理》P203
第二部分 地图数据结构 一.地图要素的有向图表示 二.地图数据结构的基本单元 三.目表的结构表示
地图要素的有向图表示 1.地图要素的分类(按几何特征) 2.地图要素的概括P204 2.1 什么叫内点? 2.2 为什么可以用内点抽象代表整个面域? P204 3.地图要素的实地分布图—抽象为一个有向图 D=(V,E) P204 4.地图要素的有向图表示--P205 图5.13
第三部分 地图数据库系统 地图制图是一种信息传输过程,也是地理数据的处理过程。这个过程必须以数据库为中心,以便更加有效地实现地图信息采集、存储、检索、分析处理和图形输出等系统化。地图数据库是计算机地图制系统的核心,也是地理信息系统的重要组成部分。 一.数据库的概念 二.地图数据库在机助制图系统中的作用 三.地图数据库管理系统介绍 四.地图数据的完整性 五.地图符号库与汉字库
一.数据库的概念 1.1 数据库技术的产生 1.2 数据库系统的构成 1.3 数据模型(层次、网状、关系) 1.4 数据库的抽象分级 1.5 数据库管理系统的功能和组成 1.6 用户访问数据库的过程
1.1 数据库技术的产生 数据处理工作由来以久,早在1880年美国进行人口普查统计时,就已采用穿孔卡片来存储人口普查数据,并采用机械设备来完成对这些普查数据所进行的处理工作。电子计算机的出现以及其后其硬件、软件的迅速发展,加之数据库理论和技术的发展,为数据管理进入一个革命性阶段提供有力的支持。根据数据和应用程序相互依赖关系、数据共享以及数据的操作方式,数据管理的发展可以分为三个具有代表性的阶段,即人工管理阶段、文件管理阶段和数据库管理阶段。 • 人工管理:50年代中期以前(这时计算机还没有完整的操作系统) • 文件系统:50年代后期到60年代中期 • 数据库系统:60年代后期开始(DBMS广泛应用) 所谓数据处理就是对数据的收集、整理、存储、分类、排序、检索、维护、加工、统计和传输等一系列工作全部过程的概述。数据处理的目的就是使我们能够从浩瀚的信息数据海洋中,提取出有用的数据信息,作为我们工作、生活等各方面的决策依据。数据管理则是指对数据的组织、编码、分类、存储、检索和维护,它是数据处理的一个重要内容中心。
1.1.1 文件系统与数据库系统 • 文件系统: • 在DBMS出现以前,把需要管理的数据存放在永久性的系统文件中,同时为了能够操作这些文件里的数据,系统里还有针对这些文件编写的应用程序[书上P211图5.16]。如银行为了保存所有客户及储蓄帐户的信息,可能包括如下应用程序: • 创建新帐户的程序 • 处理某帐户的借/贷程序 • 查询帐户余额的程序 • 产生每月财务报告的程序 这种典型的文件处理系统是传统的操作系统所能支持的。随着银行业务的发展,需求不断增长,随之新的数据文件和应用程序就会不断地加入到系统中来。例如支票帐户的信息与特殊处理(透支)。
1.1.2文件系统的弊端1 1、数据冗余和不一致: 数据冗余是指相同的信息可能在不同的地方(文件)重复存储。如某个客户的地址和电话号码既可能在由储蓄帐户记录组成的文件里出现,也可能在由支票帐户记录组成的文件中出现;数据冗余还可能导致数据不一致,即同一数据的不同副本不一致。由于数据分散在不同的文件中,这些文件又可能具有不同的格式,而且数据和数据之间的联系很难表达。如某个客户地址的更改可能只是在储蓄帐户文件里得到反映而在系统的其他文件中没有得到反映。 2、数据缺乏独立性: 文件系统的数据结构依赖于应用程序的要求,数据的逻辑结构是在具体应用程序的限制下进行优化的。因此,要改变数据结构或者改变应用程序,都互相制约,造成困难。在实际情况中,由于数据使用者的要求不断变化,需要不断地增加和修改程序才能满足新的要求。比如银行的高级行政管理人员今天可能需要储蓄帐户中余额不少于1000元的客户清单,明天又可能需要所有居住在邮编为100084的地区的客户清单。 传统的文件处理环境不能支持以一种方便而有效的方式去获得所需数据,需要开发通用的、能对变化的需求作出更快反应的数据检索系统。
1.1.2文件系统的弊端2 3、缺乏对数据的统一控制和管理: 使应用程序的编制相当繁琐,对数据的完整性、安全性等缺乏有效的控制和管理。 • 完整性问题:文件中所存储数据的值必须满足某种一致性约束。例如银行帐户的余额永远不会低于某个预定的值——10元。开发者通过在不同的应用程序中加入适当的代码来体现系统中的这些约束。但当新的约束加入系统时,很难通过修改程序来体现这些新的约束。尤其是当约束涉及到不同文件中的多个数据项时,问题就变得更加复杂了——如何表达和实现约束? • 安全性问题:并非系统的所有用户都可以访问所有的数据。例如在银行系统中,银行员工的工资发放人员只需要看到数据文件中有关银行员工的那部分信息,他们绝对不需要访问关于客户帐户的信息。由于应用程序总是即兴加入到系统中来,这样的安全性约束在文件处理系统中难以实现。