460 likes | 627 Views
第四章 GIS 空间数据库. 第一节 空间数据库概述. 一、数据与数据库 1. 数据:描述事物的符号记录,是数据库中存储的基本对象。 2. 数据库:数据库 (Data Base) :是以一定的组织方式存储在一起的相互关联的数据集合。 数据库系统包括数据库、数据库管理系统和数据库应用系统三个组成部分。 计算机对数据的管理经过了三个阶段 : 程序管理阶段 、文件管理阶段 、数据库管理阶段. 传统数据库与空间数据库的比较. 3. 空间数据库概念 是 GIS 中存储的与应用相关的地理空间数据的总和。(是 GIS 基本且重要的组成部分) 数据库=数据库系统.
E N D
第一节 空间数据库概述 一、数据与数据库 1. 数据:描述事物的符号记录,是数据库中存储的基本对象。 2. 数据库:数据库(Data Base):是以一定的组织方式存储在一起的相互关联的数据集合。 数据库系统包括数据库、数据库管理系统和数据库应用系统三个组成部分。 计算机对数据的管理经过了三个阶段 : 程序管理阶段 、文件管理阶段 、数据库管理阶段
空间数据库概念 是GIS中存储的与应用相关的地理空间数据的总和。(是GIS基本且重要的组成部分) 数据库=数据库系统 数据库系统
空间数据库管理系统的实现 (1)常规DBMS进行扩展,使有空间数据存储、管理功能;(Oracle) (2)常规DBMS基础上加一层空间数据库引擎。(ESRI的SDE(Spatial Database Engine))
GIS数据库的特点(与其它数据库相比) 不仅属性数据,还有大量的空间数据 数据量大,即使是一个极小的区域 数据的应用相当广,如地理研究、环境保护、土地利用与规划、资源开发、生态环境、市政管理、 道路建设等等。
数据库管理系统:提供数据库建立、使用和管理的软件系统。数据库管理系统:提供数据库建立、使用和管理的软件系统。 • 数据库应用系统:为满足特定用户数据处理要求而建立起来的,具有数据库访问功能的应用软件,提供给用户一个访问和操作特定数据库的用户界面。
现行空间数据库管理方案 • 基于文件与关系式数据库的空间数据混合管理方案 • 基于关系式数据库的空间数据管理方案 • 基于对象—关系式数据库的空间数据管理方案。
GIS用户界面 ID 高级语言 数据库开发语言 几 何 数 据 属 性 数 据 图形处理 DBMS 图形用户界面 属性用户界面 图形 文件库 属性 数据库 图形处理 DBMS 数 据 文 件 数 据 库 图形 文件库 属性 数据库 文件 关系数据库混合管理方案 • 属性数据建立在RDBMS上,数据存储和检索比较可靠、有效; • 几何数据采用图形文件管理,功能较弱,特别是在数据的安全性、一致性、完整性、并发控制方面,比商用数据库要逊色得多。 • 空间数据分开存储,数据的完整性有可能遭到破坏。 • GIS软件:Arc/Info,MGE,GenMap等 数据库开发 早 期 GIS用户界面 数据库开发 高级语言 ODBC协议 图形处理 DBMS 图形 文件库 属性 数据库
属性数据 (定长记录) GIS界面 空间数据 (变长记录) 关系表 二进制块 DBMS 空间 数据库 全关系式数据库管理方案 • 属性数据、几何数据同时采用关系式数据库进行管理 • 空间数据和属性数据不必进行烦琐的连接,数据存取较快 • 属间接存取,效率比DBMS的直接存取慢,特别是涉及空间查询、对象嵌套等复杂的空间操作 • GIS软件:System9,Small World、Geovision等
GIS界面 空间数据处理 扩充实体类型 (点、线、面、圆等) DBMS 空间 数据库 对象关系数据库管理方案 • 对现有的关系数据库进行扩展,增加空间数据类型 • 解决了空间数据变长记录的存储问题,由数据库软件商开发,效率较高 用户不能根据GIS要求进行空间对象的再定义,因而不能将设计的拓扑结构进行存储,没有解决数据的嵌套纪录问题 • GIS软件:TIGER,Geo++、Geo Tropics等
Arc/Info 并发控制 研究区域 MGE GeoStar 工作区1 工作层 GIS工程 空间索引 地物类 逻辑层 工作区2 MGE GeoStar 工作区n Arc/Info 属性数据 GIS空间数据组织
第二节 空间数据库的设计 一、数据的管理模式: 人工阶段(50年代中期以前)、 文件系统阶段(50年代后期到60年代中期) 数据库系统阶段(60年代后期始)
对地理现象和过程的抽象 逻辑模型 存储模型 地理现象 和过程 概念模型 1. 地理信息系统空间数据库模型建立过程 二、空间数据库的设计 空间数据库设计就是把现实世界中一定范围内存在着的应用数据抽象成一个数据库的具体结构的过程。 实质:如何将地理实体以一定组织形式在数据库中表达。即空间实体数据的模型化问题。 客观世界-(认识、抽象)->概念模型 概念模型-(选定数据模型、DBMS)->逻辑模型 逻辑模型-(确定数据组织方式)->存储模型
2. 概念模型(空间特征,关系描述) (1)空间特征:点、线、面、体四种基本类型; (2)实体在空间、时间、属性三方面存在联系: • 空间联系:空间位置、分布、关系、运动等; • 时间联系:客体随时间变化,可构成时态数据库; • 属性关系:属性多级分类中的从属关系、聚类关系、相关关系。 3. 空间数据库的数据模型设计 空间数据模型:对空间客体进行描述和表达的数学手段,使之能反应客观实体及其关系。 常用数据模型:层次模型;网状模型;关系模型;语义模型;面向对象模型。
4. 空间数据库的设计原则 • 尽量减小存储冗余 • 可变的数据结构 • 对数据及时访问,高效查询 • 能维持空间数据的复杂联系 • 支持多种决策的需要,适应性强
4. 空间数据库的设计内容 三个方面:数据结构、数据操作和完整性约束,具体为: 1)静态特性设计-结构特性 2)动态特性设计-数据库的行为特性 3)物理设计
需求分析 数据库 概念设计 逻辑设计 物理设计 数据库的 概念模型 数据库的 逻辑模型 数据库的 存储模型 现实世界 概念世界 信息世界 5. 空间数据库的设计步骤 (1)需求分析 (2)概念设计 建立数据库的概念模型 (3)逻辑设计 把概念模型映射为数据库管理系统所支持的数据模型 (4)物理设计 将数据库的逻辑模型在存储设备上实现
三、空间数据库的实现与维护 1. 空间数据库的实现 (1)建立实际的空间数据库结构; (2)装入试验性数据测试应用程序; (3)装入实际空间数据,运行。 2.空间数据库的运行与维护 (1)维护安全性与完整性; (2)监测并改善数据库性能; (3)增加新的功能; (4)修改错误。
第三节 空间数据模型 一、数据模型-数据库的核心问题 1. 数据模型:是表达现实世界的规格化说明,在数据库中用形式化的方法描述数据的逻辑结构和操作。 数据模型三要素: 数据结构 数据操作 数据的完整性约束条件
数据库中数据组织方式 数据库中的数据组织一般可以分为四级:数据项、记录、文件和数据库。 1、数据项:是可以定义数据的最小单位,也叫元素、基本项、字段等。 2、记录:由若干相关联的数据项组成。 文件:文件是一给定类型的(逻辑)记录的全部具体值的集合。 4、数据库:是比文件更大的数据组织。数据库是具有特定联系的数据的集合,也可以看成是具有特定联系的多种类型的记录的集合。数据库的内部构造是文件的集合,这些文件之间存在某种联系,不能孤立存在。
2. 空间数据模型:就是对空间实体及其联系进行描述和表达的数学手段,使之能反映实体的某些结构特性和行为功能。 空间数据模型是衡量GIS功能强弱与优劣的主要因素之一。 3. 数据模型类型: 基本上可以分为两类: 传统数据模型:如层次、网状和关系数据模型 新型数据模型:如语义数据模型,面向对象数据模 型和时空数据模型
数据间的逻辑联系 数据间的逻辑联系主要是指记录与记录之间的联系。 1、一对一的联系(1:1) 2、一对多的联系(1:N) 3、多对多的联系(M:N) A B A B
数据模型 数据模型是数据库系统中关于数据和联系的逻辑组织的形式表示。 每一种数据模型都以不同的数据抽象与表示能力来反映客观事物,有其不同的处理数据联系的方式。 数据库领域采用的数据模型有层次模型、网状模型和关系模型,其中应用最广泛的是关系模型。
层次数据库模型 它的特点是将数据组织成一对多关系的结构。 层次结构采用关键字来访问其中每一层次的每一部分。 层次数据库结构特别适用于文献目录、土壤分类、部门机构等分级数据的组织。
层次数据库模型 优点: • 存取方便且速度快 • 结构清晰,容易理解 • 数据修改和数据库扩展容易实现 • 检索关键属性十分方便 缺陷: • 结构呆板,缺乏灵活性 • 同一属性数据要存储多次,数据冗余大(如公共边) • 不适合于拓扑空间数据的组织
MAP 2 b 3 e 5 a Ⅰ c Ⅱ f 1 4 g d 6 2. 网状数据模型 1)概念:将数据组织成有向图结构(系结构),图中的结点代表数据记录,连线描述不同结点数据间的联系。 2)特点:允许有一个结点无双亲;一个结点可以有多于一个的双亲(多对多)。 3)数据存取:导航法(从任一实体出发) M Ⅰ Ⅱ a e b c d f g 2 1 3 4 5 6 地图MAP及多边形实体I和II 网状数据模型
网络数据库模型 • 优点: • 能明确而方便地表示数据间的复杂关系 • 数据冗余小 • 缺陷: • 网状结构的复杂,增加了用户查询和定位的困难。 • 需要存储数据间联系的指针,使得数据量增大 • 数据的修改不方便(指针必须修改)
MAP 2 b 3 e 5 a Ⅰ c Ⅱ f 1 4 g d 6 3. 关系数据模型 1)概念:用表格数据表示实体和实体之间关系的数据模型,表为二维表,满足一定的条件。 2)特点:数据结构单一,是一种二维表格结构。 地图M 多边形 线 点 地图MAP及多边形实体I和II
关系数据库模型 优点: • 结构特别灵活,满足所有布尔逻辑运算和数学运算规则形成的查询要求 • 能搜索、组合和比较不同类型的数据 • 增加和删除数据非常方便 缺陷: • 数据库大时,查找满足特定关系的数据费时 • 对空间关系无法满足
3)基本术语: • 属性:在二维表中的列(字段、数据项),列值即属性值。 • 关系模式:关系的描述。包括关系名、属性名、属性向域的映射等。 • 元组:二维表中的行(记录的值)。 • 关系:元组的集合,即关系模式和关系。 • 关键字:关系中能唯一标识元组的属性(或属性组合)。 • 关系数据库:一系列关系的集合。 • 关系完整性:指关系的正确性、相容性和有效性。 关系名 属性 学生登记表 关系模式 元组 关系 关键字
第四节 空间数据库概念模型设计—语义模型和面向对象模型 传统数据模型的弱点: (1)以记录为基础的结构不能很好面向用户传统模型-记录;现实世界-事务、实体。有时不对应。 (2)不能以自然的方式表示实体间的联系 层次、网状显式地描述关系,但不自然;关系模型联系隐含,必须检索全部记录才能确定。 (3)语义贫乏 用单一结构描述描述“交互”、“从属”、“构成”等众多联系,语义上无法区别。 (4)数据类型太少 只提供常用的简单数据类型,不能自定义新的数据类型。
一、语义数据模型 -实体联系模型(E –R模型) • 提供三种语义概念: (1)实体:客观存在的起独立作用的客体。 (2)联系:实体间的相互作用或对应关系:1:1,1:N,M:N, (3)属性:对实体和联系特征的描述。
用E-R模型进行概念设计: (1)局部E-R模型 (2)全局E-R模型 (3)优化
E-R模型的特点及作用 (1)接近人的思维,易于理解,与计算机的具体实现无关; (2)现有DBMS不能直接支持E-R模型 (3)只用于概念模型设计。在逻辑设计时再转化为计算机能接受的数据模型。
二、面向对象模型 1、基本思想 按人们通常的思维方式,将各种实体抽象为各类“对象”,并将数据和操作(方法)封装在一起。整个系统只由对象组成,对象之间通过“消息”进行联系。使系统很容易重组和扩充。 2、相关概念 • 对象(Object):实体的抽象(基本元素),封装了数据和操作集的实体。 • 消息(Message):请求 对象执行某一操作或回答 某些信息的要求。
类:描述一组对象的共同特征。类和实体是抽象与具体的关系。类:描述一组对象的共同特征。类和实体是抽象与具体的关系。 3. 对象的性质 • 封装:是将某件实物包围起来,使外界不必知道其实际内容。
继承:某类对象可以自然地拥有另一类对象的某些特征和功能。不必重复实现,减少代码。继承:某类对象可以自然地拥有另一类对象的某些特征和功能。不必重复实现,减少代码。
第五节 空间数据库逻辑设计与物理设计 一、逻辑设计 从概念模型导出特定的DBMS所支持的数据库的逻辑结构。
二、物理设计 从逻辑模型出发,研制出一个有效的可实现的物理结构。 步骤: (1)存储记录的格式设计 (2)存储方法设计 (3)访问方法设计 (4)完整性、安全性考虑 (5)应用设计 (6)形成物理设计说明书
第六节 GIS空间时态数据库 一、概述 时间、空间的不可分割性:环境监测、地籍管理…. 办法:加入时间维->四维数据(时空一体) 二、时空一体化数据模型 1. 时间片快照模型 用一系列瞬时的地理数据来反应地理现象的时空演化过程(矢量快照,栅格快照)。如遥感图像。缺点:数据完全存储,冗余度大。
2. 底图叠加模型 类似于地图修订方式。 思路:先确定空间数据初始状态(底图),再按适当的时间间隔记录数据变化;通过叠加操作,以变化数据恢复各个时间片的状态数据。每次叠加表示状态的一次变化。
3. 时空合成模型 思路:将每次独立的叠加操作转换为一次性的合成叠加。变化的累积形成最小变化单元,记录其图形和属性。
4. 全信息对象模型 全信息对象:包含空间、时态和属性信息的地理对象。 全信息对象模型:运用面向对象设计技术,将对象的空间、属性随时间变化的信息封装。每个全信息对象有多个时态版本。