1 / 68

1. 绪论 ( 数据库系统简介 )

1. 绪论 ( 数据库系统简介 ). 概述 数据模型 数据库系统结构 数据库系统的组成 数据库新方向. 1.1 数据库系统概述. 考查要点: 基本概念 数据 数据库 数据库管理系统 数据库系统 数据管理三个阶段 人工管理 文件系统 数据库 数据库系统特点 数据结构化 数据独立性 DBMS 统一管理. 1.1.1 基本概念. 信息与数据 信息定义 哲学上:人们所认知与感知对象的抽象。 数学上:是确定性的度量,两次不定性之差,与随机对立。 物理上:是一种能量,与熵对立。 信息特性 无限性、共享性、创造性。

rhea
Download Presentation

1. 绪论 ( 数据库系统简介 )

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 《数据库系统概论》讲义 1. 绪论(数据库系统简介) • 概述 • 数据模型 • 数据库系统结构 • 数据库系统的组成 • 数据库新方向

  2. 《数据库系统概论》讲义 1.1 数据库系统概述 • 考查要点: • 基本概念 • 数据 • 数据库 • 数据库管理系统 • 数据库系统 • 数据管理三个阶段 • 人工管理 • 文件系统 • 数据库 • 数据库系统特点 • 数据结构化 • 数据独立性 • DBMS统一管理

  3. 《数据库系统概论》讲义 1.1.1 基本概念 • 信息与数据 • 信息定义 • 哲学上:人们所认知与感知对象的抽象。 • 数学上:是确定性的度量,两次不定性之差,与随机对立。 • 物理上:是一种能量,与熵对立。 • 信息特性 • 无限性、共享性、创造性。 • 信息系统(Information System,IS) • 一系列相互关联信息的集合,该集合能够提供反馈机制以实现一定目标。 • 信息系统可以是手工的,也可以是计算机化的,一般指计算机化的信息系统。

  4. 《数据库系统概论》讲义 1.1.1 基本概念 • 信息与数据 • 数据 • 对现实世界中客观事物的符号表示。可以是数值数据,也可以是非数值数据,如声音、图像等。 • 数据有多种表现形式,他们都可以经过数字化后存入计算机。 • 信息与数据的联系 • 数据是信息的符号表示,或称载体; • 信息是数据的内涵,是数据的语义解释; • 数据是符号化的信息; • 信息是语义化的数据。 • 例,一幅黑白图象 • 数据——黑白点阵 • 信息——脸谱

  5. 《数据库系统概论》讲义 1.1.1 基本概念 • 数据库: • 数据的集合,存放数据的仓库。 • 由DBMS统一管理,多用户共享。 • 长期储存在计算机内的、有组织的、可共享的数据集合。 • 数据库管理系统DBMS: • 系统软件,对数据库进行统一管理和控制。 • DBMS功能: • 数据定义(DDL) • 数据操纵(DML) • 运行管理(安全、完整、并发、恢复) • 建立维护(导入、导出、备份恢复、重组织、分析)

  6. 《数据库系统概论》讲义 1.1.1 基本概念 • 数据库系统: • 带有数据库的整个计算机系统,一般由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员和用户构成。包括硬件、软件、数据、人员。 应用系统 PB,VB,VC DELPHI Oracle,Db2, Sybase, SQL Server, Informix 应用开发工具软件 DBMS,编译系统 操作系统 硬件

  7. 《数据库系统概论》讲义 1.1.2 数据管理发展阶段 • 数据库技术的研究对象 • 数据库技术是研究数据管理的技术。 • 数据处理 • 数据处理是对各种数据进行收集、存储、加工和传播的一系列活动的总和。 • 数据处理的中心问题是数据管理。 • 数据管理 • 对数据进行分类、组织、编码、存储、检索和维护。 • 数据管理经历了三个阶段: • 人工管理阶段(50年代中期以前) • 文件系统阶段(50年代后期---60年代中期) • 数据库系统阶段(60年代后期开始)

  8. 《数据库系统概论》讲义 人工管理阶段 • 背景: • 计算机主要用于科学计算(数据量小、结构简单,如高阶方程、曲线拟和等)。 • 外存只有磁带、卡片、纸带等,没有磁盘等直接存取设备。 • 没有操作系统,没有数据管理软件(用户用机器指令编码)。 • 特点: • 用户负责数据的组织、存储结构、存取方法、输入输出等细节。 • 数据完全面向特定的应用程序,每个用户使用自己的数据,数据不保存,用完就撤走。 • 数据与程序没有独立性,程序中存取数据的子程序随着存储结构的改变而改变。

  9. 《数据库系统概论》讲义 人工管理阶段 • 数据与程序之间的关系 应用程序1 数据组1 应用程序2 数据组2 …… …… 应用程序n 数据组n

  10. 《数据库系统概论》讲义 文件系统阶段 • 背景: • 计算机用于科学计算,用于管理。 • 外存有了磁盘、磁鼓等直接存取设备。 • 有了专门管理数据的软件,一般称为文件系统,包括在操作系统中。 • 特点: • 系统提供存取方法(索引文件、链接文件、直接存取文件、倒排文件等),支持对文件的基本操作(增、删、改、查等),用户程序不必考虑物理细节。数据的存取基本上以记录为单位。 • 一个数据文件对应一个或几个用户程序,还是面向应用的。 • 数据与程序有一定的独立性,数据在存储上的改变不一定反映在程序上。

  11. 《数据库系统概论》讲义 文件系统阶段 • 程序与数据之间的对应关系 应用程序1 文件1 应用程序2 文件2 存取 方法 …… …… 应用程序n 文件n

  12. 《数据库系统概论》讲义 文件系统阶段 • 数据与程序的独立性差: • 文件系统的出现并没有从根本上改变数据与程序紧密结合的状况。 • 文件系统只是解脱了程序员对物理设备存取的负担,它并不理解数据的语义,只负责存储。 • 数据的语义信息只能由程序来解释,也就是说,数据收集以后怎么组织,以及数据取出来之后按什么含义应用,只有全权管理它的程序知道。 • 数据的逻辑结构改变则必须修改应用程序。 • 一个应用若想共享另一个应用生成的数据,必须同另一个应用沟通,了解数据的语义与组织方式。

  13. 《数据库系统概论》讲义 文件系统阶段 • 数据的冗余度大: • 数据仍然是面向应用的。 • 当不同应用程序所需要的数据有部分相同时,也必须建立各自的文件,而不能共享相同的数据。 • 数据分散管理。 • 数据的不一致性: • 由于数据存在很多副本,给数据的修改与维护带来了困难,容易造成数据的不一致性。

  14. 《数据库系统概论》讲义 数据库阶段 • 背景: • 计算机管理的数据量大,关系复杂,共享性要求强(多种应用、不同语言共享数据)。 • 外存有了大容量磁盘,光盘。 • 软件价格上升,硬件价格下降,编制和维护软件及应用程序成本相对增加,其中维护的成本更高,力求降低。 • 特点: • 有了数据库管理系统。 • 面向全组织,面向现实世界。 • 独立性较强。 • 由DBMS统一存取,维护数据语义及结构

  15. 《数据库系统概论》讲义 数据库阶段 • 数据库观点:数据不是依赖于处理过程的附属品,而是现实世界中独立存在的对象。 程序甲 程序乙 COBOL PL/SQL 数据集合 程序丙 程序丁 FORTRAN C JAVA 程序戊

  16. 《数据库系统概论》讲义 数据库系统 vs 文件系统 应用 数据管理 应用 数据管理 应用 应用 数据管理 文件系统 文件系统 数据库系统 文件系统

  17. 《数据库系统概论》讲义 数据库系统 vs 文件系统 • 例子: • Supplier: sname, sno, city • Project: jname, jno, city • Part: pname, pno, color • 查询: • “北京的所有工程” • “供应红色零件给北京的工程的供应商” • 维护: • “不允许供应不存在的零件” 供应商 供应 项目 零件

  18. 《数据库系统概论》讲义 数据库系统 vs 文件系统 • 数据库系统(关系): • 数据统一按表结构存放,联系也表为表形式,设为S,P,J,SPJ。 • 查询:只需提查询要求,由系统完成查询过程。 SELECT SNO FROM P,J,SPJ WHERE SPJ.JNO = J.JNO AND SPJ.PNO=P.PNO AND J.CITY = “BEIJING” AND P.COLOR = “RED”; • 维护:应用提出完整性约束,系统自动检查。 CREATE TABLE SPJ(……, FOREIGN KEY (PNO) REFERENCES P(PNO),…); • 文件系统: • 分别组织三个文件,存储各类对象的记录。 • 系统不支持文件间的联系,由应用程序负责查询表达及数据的维护。

  19. 《数据库系统概论》讲义 数据库系统 vs 文件系统 • 文件系统的弱点: • 文件之间无联系 • 难于维护数据的完整性 • 数据库系统的用武之地: • 有查询 • 数据复杂 • 效率两面观: • 运行效率 • 开发效率

  20. 《数据库系统概论》讲义 1.1.3 数据库系统特点 • 面向全组织的复杂的数据结构 • 支持全企业的应用而不是某一个应用。 • 数据反映了客观事物间的本质联系,而不是着眼于面向某个应用,是有结构的数据。这是数据库系统的主要特征之一,与文件系统的根本差别。文件系统只是记录的内部有结构,一个文件的记录之间是个线性序列,记录之间无联系。

  21. 《数据库系统概论》讲义 1.1.3 数据库系统特点 • 数据的冗余度小,易扩充 • 数据面向整个系统,而不是面向某一应用,数据集中管理,数据共享,因此冗余度小。 • 节省存储空间,减少存取时间,且可避免数据之间的不相容性和不一致性。 • 每个应用选用数据库的一个子集,只要重新选取不同子集或者加上一小部分数据,就可以满足新的应用要求,这就是易扩充性。

  22. 《数据库系统概论》讲义 1.1.3 数据库系统特点 • 具有较高的数据和程序的独立性 • 数据与程序相对独立,把数据库的定义和描述从应用程序中分离出去。描述又是分级的(全局逻辑、局部逻辑、存储),数据的存取由系统管理,用户不必考虑存取路径等细节,从而简化了应用程序。 • 数据独立性:当数据的结构发生变化时,通过系统提供的映象(转换)功能,使应用程序不必改变

  23. 《数据库系统概论》讲义 1.1.3 数据库系统特点 • 数据的物理独立性:当数据的存储结构改变时,通过数据的存储结构与逻辑结构之间的映象,数据的逻辑结构可以保持不变,从而应用程序也不必改变。 • 数据的逻辑独立性:当数据的总体逻辑结构改变时,通过数据的总体逻辑结构与局部逻辑结构之间的映象,数据的局部逻辑结构可以保持不变,从而应用程序也不必改变。

  24. 《数据库系统概论》讲义 1.1.3 数据库系统特点 • 统一的数据控制功能,数据共享程度高 • 数据的安全性控制(Security) • 保护数据以防止不合法的使用所造成的数据泄露和破坏。 • 措施:用户标识与鉴定,存取控制。 • 数据的完整性控制(Integrity) • 数据的正确性、有效性、相容性。 • 措施:完整性约束条件定义和检查。 • 并发控制(Concurrency) • 对多用户的并发操作加以控制、协调,防止其互相干扰而得到错误的结果并使数据库完整性遭到破坏。 • 措施:封锁。

  25. 《数据库系统概论》讲义 1.2 数据模型 • 数据模型定义 • 概念数据模型 • 结构数据模型的三要素 • 结构数据模型示例

  26. 《数据库系统概论》讲义 1.2.1数据模型定义 • 信息世界: • 数据库系统是面向计算机的,而应用是面向现实世界的,两个世界存在着很大差异,要直接将现实世界中的语义映射到计算机世界是十分困难的,因此引入一个信息世界作为现实世界通向计算机实现的桥梁。 • 一方面,信息世界是对现实世界的抽象,从纷繁的现实世界中抽取出能反映现实本质的概念和基本关系;另一方面,信息世界中的概念和关系,要以一定的方式映射到计算机世界中去,在计算机系统上最终实现。信息世界起到了承上启下的作用。

  27. 《数据库系统概论》讲义 1.2.1数据模型定义 • 数据模型: • 是数据库系统中用于提供信息表示和操作手段的形式构架。 现实世界 应用 概念化 信息世界 概念数据模型 形式化 计算机世界 结构数据模型

  28. 《数据库系统概论》讲义 1.2.1数据模型定义 • 概念数据模型: • 按用户的观点来对数据和信息建模。用于组织信息世界的概念,表现从现实世界中抽象出来的事物以及它们之间的联系。这类模型强调其语义表达能力,概念简单、清晰,易于用户理解。它是现实世界到信息世界的抽象,是用户与数据库设计人员之间进行交流的语言。如E-R模型。 • 结构数据模型: • 从计算机实现的观点来对数据建模。是信息世界中的概念和联系在计算机世界中的表示方法。一般有严格的形式化定义,以便于在计算机上实现。如层次模型、网状模型、关系模型、面向对象模型。

  29. 《数据库系统概论》讲义 1.2.2概念数据模型 • E-R 姓名 学号 系别 课程名 先修课 老师 学生 选修 课程 实体 联系 属性 成绩

  30. 《数据库系统概论》讲义 1.2.2概念数据模型 属性 category price • ODL Product name 关联 madeBy buys makes 类 employs Person Company name worksFor address name stockprice ssn

  31. 《数据库系统概论》讲义 1.2.3 结构数据模型三要素 • 数据结构 • 数据操作 • 数据的约束条件

  32. 《数据库系统概论》讲义 1.2.3 结构数据模型三要素 • 数据结构: • 描述系统的静态特性,即组成数据库的对象类型。包括: • 数据本身:类型、内容、性质。如网状模型中的数据项、记录,关系模型中的域、属性,关系等。 • 数据之间的联系:例如网状模型中的系型(Set Type) • 在数据库系统中一般按数据结构的类型来命名数据模型。

  33. 《数据库系统概论》讲义 1.2.3 结构数据模型三要素 • 数据操作 • 描述系统的动态特性,即对数据库中对象的实例允许执行的操作的集合,包括操作及操作规则。一般有检索、更新(插入、删除、修改)操作。 • 数据模型要定义操作含义、操作符号、操作规则,以及实现操作的语言。 • 数据的约束条件 • 数据的约束条件是完整性规则的集合,规定数据库状态及状态变化所应满足的条件,以保证数据的正确、有效、相容。

  34. 《数据库系统概论》讲义 1.2.4 结构数据模型示例 • 层次模型(Hierarchical Model) • 网状模型(Network Model) • 关系模型(Relational Model) • 面向对象模型(Object Oriented Model)

  35. 《数据库系统概论》讲义 层次模型 • 数据结构 • 用树结构表示实体之间联系的模型叫层次模型。 • 树由节点和连线组成,节点代表实体型,连线表示两实体型间的一对多联系。 • 树有以下特性: • 每棵树有且仅有一个节点无父节点,此节点称为树的根(Root)。 • 树中的其它节点都有且仅有一个父节点。

  36. 《数据库系统概论》讲义 层次模型 • 教员学生层次数据库模型 系 教研室 班级 教员 学生

  37. 《数据库系统概论》讲义 层次模型 A1 • 层次模型存储结构 B1 B4 B6 B1 C3 C5 C7 C14 C2 C9 C4 C6 C8 层次数据库 A1 B1 C3 C5 C7 C14 B4 C2 C9 B6 C4 C6 C8 邻接法

  38. 《数据库系统概论》讲义 层次模型 A1 B1 B4 B6 B1 • 层次模型存储结构 C3 C5 C7 C14 C2 C9 C4 C6 C8 层次数据库 A1 ^ ^ A2 ^ ^ B1 ^ ^ B4 ^ ^ B6 ^ * C3 ^ C5 ^ C7 ^ C14 * C2 ^ C9 * C4 ^ C6 ^ 子女-兄弟链接法 子女指引元 兄弟指引元

  39. 《数据库系统概论》讲义 层次模型 A1 B1 B4 B6 B1 • 层次模型存储结构 C3 C5 C7 C14 C2 C9 C4 C6 C8 层次数据库 ^ A1 ^ B1 ^ B4 ^ B6 ^ C3 ^ C5 ^ C7 ^ C14 ^ C2 ^ C9 ^ C4 ^ C6 层次序列链接法

  40. 《数据库系统概论》讲义 层次模型 • 层次模型优缺点 • 优点: • 结构简单,易于实现,性能高。 • 缺点: • 支持的联系种类太少,只支持二元一对多联系。 • 数据操纵不方便,子结点的存取只能通过父结点来进行。 • 层次命令趋于程序化。 • 代表产品: • IBM的IMS数据库,1969年研制成功。

  41. 《数据库系统概论》讲义 网状模型 • 数据结构 • 是一个满足下列条件的有向图: • 可以有一个以上的节点无父节点。 • 至少有一个节点有多于一个的父节点(排除树结构)。 • 学生选课数据库 系 学生 课程 选课

  42. 《数据库系统概论》讲义 网状模型 • 网状模型存储结构(单向链接法) ^ S1 ^ C1 91 ^ S1 ^ C1 ^ S1 ^ C2 90 ^ S2 ^ S2 ^ C1 84 ^ C2 ^ S3 ^ C1 93 ^ S3 ^ S3 ^ C2 95 ^ C3 ^ S3 ^ C3 80

  43. 《数据库系统概论》讲义 网状模型 • 网状模型特点 • 表达的联系种类丰富。 • 结构复杂。 • 良好的性能,存取效率较高。 • DDL,DML语言复杂,用户不易掌握。 • DBTG报告: • 1969年,由美国CODASYC(Conference On Data System Language,数据系统语言协商会)下属的DBTG(Data Base Task Group,该组织1960年提出COBOL语言)组提出,确立了网状数据库系统的概念、方法、技术。 • HP的IMAGE等系统采用该报告的方法。

  44. 《数据库系统概论》讲义 关系模型 • 用二维表来表示实体及其相互联系。 • 数据结构:关系(二维表) 主码 属性(字段、列) 元组(记录、行) 分量 域:男、女

  45. 《数据库系统概论》讲义 关系模型 • 关系模型要求关系必须是规范化的,基本规范条件:分量必须是不可再分的,原子的。 家属属性有内部数据结构,家属可再分 每个行中包含多个值

  46. 《数据库系统概论》讲义 关系模型 • 关系模型存储结构 • 实体及实体间联系都用关系(二维表)表示。 • 在磁盘组织中,表以文件形式存储。 • 一个表不一定对应一个文件。 • 不同DBMS的存储结构不同。 • 查询实体间联系可由关系代数表达。

  47. 《数据库系统概论》讲义 关系模型 • 优点: • 简单,表的概念直观,用户易理解。 • 非过程化的数据请求,数据请求可以不指明路径。 • 数据独立性,用户只需提出“做什么”,无须说明“怎么做”。 • 坚实的理论基础。

  48. 《数据库系统概论》讲义 1.3 数据库系统结构 • 从DBMS角度看: • DBMS内部的系统结构。 • 数据库系统内部通常采用三级模式结构。 • 从数据库用户角度看: • 数据库系统的外部体系结构。 • 数据库系统外部体系结构可以分为: • 集中式(单用户、主从式)结构。 • 分布式结构 • 客户机/服务器结构 • 并行结构

  49. 《数据库系统概论》讲义 1.3.1 数据库系统模式 • 模式(Schema): • 数据的抽象,数据的描述。 • 元数据(meta-data):描述数据的数据。 • 型与值的区别: • 型是指对某一类数据结构和属性的说明,值是指型的一个具体赋值。 • 模式仅仅涉及到型的描述,不涉及到具体的值。 • 模式的一个具体值称为模式的一个实例(Instance)。 • 数据字典: • 模式的另一种表述。

  50. 《数据库系统概论》讲义 1.3.2 数据库系统三级模式结构 • 模式的分级: • 为了提高数据的物理独立性和逻辑独立性,使数据库的用户观点,即用户看到的数据库,与数据库的物理方面,即实际存储的数据库区分开来,数据库系统的模式是分级的。 • 数据库系统三级模式结构: • CODASYL(Conference On Data System Language,美国数据系统语言协商会)提出模式、外模式、存储模式三级模式的概念。三级模式之间有两级映象。

More Related