1 / 44

数据库技术

数据库技术. 计算机与信息学院 贺海晖 办公室 1501 e-mail:hhhe@it.sspu.cn 上海第二工业大学. 第 1-1 章 数据库基础知识. 1. 数据库的概念 2. 数据库的特点 数据库系统的特点 三个阶段(手工、文件、数据库) 3. 数据模型 概念模型 数据模型(层次、网状、关系) 4. 数据库系统的结构 5. 数据库系统的组成. 1. 数据库概念. 数据( Data ) 描述现实世界各种信息的符号记录 是信息的载体、信息的具体表现形式 是数据库中存储的基本对象

qamra
Download Presentation

数据库技术

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 数据库技术 计算机与信息学院 贺海晖 办公室1501 e-mail:hhhe@it.sspu.cn 上海第二工业大学

  2. 第1-1章 数据库基础知识 1. 数据库的概念 2. 数据库的特点 • 数据库系统的特点 • 三个阶段(手工、文件、数据库) 3. 数据模型 • 概念模型 • 数据模型(层次、网状、关系) 4. 数据库系统的结构 5. 数据库系统的组成

  3. 1. 数据库概念 • 数据(Data) • 描述现实世界各种信息的符号记录 • 是信息的载体、信息的具体表现形式 • 是数据库中存储的基本对象 • 数据与信息既有区别,又有联系。数据是表示信息的,但并非任何数据都能表示信息,信息只是加工处理后的数据,是数据所表达的内容。 • 理解: • ① 数据不仅是数值,还可以是文字、图形、图像、声音、学生档案、工作日志等; • ② 数据与对数据的解释是密不可分的,如:1992,若描述一个人的出生日期,表示1972年;若描述一根钢管的长度表示1972mm。

  4. 1. 数据库概念 • 数据库 DataBase (DB) • 长期储存在计算机中的、有组织的、可共享的数据的集合 • 特点 • 按照一定的数据模型组织 • 独立性、易扩展性 • 最小冗余度 • 可共享 • 理解: • ① 数据库的存储介质通常是硬盘,也用磁带、光盘等; • ② 数据库的数据要按一定的数据模型(数据结构)进行组织; • ③ 职工数据库结构:职工(工号,姓名,性别,等)

  5. 1. 数据库概念 • 数据库管理系统( DataBase Management System (DBMS)) • 定义:位于用户与操作系统之间的一层数据管理软件。 • 在数据库建立、运用和维护时对数据库进行统一控制,以保证数据的完整性、安全性、并在多用户同时使用数据库时进行并发控制,且在数据库系统发生故障后对系统进行恢复。注:完整性、安全性、并发控制、数据库恢复在后面讲解。 • 常用的DBMS:Oracle、SQL Server、Informix、SyBase,等。

  6. 1. 数据库概念 • 数据库系统(DataBase System (DBS)) 由数据库、数据库管理系统(及开发工具)、应用系统、数据库管理员和用户构成。

  7. 2. 数据库的特点 • 什么是数据管理 • 对数据进行分类、组织、编码、存储、检索和维护,是数据处理的中心问题 • 数据管理技术的发展过程 • 人工管理阶段(40年代中--50年代中) • 文件系统阶段(50年代末--60年代中) • 数据库系统阶段(60年代末--现在)

  8. 数据管理—人工管理阶段 • 时期 • 40年代中--50年代中 • 产生的背景 • 应用需求 科学计算 • 硬件水平 无直接存取存储设备 • 软件水平 没有操作系统 • 处理方式 批处理

  9. 数据管理—人工管理阶段 • 特点 • 数据的管理者:应用程序,数据不保存。 • 数据面向的对象:某一应用程序 • 数据的共享程度:无共享、冗余度极大 • 数据的独立性:不独立,完全依赖于程序 • 数据的结构化:无结构 • 数据控制能力:应用程序自己控制

  10. 数据管理—文件系统阶段 • 时期 • 50年代末--60年代中 • 产生的背景 • 应用需求 科学计算、管理 • 硬件水平 磁盘、磁鼓 • 软件水平 有文件系统 • 处理方式 联机实时处理、批处理

  11. 数据管理—文件系统阶段 • 特点 • 数据的管理者:文件系统,数据可长期保存 • 数据面向的对象:某一应用程序 • 数据的共享程度:共享性差、冗余度大 • 数据的结构化:记录内有结构,整体无结构 • 数据的独立性:独立性差,数据的逻辑结构改变必须修改应用程序 • 数据控制能力:应用程序自己控制

  12. 数据管理—数据库系统 • 时期 • 60年代末以来 • 产生的背景 • 应用背景 大规模管理 • 硬件背景 大容量磁盘 • 软件背景 有数据库管理系统 • 处理方式 联机实时处理,分布处理,批处理

  13. 数据管理—数据库系统 • 特点 • 数据的管理者:DBMS • 数据面向的对象:现实世界 • 数据的共享程度:共享性高 • 降低数据的冗余度,节省存储空间 • 避免数据间的不一致性 • 使系统易于扩充 • 数据的独立性:高度的物理独立性和一定的 逻辑独立性 • 数据的结构化:整体结构化 • 数据控制能力:由DBMS统一管理和控制

  14. 2. 数据库的特点 • 数据结构化 • 数据共享性高、冗余度低、易扩充 • 数据独立性高 • 数据由DBMS统一管理和控制

  15. 2. 数据库的特点 • 数据结构化 • 在描述数据时不仅要描述数据本身,还要描述数据之间的联系 (说明:是数据库的主要特征之一,也是数据库系统与文件系统的本质区别)

  16. 2. 数据库的特点 • 数据共享性高、冗余度低、易扩充 • 定义: • ① 共享性高:数据被多个用户、多个应用同时使用。注:文件系统中的数据也可能被共享,但不能同时共享。 • ② 冗余度低:冗余度是指同一数据被重复存储的程度,数据库系统由于数据结构化,使得冗余度可能降到最低程序。 • ③ 易扩充:由于设计时主要考虑数据结构化,即面向系统,而不是面向某个应用,所以容易扩充。注:数据库系统可能因某个应用而产生,但设计时不能只考虑被某个应用所专用。

  17. 2. 数据库的特点 • 数据独立性高 • 定义:由于应用程序取数不是直接从数据库中取数,而是通过DBMS间接取数,故保持了应用与数据库数据的物理独立性和逻辑独立性。 • ① 物理独立性:当数据的存储结构(或物理结构)改变时,通过DBMS的相应改变可以保持数据的逻辑结构不变,从而应用程序也不必改变。 • ② 逻辑独立性:当数据的总体逻辑结构改变时,通过DBMS的相应改变可以保持数据的局部逻辑结构不变,应用程序是依据数据的局部逻辑结构编写的,所以应用程序不必改变。注:数据的逻辑独立性是有限的。

  18. 2. 数据库的特点 • 数据由DBMS统一管理和控制 • 说明:由于数据库的共享是并发的(Concurrency)共享,即多个用户可以同时存取数据库中的数据,甚至可以同时存取数据库中同一个数据。为此DBMS必须提供以下几方面的数据控制功能: • ① 数据的安全性(Security)保护: • 指保护数据,防止不合法使用数据造成数据的泄密和破坏,使每个用户只能按规定,对某些数据以某些方式进行访问和处理。 • ② 数据的完整性(Integrity)检查: • 指数据的正确性、有效性和相容性。即将数据控制在有效的范围内,或要求数据之间满足一定的关系。

  19. 2. 数据库的特点 • 数据由DBMS统一管理和控制 • ③ 并发(Concurrency)控制: • 指控制多个用户同时存取、修改数据库中的数据,以保证数据库的完整性。如:多个用户可以同时读,但同一时间只能允许一个用户写数据。注:由于计算机的高速且分时操作,用户可能感觉到多个用户可以同时写数据。 • ④ 数据库恢复(Recovery): • 指将数据库从错误状态恢复到某一已知的正确状态(亦称为完整状态或一致状态)的功能。计算机系统的硬件故障、软件故障、操作员的失误以及故意的破坏均会影响数据库中数据的正确性,甚至造成数据库部分或全部数据的丢失。

  20. 3. 数据模型 • 模型 • 现实世界的特征的模拟和抽象 • 数据模型 • 也是一种模型,是现实世界数据特征的抽象 • 数据库中用数据模型这个工具来抽象、表示和处理现实世界中的数据和信息。

  21. 现实世界 信息世界 概念模型 机器世界 数据模型 对象的抽象过程 第一级 抽象 第二级 抽象 认识抽象 转换 事物个体 实体 记录 事物总体 实体集 文件 特征 属性 字段

  22. 3. 数据模型 • 数据模型分成两个不同的层次 • (1) 概念模型 也称信息模型,它是按用户的观点来对数据和信息建模。 • (2) 数据模型 主要包括网状模型、层次模型、关系模型等,它是按计算机系统的观点对数据建模。

  23. 3. 数据模型 • 数据模型的分类(不同的数据模型具有不同的数据结构形式) • 层次数据模型(树形结构) • 网状数据模型(网状结构) • 关系数据模型(表) • 概念:关系、关系名、元组、属性名、属性、主码、域、分量、关系模式

  24. 1 R 根结点 2 3 R 兄弟结点 R 叶结点 4 5 R 兄弟结点 R 叶结点 叶结点 (1)层次模型 • 层次模型 • 满足下面两个条件的基本层次联系的集合为层次模型。 • 1. 有且只有一个结点没有双亲结点,这个结点称为根结点 • 2. 根以外的其它结点有且只有一个双亲结点

  25. 层次模型

  26. R1 R2 1 R L3 1 2 R R L1 L2 R3 L1 L2 L1 L2 L4 R2 R4 R5 R3 (2)网状模型—数据结构 • 网状模型 • 满足下面两个条件的基本层次联系的集合为网状模型。 • 1. 允许一个以上的结点无双亲; • 2. 一个结点可以有多于一个的双亲。 • 特点 • 只能直接处理一对多的实体联系 • 每个记录类型定义一个排序字段,也称为码字段 • 任何记录值只有按其路径查看时,才能显出它的全部意义

  27. 网状模型—优缺点 • 优点 • 能够更为直接地描述现实世界,如一个结点可以有多个双亲 • 具有良好的性能,存取效率较高 • 缺点 • 结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握 • DDL、DML语言复杂,用户不容易使用

  28. (3)关系模型 • 最重要的一种数据模型。也是目前主要采用的数据模型。 • 1970年由美国IBM公司San Jose研究室的研究员E.F.Codd提出 • 本课程的重点

  29. 课程 m 选修 n 学生 关系模型—数据结构 • 在用户观点下,关系模型中数据的逻辑结构是一张二维表,它由行和列组成。

  30. 关系模型—数据结构 • 相关术语 • 关系(Relation) • 一个关系对应通常说的一张表。 • 元组(Tuple) • 表中的一行即为一个元组。 • 属性(Attribute) • 表中的一列即为一个属性,给每一个属性起一个名称即属性名。 • 主码(Key) • 表中的某个属性组,它可以唯一确定一个元组。 • 域(Domain) • 属性的取值范围。 • 分量 • 元组中的一个属性值。 • 关系模式 • 对关系的描述 关系名(属性1,属性2,…,属性n) 学生(学号,姓名,年龄,性别,系,年级)

  31. 关系模型—数据结构 • 实体及实体间的联系的表示方法 • 实体型:直接用关系(表)表示。 • 属性:用属性名表示。 • 一对一联系:隐含在实体对应的关系中。 • 一对多联系:隐含在实体对应的关系中。 • 多对多联系:直接用关系表示。

  32. 关系模型—数据结构 • 关系必须是规范化的,满足一定的规范条件 最基本的规范条件:关系的每一个分量必须是一个不 可分的数据项。

  33. 关系模型—优缺点 • 优点 • 建立在严格的数学概念的基础上 • 概念单一。数据结构简单、清晰,用户易懂易用 • 关系模型的存取路径对用户透明 • 具有更高的数据独立性,更好的安全保密性 • 简化了程序员的工作和数据库开发建立的工作 • 缺点 • 存取路径对用户透明导致查询效率往往不如非关系数据模型 • 为提高性能,必须对用户的查询请求进行优化增加了开发数据库管理系统的难度

  34. 4. 数据库系统的结构 • 数据库的三级模式结构 为了有效地组织、管理数据,提高数据库的逻辑独立性和物理独立性,人们为数据库设计了一个严谨的体系结构,数据库领域公认的标准结构是三级模式结构,它包括外模式、模式和内模式 。 根据各类人员与数据库的不同关系,可把视图(所谓视图是指观察、认识和理解数据的范围、角度和方法)分为三种: • 对应于用户的外部视图 • 对应于应用程序员的概念视图 • 对应于系统程序员的内部视图

  35. 应用A 应用B 应用C 应用D 外模式1 外模式2 外模式3 外模式/概念模式映象 概念模式 概念模式/内模式映象 内模式 数据库 数据库系统的三级模式结构

  36. 三级模式—模式 • 模式(也称逻辑模式、概念模式) • 数据库中全体数据的逻辑结构和特征的描述 • 所有用户的公共数据视图,综合了所有用户的需求 • 一个数据库只有一个模式 • 模式的地位:是数据库系统模式结构的中间层 • 与数据的物理存储细节和硬件环境无关 • 与具体的应用程序、开发工具及高级程序设计语言无关

  37. 三级模式—外模式 • 外模式(也称子模式或用户模式) • 数据库用户(包括应用程序员和最终用户)使用的局部数据的逻辑结构和特征的描述 • 数据库用户的数据视图,是与某一应用有关的数据的逻辑表示 • 外模式的地位:介于模式与应用之间 • 模式与外模式的关系:一对多 • 外模式通常是模式的子集 • 一个数据库可以有多个外模式。反映了不同的用户的应用需求、看待数据的方式、对数据保密的要求 • 同一外模式也可以为某一用户的多个应用系统所使用 • 但一个应用程序只能使用一个外模式。

  38. 三级模式—内模式 • 内模式(也称存储模式) • 是数据物理结构和存储方式的描述 • 是数据在数据库内部的表示方式 • 记录的存储方式(顺序存储,按照B树结构存储,按hash方法存储) • 索引的组织方式 • 数据是否压缩存储 • 数据是否加密 • 数据存储记录结构的规定 • 一个数据库只有一个内模式

  39. 二级映象功能 • 外模式/概念模式的映象 • 定义外模式与概念模式的对应关系 • 概念模式改变→改变映象→外模式不变→应用程序不变 • 举例:若用户模式的“学生成绩单”修改为学生成绩单(学号,姓名,课程号,课程名,成绩),只须改为由三个关系映射即可。 • 保证数据的逻辑独立性 • 概念模式/内模式的映象 • 定义数据的全局逻辑结构与存储结构的对应关系 • 存储结构改变→映象改变→概念模式不变 • 举例:若数据库管理系统升级了,管理系统一般会将以前的模式用新存储方式进行存储。 • 保证数据的物理独立性

  40. 5. 数据库系统的组成(了解) • 硬件平台及数据库 • 软件 • 人员

  41. (1)硬件平台及数据库 • 数据库系统对硬件资源的要求 • (1) 足够大的内存 • 操作系统 • DBMS的核心模块 • 数据缓冲区 • 应用程序 • (2) 足够大的外存 • 磁盘 • 操作系统 • DBMS • 应用程序 • 数据库及其备份 • 光盘、磁带、软盘 • 数据备份 • (3) 较高的通道能力,提高数据传送率

  42. (2)软件 • DBMS • 操作系统 • 与数据库接口的高级语言及其编译系统 • 以DBMS为核心的应用开发工具 • 为特定应用环境开发的数据库应用系统

  43. (3)人员 • 数据库管理员 • 系统分析员 • 数据库设计人员 • 应用程序员 • (最终用户)

  44. 人员—数据库管理员(DBA) • 决定数据库中的信息内容和结构 • 决定数据库的存储结构和存取策略 • 定义数据的安全性要求和完整性约束条件 • 监控数据库的使用和运行 • 周期性转储数据库 • 数据文件 • 日志文件 • 系统故障恢复 • 介质故障恢复 • 监视审计文件 • 数据库的改进和重组 • 性能监控和调优 • 数据重组 • 数据库重构

More Related