820 likes | 989 Views
第 10 章 超文本和 Web 技术. 超文本的 基本概念与 发展简史 超文本系统的结构 超文本的文献模型 Web 系统 的超文本标记语言 Web 系统的关键 技术. 10.1 超文本的基本概念 及发展简史. 超文本 超文本系统 发展简史与典型系统. 10.1.1 超文本的概念. 文本 特点是它在组织上是线性的和顺序的。 人脑的记忆机制 一种联想式的记忆,它构成了人类记忆的网状结构,对联想、记忆的探索形成了人类思维概念化的基础。. 图 10.1 文本的线性结构. 超文本结构 类似于人类这种联想记忆结构,它采用一种非线性的网状结构组织块状信息。
E N D
第10章 超文本和Web技术 • 超文本的基本概念与发展简史 • 超文本系统的结构 • 超文本的文献模型 • Web系统的超文本标记语言 • Web系统的关键技术
10.1 超文本的基本概念及发展简史 • 超文本 • 超文本系统 • 发展简史与典型系统
10.1.1 超文本的概念 • 文本 特点是它在组织上是线性的和顺序的。 • 人脑的记忆机制 一种联想式的记忆,它构成了人类记忆的网状结构,对联想、记忆的探索形成了人类思维概念化的基础。
超文本结构 类似于人类这种联想记忆结构,它采用一种非线性的网状结构组织块状信息。 • 超文本 是由信息结点和表示信息结点间相关性的链构成的具有一定逻辑结构和语义的网络。 • 结点 是基本单位。它是一个信息块, 具体地说,它可以是某一字符文本集合,也可以是屏幕中某一大小的显示区。
超文本系统 超文本系统 对超文本进行管理和使用的系统。 超文本系统特点 : (1) 在用户界面中包括对超文本的网络结构的显式表示,即向用户展示结点和链的形式; (2) 向用户给出网络结构的动态总貌图,使用户在每一时刻都可以得到当前结点的邻接环境; (3) 超文本系统一般使用双向链, 这种链应支持跨越各种计算机网络,如LAN和Internet; (4) 用户可以通过自己思想的联想及感知,根据自己的需要动态地改变和访问网络中的结点和链; (5) 尽可能不依赖它的具体特性、命令或信息结构,而更多地强调的是它的用户界面的“视觉和感觉”。
第二代超文本系统与多媒体技术结合起来,为强调系统处理多媒体信息的能力而称为超媒体第二代超文本系统与多媒体技术结合起来,为强调系统处理多媒体信息的能力而称为超媒体 超媒体=多媒体+超文本 • 目前, 超文本与超媒体很难区别, 所以往往不加区分地使用。
10.1.2 发展历史 • 超文本思想最早由美国V.Bush提出,他在20世纪30年代即提出了一种叫做Memex(memory extender,存储扩充器)的设想, 预言了文本的一种非线性结构, 1939年写成文章“As We May Think”, 于1945年在“大西洋月刊”发表。 • 1965年, Ted Nelson创造了“超文本”这个词, 而且开始实现这个想法, 并在他的Xanadu计划的长远目标中, 试图使用超文本方法把世界上文献资料联机。
超文本发展3个阶段 • 概念产生时期(1945—1965) , 标志性的事件是Bush提出Memex和Nelson创造Hypertext。 • 概念系统的研究时期(1967—1985) • 1967年, 布朗大学Andy van Dam等研制第一个可运行超文本系统The Hypertext Editing System; • 1968年, Doug Engelbart在FJCC(秋季联合计算机会议)上演示NLS系统(联机系统); • 1968年, 布朗大学推出FRESS(文件检索与编辑系统); • 1975年, CMU推出ZOG(现为KMS,知识管理系统); • 1978年, MIT建筑机械组推出第一个超媒体视频盘片系统Aspen Movie Map(白杨城影片地图) 。
成熟与发展时期(1985—) • 1985年,Janet Walker研制的Symbolics Document Examiner (符号文献检测器); • 1985年,布朗大学推出Intermedia系统,在Macintosh上运行; • 1986年, OWL(办公工作站有限公司)引入Guide,这是第一个广泛应用的超文本; • 1987年, Xerox公司推出Notecards,苹果公司Bill Atkinson研制Hypercard; • 1991年, 美国Asymetrix公司推出ToolBook系统; • 1990年, 位于日内瓦的欧洲量子物理实验室CERN开发的运行于Internet的WWW系统,对人类社会产生深远影响。
超文本的理论研究 • 1987年,ACM超文本专题讨论会(Hypertext’87)在北卡罗来纳大学召开; • 1990年, 第一届欧洲超文本会议(ECOH)在法国Inria召开; • 这些活动都成了系列性会议延续下来。同时, ISO等国际组织也开始制定超文本方面的标准,推动其商品化发展。
10.2 超文本系统的结构 • 超文本系统结构模型 • 超文本的主要部分
10.2.1超文本系统结构模型1.HAM模型 • 1988年,Campbell和Goodman提出HAM(超文本抽象机)模型。HAM模型把超文本系统划分为3个层次: 用户界面层, HAM层, 数据库层。 图10.3 HAM模型
数据库层 • 数据库层提供功能是存储、共享数据和网络访问,处于3层模型的最低层。 • 数据库层要保证信息的存取操作对于高层的超文本抽象机来说是透明的。 • 数据库还要处理其他传统的数据库管理问题。
超文本抽象机层 • 决定超文本系统结点和链的基本特点,记录了结点之间链的关系,并保存有关结点和链的结构信息。 • HAM层就是实现超文本输入输出格式标准化转换的最佳层次。因数据库层存储格式过分依赖机器,用户界面层各系统风格差别很大,很难统一。 • HAM层可理解为超文本概念模式,它提供了对数据库下层的透明性和对上层用户界面层的标准性。
用户界面层又称为表现层: • 用户界面层涉及超文本抽象机层中信息的表现, 包括:用户可以使用的命令,HAM层信息如何展示,是否要包括总体概貌图来表示信息的组织,以便及时告知用户当前所处的位置等等。 • 目前流行的界面风格有以下几类: (1)命令语言; (2)菜单选项; (3)表格填充; (4)直接操作; (5)自然语言。
2. Dexter模型 • 1988年10月, 在美国新罕布尔州的Dexter饭店发起组织了一个研究超文本模型小组, 致力于超文本标准化的研究, 以后逐渐形成了一个超文本参考模型, 简称为Dexter模型。 图10.4 Dexter模型
存储层 • 描述成员之间的网状关系。 • 成员描述系统的基本对象,包括结点和链等。 • 原子成员是最小成员单位,也即超文本中的结点,其内容可为不同媒体的信息。 • 复合成员是具有嵌套层次的成员,由原子成员和链复合而成。 • 链是表示元素与元素之间关系的一种实体。
成员内部层 • 成员内部层描述超文本中成员的内容和结构, 对应于各个媒体单个应用成员。 • 存储层和成员内部层之间的接口称为定位机制(锚定机制),其基本成分是锚, 锚由两部分组成: 锚号和锚值, 锚号是每个锚的标识符, 锚值用来指定元素内部的位置和子结构。
运行层 • 运行层描述支持用户和超文本交互作用的机制, 它可直接访问和操作在存储层和成员内部层定义的网状数据模型。 • 介于存储层和运行层之间的接口(播放规范),提供确定各个成员在运行时表现的视图和操作权限等内容。 • 锚接口是Dexter模型的主要贡献。
10.2.2 超文本的主要成份 • 结点(或节点) 超文本表达信息的一个基本单位, 其大小可变, 结点的内容可以是文本、图形、图像、音频、视频等, 也可以是一段程序。 • 结点分为不同类型,不同类型的结点表示不同的信息。
常见的结点的基本类型: (1) 媒体结点 。 (2) 动作与操作结点。 (3) 组织结点。 (4) 推理结点。
链也是组成超文本的基本单位,形式上是从一个结点指向另一个结点的指针,本质上表示不同结点上存在着的信息的联系。链也是组成超文本的基本单位,形式上是从一个结点指向另一个结点的指针,本质上表示不同结点上存在着的信息的联系。 • 链的类型 (1)基本结构链 基本,交叉索引,节点内注释,缩放, 全景, 视图。 (2)组织链 索引, IS-A,HAS-A,执行。 (3)推理链。
宏结点是链接在一起的结点群, 就是超文本网络的一部分—即子网。 • 宏文本(Macrotext)和微文本(Microtext) 概念, 来表示不同层次的超文本。微文本又称小型超文本, 它支持对结点信息的浏览; 而宏文本又称大型超文本,支持对宏结点的查找与索引。 • 宏结点的引入虽然简化了网络结构, 却增加了管理与检索的层次。
10.3 超文本的文献模型 • 文献模型概述 • ODA 模型 • HyTime模型
10.3.1文献模型概述 • 文献是文章或文本的组合,它比一般文章和文本带有更多的存储、保留的意味,一旦定形后静态性较强。 • 超文本的文献模型侧重于超文本的基本特征和一般的层次性结构的描述。
1.文献的一般结构 • 文献的结构包括内容组织和版面安排两个方面。 • 内容组织指如何组织和构造文献的信息内容; 版面安排是相对内容的表现形式来说的,即文献的各部分内容如何安排在每一页面(屏幕)上。 • 如把一本书当作文献来看其内容组织主层次结构是:文献(内容)→章→节→小节→段落(内容实体)。内容实体可以是一段文字或是一个图表。 • 可把版面安排也层次化,以便和内容组织对应,可以分成:文献(版面)→页/整屏→框架/窗口→块/子窗口(内容实体)。
2.文献模型的基本任务 (1)能够表示多媒体文献的内容层次性; (2)能够表示多媒体文献的版面布局; (3)能够表示多媒体文献的时间布局; (4)能够将内容与布局对应起来。
10.3.2 ODA 模型 • ODA(the office/open document architecture)是ISO在1988年公布的一个标准化文献模型(ISO 8613:1988),它为辅助办公文献的表示和交互而设计的。 • 它提供了文献的静态描述, 还提供了与其他文献格式接口。
ODA文献结构是层次的和面向对象的。 • ODA文献由两对结构来描述, 即: 一般结构和具体结构,逻辑结构和布局结构。前者体现面向对象性质,后者体现内容与表现的关系
逻辑结构和布局结构 • 文献的内容层次性用逻辑结构描述, 它首先按文献内容划分成逻辑目标, 逻辑目标可以是一个一般项,如书中的一节、标题、段落等。 • 文献的版面安排 用布局结构描述。它按内容划分为页集、页和页中方框区域, 其中定义有嵌套区域的方框区域称为框架, 最低层的区域称为块。块是惟一有内容与之相联的区域。
图10.6逻辑结构和布局结构对应关系 节 标题 小节 子标题 段落 段落 段落 内容 内容 内容 内容 内容 逻辑结构 布局结构 块 块 块 块 块 框架 框架 框架 页 页
一般结构和具体结构 • 每个文献都有具体的(specific)逻辑结构和布局结构,而具体结构的建立是由相应的一般(generic)结构控制的。 • 一般结构是一系列关于对象的定义(对象分为逻辑对象集合和布局对象集合)。 • 每个非页结点的对象定义都有一个属性“从属产生器”, 用来说明对象如何由其子对象构成。
图10.7一般逻辑结构 论文 SEQ REQ REQ OPT SEQ 标题 作者 摘要 节 SEQ REQ REP REP CHO 段落 子标题 段落 列表 REP 项
图10.8一般布局结构 论文页集 SEQ REQ OPT REP 标题页 继续页 AGG 继续 正文框架 标题框架 正文框架
从属产生器属性 • 可选的(OPT) 0或1次事件; • 要求的(REQ)仅1次事件; • 重复(REP) 1次或多次事件; • 可选并且重复(OPT REP) 0、1或多次事件; • 顺序(SEQ)以固定顺序出现; • 聚集(AGG)以任意次序出现; • 选择(CHO)仅其中一个选中。
布局过程 • ODA的布局过程确切地决定文档中的每一项被放置的位置。它使用特定的逻辑结构、一般结构、内容体系以建立特定的布局结构。 • 它工作在两个层次上: (1)内容布局处理内容部分,并将它们安排到块中。 (2)文献布局将块安排到框架或页中。这个阶段依赖于称为布局风格的属性集。
10.3.3 HyTime模型 • HyTime全称时基超媒体结构化语言, 它是一个标准的中性标记语言, 表示超文本和时基文献的逻辑结构。 • HyTime由ANSI的一个工作组开发,后被ISO采纳,其标准号为ISO/IEC 10744:1992。 • HyTime基于SGML, 用HyTime表示的文献与ISO SGML完全一致, HyTime扩展了SGML,使SGML更具抽象性、中立性,且增加了许多关于多媒体应用方面的考虑。
SGML元素 元素是一个可标记的逻辑体,以“book”为例,视book为一类元素,将它可分为若干Chapter, Chapter还可分为Title和若干Section。Chapter, Title和Section也是元素。它们都是含有一定结构的逻辑体。 一个元素的标记实例: 〈元素名〉数据〈/元素名〉 起始标签结束标签 图10.9 SGML元素
SGML DTDs • 在SGML中,用DTD(Document Type Definition)来定义文献(元素)类型, 描述其内部的一般逻辑结构。如下DTDs: 〈!ELEMENT Book--(chapter +)> 〈!ELEMENT Chapter--(Title,Section+)> 〈!ELEMENT Title|Section--CDATA> 其中+表示一个或多个。
SGML属性 • SGML用“属性”的方法来表示对某一个元素的必要的非结构化的信息。属性由“属性名”和“属性值”组成。属性名及其值包含在起始标签里面,是标签的一部分,如下所示: 〈Book author=“JOGN”〉…(Chapters)…〈/Book〉 相应DTD变为: 〈!ELEMENT Book--(Chapter +)〉 〈!ATTLIST Book author CDATA #REQUIRED〉
SGML标识符 • 有两种特殊的属性值: ID和IDREF。 • 如果一个元素有一个ID类型的属性,那么其值必须是该元素的惟一名字。 • 如果元素A要引用有惟一名字的元素B, 那么A的属性IDREF的值就是B的惟一名字。基于SGML的超媒体系统就是用这种机制来表示文献内部的超链。
SGML实体 • SGML中实体是任意数据资源,可以是文件、硬件子系统、存储缓冲区等等。 • 实体定义形式为:〈!ENTITY…〉。 如〈!ENTITY “Myentity” SYSTEM“Usr/Local/text/myentity”〉, 则如果在文献中发现“&Myentity”,就会启动SGML系统来引用该实体。
HyTime/SGML:元DTD • HyTime利用称为“SGML结构形式”的形式,提高了SGML的抽象性和中立性,可以用来更好地表示多媒体文献系统的特性。 • 元DTD由一系列组织好了的包装好了的“SGML结构形式”构成。SGML DTDs中的一个〈!ELEMENT…定义对应文献的类元素。 • 元DTD是最抽象的结构, 是独立于具体应用的。HyTime其实就是一个元DTD系统。
SGML有3种结构: 物理的实体结构; 逻辑的元素结构以及类似指针的ID-IDREF结构。 • 3种基本逻辑结构 : SGML层次性元素结构; HyTime超链结构; Hytime调度结构。