200 likes | 316 Views
顶层本体建模与中华文化 许卓群. 1. 顶层本体及其含义,西方哲学和中国哲学 - 莱布尼兹 -SUMO( Suggested Upper-level Merged Ontology) - 戴震( 1723--1777 ) 清代思想家 - 构建顶层本体的指导思想:天人合一 2. 搭建被大家共识的顶层本体是艰难的 语义精确性 语义共享需要妥协. 1 。顶层本体 及其含义. 西方哲学对于 顶层本体 是有古老传统的。
E N D
顶层本体建模与中华文化许卓群 1.顶层本体及其含义,西方哲学和中国哲学 -莱布尼兹 -SUMO( Suggested Upper-level Merged Ontology) -戴震(1723--1777) 清代思想家 -构建顶层本体的指导思想:天人合一 2. 搭建被大家共识的顶层本体是艰难的 • 语义精确性 • 语义共享需要妥协
1。顶层本体 及其含义 西方哲学对于 顶层本体 是有古老传统的。 • 莱布尼兹(Leibniz,G.W.十七--十八世纪的伟大哲学家),他对概念定义持一种 ‘组合’(combinatorial)观点:自然语言中所表达的概念是复合概念,可以分解为若干本原概念(the resolution of concepts into primitives)。 • 本原概念 primitives 本身的本原性(不再可分解)也许对于人的思维而言是相对的,不好绝对地划定。 • 但是莱布尼兹相信,组建一个用于定义人类概念的精确语言(a universal language)是可能的。复合概念皆可用它精确地定义。
最顶层也就是最本原,本原性也分层次: SUMO的层次 概念指称占据时空的东西 3D对象 本身连在一起,不用专门东西来连 水、瓷、…物质组成是同一的 动物、计算机的组成是不同一的 地理区域、天体区域、洞 本身不连在一起的一组占据时空的成员members 涉及到时间区间的4D对象 除了指称占据时空的东西之外其他的概念 各种杂七杂八的关系 List、ProbabilityRelation、SpatialRelation、TemporalRelation、BinaryRelation 被抽象为属性的entity 一段信息媒体所表达的信息内容
中国哲学家对顶层本体的思考 • 儒学一般不重视概念的分解方面。戴震(1723--1777) 清代思想家认为:“事物之理,必就事物剖析至微,而后理得”(《孟子字义疏证》),以为“理也者,情之不爽失也,未有情不得而理得者也”,“今以情之不爽失为理,是理者存乎欲者也”。提出“理存于欲”之命题。 • 一反理学家“去人欲、存天理”之说教,以为“后儒以理杀人”,与“酷吏以法杀人”无本质区别。
中国哲学家对顶层本体的思考 • 语言和文化不可分 • 中华文化的基础是什么? • { 礼、义、廉、耻、仁、爱、忠、孝} • {道、德、礼、理、名、常、无为、樸、天、仁、义、君子} • { 仁,义,礼,智} 与 { 心: “恻隐之心”、“羞恶之心”、“恭敬之心”、“是非之心”} • 中华文化上的顶层本体 与 西方的Entity 顶层本体相结合。 • “天人合一”是有道理的。 瓷器的含义限于“其组成物质是自连接的,各部分有同一性的”,如何涉及它的历史文化含义?
N.1 entity|实体 N.1.1 thing|万物 N.1.1.1 physical|物质 animate|生物 human|人 N.1.1.2 mental|精神... N.1.2 time|时间 N.1.3 space|空间 N.1.4 component|部分 N.2 attribute|属性 N.3 quantity|数量 A.1 aValue|属性值 A.2 qValue|数量值 CLAS.1 unit|单位 CLAS.2 NounUnit|名量 CLAS.3 ActUnit|动量 知网的--上下位概念树
分析:知网对顶层本体的态度-- 义原集 • 知识是概念及其关系(网络) • 概念不是最小意义单位 • 概念可以分解为若干义原 • 义原定义:最基本的,不易于再分割的意义的最小单位 (类比:原子) 例如: 爸爸:(人,男性,parent 关系) 妈妈:(人,女性,parent关系) 例如:医生,治疗,求医,诊所,不治之症,有病乱投医 都有“医治”这个义原。 • 义原集合,在知网中是基础性的。义原具有覆盖面宽,稳定。义原的原子性=语义词典的最小意义单位(“医治”??),该词语意义无需进一步分解。
知网中所用的基本‘关系’比较少 • 上下位关系 (概念的主要特征I)(实体和属性,部件) • 事件-角色关系 • 属性-宿主(实体)关系 • 部件-整体关系 • 材料-成品关系 • 同义关系(间接获得) • 反义关系 • 对义关系
医生 施事 工具 内容 医药 医治 疾病 场所 受事 内容 经验者 医院 费用 患者 罹患 关系者 领属物 施事 医疗费 领有 领属物 对象 付给 用语义关系图描述 ‘医治’这个概念的语义
知网描述了下列各种关系: (a) 上下位关系 (由概念的主要特征体现,请参看《知网管理工具》) (b) 同义关系(可通过《同义、反义以及对义组的形成》获得) (c) 反义关系(可通过《同义、反义以及对义组的形成》获得) (d) 对义关系(可通过《同义、反义以及对义组的形成》获得) (e) 部件-整体关系(由在整体前标注 % 体现,如"心","CPU"等) (f) 属性-宿主关系(由在宿主前标注 & 体现,如"颜色","速度"等) (g) 材料-成品关系(由在成品前标注 ? 体现,如"布","面粉"等) (h) 施事/经验者/关系主体-事件关系(由在事件前标注 * 体现,如"医生","雇主"等) (i) 受事/内容/领属物等-事件关系(由在事件前标注 $ 体现,如"患者","雇员"等) (j) 工具-事件关系(由在事件前标注 * 体现,如"手表","计算机"等) (k) 场所-事件关系(由在事件前标注 @ 体现,如"银行","医院"等) (l) 时间-事件关系(由在事件前标注 @ 体现,如"假日","孕期"等) (m) 值-属性关系(直接标注无须借助标识符,如"蓝","慢"等) (n) 实体-值关系(直接标注无须借助标识符,如"矮子","傻瓜"等) (o) 事件-角色关系(由加角色名体现,如"购物","盗墓"等) (p) 相关关系(由在相关概念前标注 # 体现,如"谷物","煤田"等)
2。搭建具有共识的顶层本体是艰难的 • SUMO是很多机构和学者所建立的顶层本体的归并,有点杂乱 • SUMO在学理上是精确的,它是哲学、逻辑学、语言学、人工智能和计算机等学科,以及其他学术应用领域的很多高层学者,共同合作产物,是协商和妥协的结果。 • 典型的有,AI领域SOWA教授的SOWA顶层本体模型,知识产权领域的ABC模型,和CYC 派生的WebKB顶层知识模型等 • 为了知识共享和互操作,基本知识需要多领域的协商与多领域本体的抽象与归并
Part of, Mereology • 研究:部分和整体的关系,在整体中部分和部分之间的关系 • Plato , Aristotle, Leibniz等哲学家都讨论过 • 研究的问题包括,Part of 关系是一个偏序关系-- a reflexive, antisymmetric, transitive relation?? (1)Everything is part of itself.(2)Two distinct things cannot be part of each other.(3)Any part of any part of a thing is itself part of that thing.
Sowa 教授的顶层本体,哲学思想为“property-centric” 自立性 斡旋性 关联性 抽象 物性 纽带 具象 格式 聚结 命题 意向 延续性 事情
ABC Model IsA hierarchy of classes • ABC:Entity • ABC:Temporality • ABC:Event • ABC:Situation • ABC:Action • ABC:Actuality • ABC:Agent • ABC:Artifact • ABC:Manifestation • ABC:Item • ABC:Abstraction • ABC:Work知识产权产品 • expressions, manifestations, and item • ABC:Place • ABC:Time
CRM ModelIsA hierarchy of classes • E1 CRM Entity • E2 Temporal Entity • E4 Period • E5 Event • E63 Begin of Existence • E7 Activity • E64 End of Existence • E6 Destruction • E77 Persistent Item • E55 Appellation • E70 Stuff • E18 Physical Stuff • E22 Man-Made Object • E28 Conc.Object • E73 Information Object • E55 Type • E39 Actor • E53 Place • E52 Time-Span • Part of the CIDOC CRM Model v 3.2, WonderWeb 欧洲本体库建设项目
对于数据层之上的知识层、语义层,顶层本体的价值如何? • 多领域ontologies语义的互相补充、互相依存 • 语义定义:用一组词来表示一个原来没有定义的概念的语义内涵,然后设法在全球分布式本体集中构建和补充其语义 • 语义联想:带着某组词(概念集)企图让机器agent去理解‘我的语义’。对于这种问题,“沿着下位概念向上走,然后再沿着上位概念向下走”是一个极其重要的思维过程。
例如,一组词{ 飞禽、养育、宠物 } ,关心的主题:家庭养育幼鸟的技术和故事。 • 飞禽---研究对象鸟类学---is-a动物学---is-a生物学 • 养育---理论根据 发育生物学---is-a生物学 • 养育实用技术---养育技术---is-a现代技术 • 宠物---is-a动物---i学问动物学 • 宠物---用品超市 • 宠物---治病医院 • 应用于Resource Discovery • 应用于Data Mining • 应用于Browsing • …