1 / 32

HNC 两类延伸对词汇语义学的贡献

HNC 两类延伸对词汇语义学的贡献. 池毓焕 2007.10.24. 目次. 传统词汇语义学关于词义关系的描写 HNC 两类延伸概貌 与传统词义关系的比较 对偶性表示的发展 运用. 一、传统词汇语义学关于词义关系的描写. Lexical relation: Inclusion(hypernym-hyponym) special: meronymy Sameness(synonymy) Opposition(antonymy)

dennis
Download Presentation

HNC 两类延伸对词汇语义学的贡献

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. HNC两类延伸对词汇语义学的贡献 池毓焕 2007.10.24

  2. 目次 • 传统词汇语义学关于词义关系的描写 • HNC两类延伸概貌 • 与传统词义关系的比较 • 对偶性表示的发展 • 运用

  3. 一、传统词汇语义学关于词义关系的描写 Lexical relation: • Inclusion(hypernym-hyponym) • special: meronymy • Sameness(synonymy) • Opposition(antonymy) • : complementary opposites//gradable antonym(contrary)//relational opposition ——K.M.Jaszczolt: Semantics and Pragmatics

  4. WordNet v2.1建设规模 • 同义集Synset:囊括了117,597个同义集。WordNet描述的最基本的语义关系就是同义关系。 • 同义之外的语义关系对:定义了373,330对。构成不同的其他语义关系定义于同义集之上。 • 名词同义集,包括上下位(hypernym-hyponym)、整体-部分(holonym-meronym,再分成员、成份和构件三子类)、反义(antonym)、属性(attribute)、派生(derivational)及话题(topic)、区域(region)和语用(usage)等; • 动词同义集,增加了制约(entailment)、因果(cause)、参见(also see)、群组(verb group)四类; • 形容词同义集,增加了相似(similar to)、分词(participle of verb)、附着(pertain to noun)三类。 • 义项数:207,016个,其中单义词128,321个、多义词27,006个。

  5. WordNet v2.1定义的话题Topic 定义了427个话题,如WordNet、Zen、Tao、Aristotle等。 通过定义6534个话题成员关系而把分布在不同语义场中的相关词语通过话题联系在一起。 有6322个同义集是话题成员=>有187个同义集是多个话题的共有成员,如passenger(5)、rally(4)、winger(4)、bishop(3)等。 话题拥有成员数排名前六位的是:法律(595)、军事(371)、化学(205)、计算机科学(194)、希腊神话(191)和生物学(170); 34.19%话题只有一个成员,而网球话题虽有11个成员,但仍未包括网球手、网球场、网、拍等内容。

  6. WordNet v2.1定义的区域Zone 共定义了161个区域名称同义集、1327个区域关系对。 拥有成员数排名前六位的是:英国(518)、美国(70)、法国(49)、日本(34)、苏格兰(30)和希腊(29),垫底的诸如纽约、新疆、沙特、波斯等共86个区域只拥有一个成员。 中国的成员数是21,包括:阴、阳、气、风水、针灸、春卷、文化大革命、红卫兵、法轮功、鸭绿江、杭州、贝聿铭等。 WordNet试图把有中国特色的特定词语与中国相联系,但毛泽东、周恩来、北京、上海、长江、黄河等等并未定义中国区域关系,可见实际上是挂一漏万。

  7. WordNet目标定位 顾名思义,WordNet的基本单位是英语单词,英语词汇中的各种语义关系构成一个网络,对其进行描述就成了WordNet的基本工作。 WordNet小心翼翼地坚守Word阵地, 既不深入到义素分析中的义原(primitive)或概念, 也不扩展到超越单词层面的脚本(script)或框架(frame), 甚至要与传统词典(dictionary)或义类辞典(thesaurus)划清界限。

  8. 对WordNet的简评 • 把名词//动词//形容词//副词分作四个单独的库,而其他词类置之不理,这不是对语言空间的全面描述。 • 词汇义项动辄上十万,要描述其中的关系,如果关系类型又是几十上百种,数据规模有失控的危险。 • 有关Usage//Topic//Zone的定义,仍视作语义关系之一种,已有脚本(script)或框架(frame)的影子,但从现有的量上看还是缺得太多。 • 对词义关系的分类要服务于应用,而WordNet的理论基础是朴素的,没有相应的理论架构支撑。

  9. 二、HNC两类延伸概貌

  10. HNC两大类延伸分布图示

  11. 第一类对偶示例 00m吸引与排斥; 0099m合成与分解; 10m确定过程与随机过程; 10n连续过程与离散过程; 12m源与流; 20m跨、入、出; 31m出现与消失; 32m利与害; 33m显隐; 34m增与减; 343m提高与降低; 35m改动、立、破; 36m推动与抑制; 37m 界、连、断, 37n卡通阻; 38m选存弃; 3am获得与付出; 3bm积累与消耗; j71m黑氏对偶; j72m主要与次要, j72n基元与伴生; j73m特殊与一般; j74m本质与表象, j74n客观与主观; j75m泛指与特指, j75n随机与确定; j76m一、同、异; j77m轮廓、简单、复杂,j77n复合、纯、杂;……

  12. 对比性示例 • ckm xjw11c7m赤橙黄绿青蓝紫j10aac4m春夏秋冬j40c3m小型、中型、大型j51c4m差中良优10bc5m幼少青中老a41e22ac4m尉校将帅a71c31c6m小学一至六年级a71c33c22c4m大一至大四a72^e2m7c3m学士、硕士、博士…… • ckn 50a(c2n)c3n//a20979c3n贫穷、中产、富裕a219\24*tc3n农业、工业、后工业时代的医用器具制造a219\26c3n冷兵器、热兵器、超力兵器;50ac2n物质和精神生活1079c2n渐变与突变30abc2n//a02c2n实现的预备阶段和正式施行阶段509e55d2n强壮与虚弱q731c2n业余与专业比赛 • dkm 137d3m确定、可预测、不可预测的趋向与转化j00dkm伯仲叔季//公侯伯子男j11bd3m现代、近代、古代40i9d2m亲疏或近远843d3m认定、约定、规定a00e45d2m干部与职工 • c01:a123ea2c01最低层a50\kc01法规pj2*c01部落j417c01下限jl12c01偶然 • d01:a123ea1d01最高层a50d01宪法a56be21d01极刑j417d01上限jl12d01必然

  13. 包含性示例 • pj2-行政区划pj2-0省pj2-00县pj2-000乡pj2-0000村 • 54-体结构54-0面结构54-00线结构54-000点结构 • j20-空间体j20-0空间面j20-00空间线j20-000空间点 • a41e229-兵团a41e229-0军a41e229-00师a41e229-000团a41e229-0000营a41e229-00000连 • j12bc31-时j12bc31-0分j12bc31-秒 • j40-全体j40-0局部j40-00个体 • j42d01广义范围j42d01-0狭义范围

  14. 三、与传统词义关系的比较 承继部分: • 上下位、整体-部分=>层次性、包含性 • 近义、反义=>对比性、对偶性 区别部分: • 基于概念,概念是本体 • 数字化,以符号表示不同类别 • 从层次性中凸出包含性 • 对偶性的巨大发展

  15. HNC是最大的综合 • 黄先生几次提及上一个千僖年由托马斯·阿奎那和司各脱完成的大综合以及奥卡姆剃刀之后哲学和科学从神学中独立出来; • 2005年武大讲演后回答提问时说:“HNC能管多少年?我估计至少能管一千年。 ” • HNC理论吸纳了菲尔墨的格语法、乔姆斯基的语言深层结构理论、奎廉的语义网络理论、山克的概念从属理论之精华,同时吸收了训诂学的理论和方法,是以汉语为基础,适合各种语言的自然语言理解理论。 • HNC理论吸纳了乔姆斯基的UG理论、菲尔墨的格语法、奎廉的语义网络理论、山克的概念从属理论之精华,同时吸收了训诂学的理论和方法,并融古今中外各种哲学思想于一炉,是以汉语为基础、适合各种语言的自然语言理解理论。

  16. 四、对偶性的发展 对对立统一学说的发展有两点: 第一、需要区别对称//对立//对抗。 对称,不存在很明显的利益冲突,共存才和谐。 对立,基本上利益有冲突,但可以同存,即共同体是存在的。 对抗,你死我活的、利益没法平衡,具有不可共存性。 这三种层面的区分是划分出非黑氏对偶的第一个思考。 第二、黑格尔提到对立面转化。过去人们常把对立统一和转化混为一谈。转化是对抗从一种状态变成另一种状态。存在双重对立//两两对立的情况,其中一种是转化的结果(经常可以转化)。这种情况需要区别表达。

  17. 深化对偶性概念的动因 “在进行主体基元概念延伸结构设计过程中发现有三类概念需要特别表述:在作用效应链中,作用和效应由黑氏对偶已经描述得相当好(状态比较简单),而过程、转移和关系需要采取大量的非黑氏对偶。这是一种启示:人们过去首先面对的是作用和效应,而对过程、转移的思考没那么深,这也是两千年思想发展史到黑格尔仍未能突破对立统一思想的原因所在。” 最早想到的某个概念仅用对立统一描述不够而设计的非黑氏对偶放在前面(从e0到e7),其后集中于过程、转移和关系的思考。 非黑氏对偶的符号是ekm//ekn,最后把k归结为十二类,即k=0-b

  18. e0m和e0n:(取值:m=1-3//n=5-7) • 特点:e0m//e0n不存在统一体。 • 内容:分别描述两重对立的两种转化 。 • 说明:e0m描述1与2是对立的,双方妥协的结果是3。e0m描述了转化的一种状态,即双方由对立转化到不对立的状态。例如:合作与对抗,双方妥协(矛盾的转化)即放弃对抗,就形成了某种合作,实际上有三种态度,第三种作为折衷并不是统一体。在这里,不是某一方转化,而是双方转化后的状态,不好说与原来是否对立。e0n描述5与6是对立的,7是由6转化来,与5不对立,并必与6对立。所以还是以5为参照点。其中确有甲乙双方:甲方对乙方对抗态度,乙方对甲方也是对抗态度,是相互对抗,而乙方转化了,不与甲方对抗了,转化后的乙方态度与转化前是对立的。最典型的例子是“侵略//抵抗//投降”,7与5不对立,而与6对立。 • 例子:43e0m合作、对抗、妥协 a13ie0m推翻//保卫现政权、妥协 a143e0m 国际合作、对抗、妥协 b32e0m挑战、应战、逃避 40ibe0n制伏、抗拒、屈服 a15e0n侵略、抗战、投降 j77e0n简明、琐碎、系统

  19. e1m和e1n:(取值:m=0-2//n=5-6) • 特点:描述同一对象//同一件事情,只是站在不同的参照点。 • 说明:e1m和e1n的差别在前者存在对立统一体0,后者没有4。例如:“上坡//下坡”,其中“坡”是对立统一体。没有区分对称//对立//对抗,可以对称而不对立。又如“上台//下台”以e1n表述。 • 例子:20be92e1m到和来 249e1m//a228e1m 买和卖 40ibe1m 同化与消融 563e1m//a10e269e1m 压迫与被压迫 a10e26be1m//a2097be1m统治与被统治 a10e26ae1m剥夺与被剥夺 a2097ae1m剥削与被剥削 a43ae1m俘获和投降 a43e1m攻占与陷落 b30e1m胜败平 249e1n借与贷 40i97ae1n主与伴 4513e1n雇用与受雇 54-0e21e1n凸面与凹面 53a01ae45e1n招聘与应聘 a01bte1n支付与领取 a02eb1e1n布置与承担 a02eb33e1n检查与被查 a11e1n上台、下台 a123e2me1n收税与纳税 a13ie01e1n起义与暴乱 a13ie02e1n镇压与抗争 a13ie03e1n招抚与归顺a15e05te1n征服与被征服 a22ae1n出租与租入a24\1e21e22e1n取款 a24\1e22e21e1n贷款 a413e2me1n征召与参军//退伍与复员a56be1n胜诉与败诉 a59a3e1n绑架与被绑架 a59ab\ke1n伤害与被伤害 ^(a253)a\12e1n行贿与受贿 a5ae36e1n控方与被告 q711e1n邀约与被邀 q744e1n探访与被访

  20. e2m和e2n:(取值:m=1-2//n=5-6 ) • 特点:只有对称双方。 • 内容:描述对称性 。 • 说明:对称性普遍存在,但没有什么对立统一体,如左右、夫妻、父母等。e2m和e2n的差别就在有无积极消极的存在,如政治制度中民主与独裁即e2n。注意:可单用e26表示消极侧面;e2ne2n表示辩证性。 • 例子:20e2m//22e2m入出 5187b\2e2m横纵 40ae2m正副 40e2m 公私 j00e2m并串 j21ae2m 顺逆 1079e2m进退 11e2m先后 12e2m因果 12m9e2m主从 a72^e2m教学 q714^e2m赠受 a20\0^e2m投入与回报 a20bb^e2m供求 ……(共233) 1079e2n顺利与坎坷1270e2n良性与恶性循环30a9e53e2n好转与恶化50b9e21e2n治世与乱世a00bie2n诚信与欺诈a00i9e2n伟人与暴君a10e2n民主与专制 ……(共101) a10e2ne2n政治制度的两重性 a13e2ne2n和平与暴力政治的辨证转化 a00e45e2ne2n在职悖态的辩证表现 a23\33e2ne2n知识服务悖论的两重性

  21. e3m和e3n:(取值:m=1-3//n=5-7 ) • 特点:只有三方,没有统一体。 • 内容:一分为三。 • 说明:e3m和e3n的差别:e3m三方平等,不具有对抗性;e3n三方中5与6是对抗的,7与5和6不对抗,如第三方,在自然界和社会普遍存在。 • 例子:407e3m你我他a54e3m公检法 a7399e3m考试决策、执行、监督 q730e3m参赛者、预事者、观众 a209e3m公有制、私有制、股份制 a219\26e3m远程武器的发射器、载体、杀伤物 a717e3m民办、官办、超组织办学校 /// 407e3n//a13e3n我方、敌方、友方 a5ae3n检方、被告方、律师方

  22. e4m和e4n:(取值:m=1-3//n=5-7 ) • 特点:三重对立、两两对立。 • 内容:“过犹不及” ,区分积极与消极。 • 说明:仍是“三”的进一步思考,差别是:一积极两消极(如“e4m不卑不亢//卑//亢”)和一消极两积极(如“e4n在职//退休//失业”)。客观存在相互转化。 • 例子:7110\2e4m不卑不亢、卑、亢 7110ae4m中庸、保守、激进 j41e4m正好、缺少与多余j509e4m完备、残缺、多余 j60e4m恰好、不够、过分 a12ie2me4m集权与分权的度 a20979e4m财富分配的贫富适度性、消失性、殊性 a20bbe4m供求平衡、供不应求、供过于求 jl02e4m符合、低于、高于标准 2393e4m请求、乞求、强求 ……/// a00e4n在职、退休、失业 a01ae4n录用、办退、解雇 q715e4n礼貌语言、趣味语言、粗鄙语言

  23. e5m和e5n:(取值: m=1-3//n=5-7 ) • 特点:双方对称,第三方过渡。 • 内容:是对e2的补充,即忽略过渡时用e2表示。 • 说明:没有对立和对抗,都是相对的,有参照点,参照点一变就转化了。天然存在相互转化性。e5m和e5n的区别在于没有和存在积极消极之别。如“时间的过去//将来//现在”、“上中下”、“里外界”等用e5m。这个过渡一般比较小,是“两头大中间小”,两头是对称的。又如“主动//被动//自主”用e5n。 • 例子: j11e5m过去、将来、现在 j219:e5m上中下 j42e5m内外边 j01e5m交、离、介 1079e5m提前、推迟与及时 10ae5m升、降与稳定 12m9e5m事先、事后与当时 40\12e5m官、民与一般职员和部队的士官 40\13e5m//a41e5m军、民与预备役军人和民兵 50a(t)e5m 忙、闲、空 b31e2me5m攻守的胜败平 wj10-00e21e5m 上午、下午、中午……(共32) 1079e5n领先、落后与齐头并进10ae5n前进、倒退与停滞508be5n年景的优、差、中等509e5n健康、疾病、失调50ae5n幸运、倒霉、坎坷50be5n繁荣、衰败与停滞 51e5n美、丑与平常7141e5n进取、认命、消沉a019e5n高效、低效与中等管理a01be5n赢余、赤字、平衡 a11ie5n执政、在野、参政a22be5n外贸顺差、逆差与平衡 ……(共28)

  24. e6m和e6n:(取值:m=0-3//n=4-7 ) • 特点:三重+对立统一体。 • 内容:对立统一体是三方的统一。 • 说明:m的统一是妥协;n的统一服务于斗争//为斗争而统一。如“e6m调和//支持//反对//中立”。又如“e6n统战//结盟//对抗//特立独行”。都是对立性,不一定对抗。 • 例子:43e6m调和、支持、反对、中立 a143e6m外交调停、支持、反对、中立 39e6m联合分独 02e6m有所认同又有所否定、认同、否定、不认同又不否定 a5be2me6m默认、认可、不服、保留 a5bie60默认、支持、反对、保留 7221e6m绵里藏针、刚强、柔、犟 /// 43e6n统战、结盟、对抗、独行 a143e6n外交统战、结盟、对抗、独行 02e6m半信半疑、信任、怀疑、□□

  25. e7m和e7n:(取值: m=1-3//n=5-7 ) • 特点:三重对偶,第三方是消极方的弱化或强化。 • 说明:与e6的差别在于:不存在对立统一体,三方有积极消极之别;与e4的差别在于:消极一方有派生,分减弱性派生和加强性的派生:3是2的弱化(轻度的质的变化),仍是消极的;7是6的强化,更消极了。如“a019e7m廉洁//贪污//腐败”和“a019e7n公正//徇私//枉法”。 • 例子: 30ae7m成功、失败与失误 30ae7n命中、偏离与迷失 30aae7m拼搏、退缩与气馁 30aae7n抓紧、放松与拖拉02e7m同情、幸灾乐祸、□□(后者的弱化) 02e7n侠义、见死不救、助纣为虐 7110\1e7m谦虚、傲慢、自负 7110\1e7n热情、冷漠、拒绝7110\3e7m礼、粗、慢待 7110\3e7n正确对待、错误对待、不适当对待7112e7m关心、虐待、歧视7112e7n顺从、冲撞、逆反7201e7m振作、消沉、□□7201e7n反思、僵化、□□ 7202e7m勇敢、怯懦、□□7202e7n坚定、动摇、屈服j76e7m正常、异常、失常j76e7n稳定、动荡、□□ ……(共16对)43e7m和谐、冲突、磨擦 50ae7m勤劳、懒惰、懈怠 50b9ie7m友爱、道义沦丧、冷漠 50bae7m良尚、堕落、贪婪 q733e7m公正裁判、黑裁判、裁判失误……(共20) 5089e7n气候的好、差和恶劣a123e21e7n正确民意回应、错误民意回应、违反民意(5)

  26. e8m和e8n:(取值: m=1-3//n=5-7 ) • 特点:三重对偶,第三方是转化。 • 内容:描述两类过程转化。 • 说明:e8m适合时间特性的描述,不存在对立统一体,不分积极消极意义,e81必然转化到e82,e83是这个转化的过渡(长短不限),典型的例子是“新//旧//半新半旧”。e8n描述的转化过程可以是双向过程,即5和6可以相互转化,而且定义:5是积极的、6是消极的、7是6向5的转化。如“e8n富有//贫困//小康”和“e8n幸福//痛苦//称心”。若必然存在积极向消极的转化,用^e8n表示。 • 例子: j78e8m新与旧 10bae8m出生、死亡、□□ 509e8m生命力的旺与衰 55a7e8m晚辈、前辈、同辈 411i9^e8m父母与子女 50ac25e8n富有、贫困、小康

  27. e9m和e9n:(取值:m=0-3//n=5-7 ) • 特点:三重对偶,前者有统一体。 • 内容:专用于描述转移。 • 说明: e9m是对转移的不同参照点的描述: 1和2以TB2为参照点描述;3和0以TB1为参照点描述。典型汉字是“1去2来3离0回”。e9n是转移的时间(过程之序)描述,即“出发//到达//途经”,先后很有关系。 • 例子:20e9m//20be9m//22e9m//22be9m回去来离20e9n//20be9n//22e9n//22be9n出发、到达、途径a219\15*9e9n电磁信息发射、接收、传输设施

  28. eam和ean:(取值:m=1-3//n=5-7 ) • 特点:三重对偶,没有统一体。 • 内容:专用于描述关系。 • 说明:eam是关系的层次//级别的描述,如“上对下//下对上//平级”;关系的强弱//刚柔性描述用ean,如“a143ean强国对弱国的外交//弱国对强国的外交//平等外交”。 • 例子:40eam//a123eam上级、下级、平级 55eam上层、下层、中层411iae2meam//411ibe2meam上辈、下辈与同辈 209eam//229eam//239eam向下转移、向上转移、同层转移q714^e2meam赠受的层次性表现:赐予、呈献、赠送;受赐、接纳、接受 /// 44ean主宰、从属和平等 40bean关系的主动性、被动性、随动性40aean关系的主、从与对等 a143ean强国对弱国的外交//弱国对强国的外交//平等外交

  29. ebm和ebn:(取值:m=0-3//n=4-7 ) • 特点:四重对偶。 • 内容:用于描述过程和转移。 • 说明:最早怀疑对立统一用三个概念来描述不够而设计的,就是“源汇流奇”,用ebm表示。若只有三重,用~eb0表示,如“a02~eb0实施过程三步曲:启动//结束//历程”。m和n的区别待定,即ebn暂不存在(留了一个备份),将来可能赋予积极消极意义。 • 例子:12ebm奇源汇流 j42ebm端起止经 11ebm过程的过渡、开始、结束、持续 14ebm代谢、生、灭、生存 a20\0ebm合同、采购、销售、加工 a219\25*9ebm信息收发、发送、接收、传输s44baebm信息收发、发送、接收、传输工具

  30. 五、运用 一、运用两类延伸符号进行表达——P论述: • 高级逻辑,“概念运动”(“要说逻辑,对偶性逻辑西方还没认真研究过。从上个世纪60年代以后出现了模态逻辑、时态逻辑、义务逻辑、知识逻辑等等,知识逻辑才荒唐哩。其实对偶性逻辑才应该好好研究。 ”) • 世界观,通过表达实现客体化 • 延伸类别的系统化有助于娴熟地“玩转”延伸设计(“可惜过去对三种延伸的认识不够明确、不够透彻,如把t延伸和\k延伸混淆,例如气态、液态和固态是典型的并列延伸,过去搞成了交织延伸,存在误用。 ”) 二、HNC符号的解释和应用: • 倾向性分析与ekm的解释 • 概念关联性的运作、衍推

  31. 《对话》片段 • 在老朽看来 体现概念基元有限性的(HNC1)和体现基本句类有限性的(HNC2)不过是章黄训诂学直接推论的数学表示,有所超越者只是体现语境单元有限性的(HNC3)和(HNC4),这两个知识方程的核心概念是领域句类,在HNC的众多新概念中 最使老朽震撼的就是这一概念。

  32. The End Thanks!

More Related