150 likes | 357 Views
面向自然语言处理的 汉语动宾非常规搭配研究. 武汉大学文学院 吴 琼. CLSW 2013. 常规宾语与非常规宾语的区分. 非常规宾语的语义特征及机器识别. 非常规 VN 搭配的机器识别. CLSW 2013. 汉语中的动宾非常规搭配. 晒太阳. 吃大碗. 打官司. 这类结构一直是汉语语言学界热议的话题之一,不少学者都对此问题从多角度进行了论证。 (如:袁毓林 2002 ,谢晓明、王宇波 2007 ,杨永忠 2007 ,程杰 2009 ,朱怀 2011 ). 睡沙发. 考研究生. 喝小杯. 筹备展览会. 存活期. 大干红五月. 养病.
E N D
面向自然语言处理的 汉语动宾非常规搭配研究 武汉大学文学院 吴 琼 CLSW 2013
常规宾语与非常规宾语的区分 非常规宾语的语义特征及机器识别 非常规VN搭配的机器识别
CLSW 2013 汉语中的动宾非常规搭配 晒太阳 吃大碗 打官司 这类结构一直是汉语语言学界热议的话题之一,不少学者都对此问题从多角度进行了论证。 (如:袁毓林2002,谢晓明、王宇波2007,杨永忠2007,程杰2009,朱怀2011) 睡沙发 考研究生 喝小杯 筹备展览会 存活期 大干红五月 养病
CLSW 2013 但对于机器如何对非常规宾语进行识别,怎样通过机器对动宾非常规搭配的意义进行解释目前鲜有讨论。因此针对这一问题,本文从汉语动宾非常规搭配的结构及语义特点出发,探讨非常规搭配中动词和宾语的特点,并初步提出机器识别的方法,以期能够对非常规宾语的机器识别有所帮助。 近年来在自然语言处理领域出现了一个新的语言处理策略——浅层句法分析(shallow parsing),它也被称作部分句法分析(partial parsing)或语块分析(chunking parsing)。浅层句法分析不要求得到完全的句法分析树,只要求识别句子中某些相对简单、但又在句子组成中意义重要的成分。
CLSW 2013 • 常规宾语与非常规宾语的区分
CLSW 2013 张云秋(2004) [+受动性]和[+变化性] 所谓“受动性”是指宾语是动作行为的承受者,它不仅承受了动作行为而且在动作行为的作用或影响下发生了变化。所谓“变化性”是指事物在动作行为的作用或影响下发生了变化。具体包括:①事物的状态在动作行为的作用下发生了变化②事物的属性在动作行为的作用或影响下发生了变化③事物在动作行为的作用或影响下发生了从无到有的变化。
CLSW 2013 • 非常规宾语的语义特征及机器识别
CLSW 2013 选择限制是句子中词与词之间在语义上的相互限制。动宾搭配不仅是一种语法搭配关系,也是一种语义搭配关系。动词和名词能否构成一个合法的搭配除了受到句法因素的制约以外,语义因素也起着十分重要的作用。有些搭配虽然语法上没有问题,但是在语义的层面上就说不通。比如“走博士点”,虽然作为动词的“走”和作为名词的“博士点”在语法层面上能够进行组合,但是,这两者在语义上却不能匹配。因此,对于语义的研究有助于我们正确识别非常规的VN搭配。
原因宾语2(避雨) 【+时间】【-时间】 【+自主性】【-自主性】 施事宾语(跑了一个人) 时间宾语(大干红五月) 原因宾语1(哭爹) 工具宾语(抽鞭子) 处所宾语(吃馆子) 方式宾语(唱A调) 目的宾语(考研究生) 【+有生】【-有生】 【+不可控】【-不可控】 【+有形】【-有形】 【+位移】【-位移】 4 6 5 1 3 8 2 7 【+属性】【-属性】
CLSW 2013 图1 非常规宾语的识别流程图
CLSW 2013 • 非常规VN搭配的机器识别
CLSW 2013 非常规搭配动词库 常规搭配动词库 熟语库 非常规宾语语义类别库 图2 汉语非常规VN搭配识别流程图
CLSW 2013 图3 “跑北京”识别流程图
CLSW 2013 • 参 考 文 献 • 程杰.虚介词假设与增元结构——论不及物动词后非核心论元的句法属性[J].现代外语.2009(1). • 范晓.关于汉语宾语问题的思考——纪念汉语主宾语问题讨论五十周年[J].汉语学习,2006(3). • 孟琮,等.汉语动词用法词典[M].商务印书馆.北京:1999. • 魏红.面向汉语习得的常用动词带宾情况研究[D].湖北:华中师范大学,2008. • 谢晓明、王宇波.管控动宾超常搭配的若干句法因素[J].语文研究.2009,(2):29-33. • 杨永忠. Vi+NP句法异位的语用动机[J].汉语学报.2007(1). • 袁毓林.论元角色的层级关系和语义特征[J].世界汉语教学.2002(3). • 张云秋.现代汉语受事宾语句研究[M].学林出版社.上海:2004. ☺