260 likes | 387 Views
语义特征在评价对象 抽取与极性判定中的作用. 周红照 侯明午 颜彭莉 张叶青 侯敏 滕永林 中国传媒大学 国家语言资源监测与研究有声媒体中心 2013 年 11 月 18 日. ◇ 引入语义特征的必要性 ◇ 语义特征的类型与功能 ◇ 系统运行流程 ◇ 实验结果 ◇ 结语. 引入语义特征的必要性. 无论是统计还是规则的方法,都已经关注到了词性、词性组合、依存关系等语法特征在评价对象抽取与极性判定中的作用。 语法确实很重要,但并非“万能”,有些问题单纯依靠语法难以解决,例如:. ①新 《 笑傲江湖 》 力挺 东方不败。
E N D
语义特征在评价对象抽取与极性判定中的作用 周红照 侯明午 颜彭莉 张叶青 侯敏 滕永林 中国传媒大学 国家语言资源监测与研究有声媒体中心 2013年11月18日
◇ 引入语义特征的必要性 ◇ 语义特征的类型与功能 ◇ 系统运行流程 ◇ 实验结果 ◇ 结语
引入语义特征的必要性 无论是统计还是规则的方法,都已经关注到了词性、词性组合、依存关系等语法特征在评价对象抽取与极性判定中的作用。 语法确实很重要,但并非“万能”,有些问题单纯依靠语法难以解决,例如: ①新《笑傲江湖》 力挺 东方不败。 ②黄渤的舞 亮瞎 我的眼了。 主—谓—宾
语义特征的类型与功能 功能:定位评价对象与评价因子的相对位置、确定评价对象左右边界、排除无关词语的干扰 语 义 特 征 评价对象抽取(七) 极性判定(五) 上下文无关型:漂亮、优雅、和蔼可亲 上下文相关型:科学、效率、高低大小 数学是一门科学。() 他的方法很科学。()
①新《笑傲江湖》 力挺 东方不败。 ②黄渤的舞 亮瞎 我的眼了。 • 后指动词:评价对象总是后面的宾语。 • (力挺、欣赏、鄙视:hzv) • 前指动词:评价对象总是前面的主语。 • (亮瞎、背叛、有助于:qzv)
当评价词语为名词性的、并且作定语中心语时,其语义指向(即评价对象)会随着其语义特征的不同而变化。当评价词语为名词性的、并且作定语中心语时,其语义指向(即评价对象)会随着其语义特征的不同而变化。 ③这种人是(社会的败类)。 ④#毒玩具#这是(相关政府部门的耻辱)。 耻辱、毛病、劣迹 :qdn
当评价词语是受介词短语修饰的状语中心语时,其语义指向如何? ⑤PM2.5 对呼吸系统 危害很大。 ⑥玩家 对锤子ROM 很满意。 原因: (危害∈非心理动词) || (满意∈心理动词) 介词的宾语 主 语
希望 ⑦ 祖国越来越强大。 意愿句 ≠ 评价句,无需抽取评价对象。 评价词语是评价句的必要非充分条件,包含评价词语的句子未必是评价句。评价消解词就是指像“希望”这样的可以消解掉评价词语的评价倾向的词。 (1)主观愿望类:希望、但愿、祝愿…… (2)主观猜度类:猜、估计、不知道…… (3)假设、让步类:如果、假如、就算……
评价对象绝缘词:既不能单独充当评价对象,也不能充当评价对象的修饰成分的词。可以是某一整类词(叹词、语气词、拟声词、连词),也可以是某类词中的少量特殊词。评价对象绝缘词:既不能单独充当评价对象,也不能充当评价对象的修饰成分的词。可以是某一整类词(叹词、语气词、拟声词、连词),也可以是某类词中的少量特殊词。 能愿动词 让、使、受到、引起、导致 判断动词 动词 遭受、致使类动词 评价对象绝缘词 称说、比况类动词 谁、哪、如何、怎么、为什么 疑问代词 代词 副词性代词 时候、详情 名词 语义特殊名词
评价触发词:按照语用习惯,评价对象经常出现在一些特定词语之后,这些词语往往是一个评价的触媒,我们称其为“评价触发词”,评价对象通常紧跟其后。评价触发词:按照语用习惯,评价对象经常出现在一些特定词语之后,这些词语往往是一个评价的触媒,我们称其为“评价触发词”,评价对象通常紧跟其后。 ⑦我觉得陈乔恩的东方不败演技不错。 ⑧ #曼联VS皇马#个人认为纳尼的红牌不存在任何异议。 ⑨ #中国方言式英语#充分证明中国英语教育的失败。
官僚、屌丝、娘、二、主观 素质、水平、道德、逻辑 是……的问题 难道……评价词 青春、阳光、男人、科学 高、低、大小、长、短 程度副词 + nxn = -0.75 有 + ypn=0.5 否定性副词/动词 + ypn=-0.5 是……的问题 = -0.5 难道……评价词 = 评价词 (-1) 程度副词 + pxn = 0.75 性价比|效率|水平|质量 + 高 = 0.5 成本|费用|风险|通胀|油耗 + 高= -0.5
官僚、屌丝、娘、二、主观 素质、水平、道德、逻辑 是……的问题 难道……评价词 青春、阳光、男人、科学 高、低、大小、长、短 程度副词+nxn = -0.75 有+ypn=0.5 否定性副词/动词+ypn=-0.5 是……的问题=-0.5 难道……评价词=评价词 (-1) 程度副词+pxn = 0.75 性价比|效率|水平|质量 + 高 = 0.5 成本|费用|风险|通胀|油耗 + 高= -0.5
语义词典示例 格式示例 规模大小
CUCsas系统工作流程 CUCsas倾向性分析系统运行流程
官僚、屌丝、娘、二、主观 素质、水平、道德、逻辑 是……的问题 难道……评价词 青春、阳光、男人、科学 高、低、大小、长、短 程度副词+nxn = -0.75 有+ypn=0.5 否定性副词/动词+ypn=-0.5 是……的问题=-0.5 难道……评价词=评价词 (-1) 程度副词+pxn = 0.75 性价比|效率|水平|质量 + 高 = 0.5 成本|费用|风险|通胀|油耗 + 高= -0.5
CUCsas系统工作流程 CUCsas倾向性分析系统运行流程
评价对象抽取与极性判定规则举例: • */hzv + #1:20[*/!(jyc|cfc|w)] + JSB = N2[obj,N1] 词 词 词 词 #厨子戏子痞子#观众喜欢最后十分钟的民国风。 钦慕演员的全力演出! 这么多人盛赞查韦斯。 不过,我很看好这个团队。 新《笑傲江湖》力挺东方不败。 #锤子ROM#大家都认同小米了。 看了锤子ROM发布会,我很佩服老罗的勇气。 最鄙视那种起来看看比分骂骂裁判的伪球迷了。 很喜欢金庸先生在新修版《天龙八部》中对王语嫣的改编。 ……
实验结果 0.167 • 2012、2013 CCF评测中评价要素抽取及极性判断评测结果
结语 如果说句法关心的是宏观性、一般性问题,语义则更多的涉及微观性、具体性问题,它使语言的研究走向了精密化。 评价对象抽取与极性判定这一语言工程的顺利开展,需要句法、语义相互配合,如果顾此失彼,可能很难取得理想的效果。
谢 谢! 邮箱:zhzwin2011@163.com