130 likes | 289 Views
迎新报告会. 李成果 2013/8/26. 主要内容. 自我介绍 文档自动摘要 心得体会. 自我介绍. 姓名:李成果 导师:沈一栋 研究方向:文档自动摘要 邮箱: licg@ios.ac.cn. 文档自动摘要. 什么是文档自动摘要 文档自动摘要方法概述 文档自动摘要分类 文档自动摘要评价. 什么是文档自动摘要. GB6447-86 文摘编写规则对文摘的定义是:以提供文献内容梗概为目的,不加评论和补充解释,简明、确切地记述文献重要内容的 短文 。 而文档自动摘要就是用计算机自动生成文摘。. 文档自动摘要方法概述.
E N D
迎新报告会 李成果 2013/8/26
主要内容 • 自我介绍 • 文档自动摘要 • 心得体会
自我介绍 • 姓名:李成果 • 导师:沈一栋 • 研究方向:文档自动摘要 • 邮箱:licg@ios.ac.cn
文档自动摘要 • 什么是文档自动摘要 • 文档自动摘要方法概述 • 文档自动摘要分类 • 文档自动摘要评价
什么是文档自动摘要 • GB6447-86文摘编写规则对文摘的定义是:以提供文献内容梗概为目的,不加评论和补充解释,简明、确切地记述文献重要内容的短文。 • 而文档自动摘要就是用计算机自动生成文摘。
文档自动摘要方法概述 • 文档预处理,一般包括划分句子,移除停止词,词性还原等自然语言处理过程。 • 句子分类,排序或者聚类等。 • 选择句子生成摘要。
文档自动摘要方法概述 • 其中第二步对最终生成的摘要起决定性的作用,根据第二步采用的方法的不同,目前的方法有:有监督分类,无监督分类,有监督排序,基于图的排序,聚类,矩阵分解,数据重构等等。
文档自动摘要方法概述 • 多文档自动摘要 • 基于主题的自动摘要 • 跨语言自动摘要 • 更新式自动摘要 • 观点、情感自动摘要
文档自动摘要的评价 • 人工评价 • 语法 • 简介 • 连贯 • 指代清楚 • 响应性(如主题式摘要得出的摘要应该要与主题相关)
文档自动摘要的评价 • 自动评价 • ROUGE • Basic Elements(BE) • Pyramid 都是以人工摘要作为标准来计算准确率和召回率,不同的是基本单元不同,其中ROUGE的基本单元是n元词;BE的基本单元是一个个语义单元,可能是一到三个单词和一些命名实体;pyramid的基本单元被称为摘要内容单元,由人工来进行标注选择。
心得体会 提出一个问题往往比解决一个问题更重要。 ——爱因斯坦
祝大家生活学习愉快 Question?