新闻摘要生成方法、装置、设备及计算机可读介质制造方法及图纸

技术编号:19821746 阅读:26 留言:0更新日期:2018-12-19 14:41
本发明专利技术提出一种新闻摘要生成方法、装置、设备及计算机可读介质,其中,新闻摘要生成方法包括:获取所述事件类新闻中的事件要素片段,其中,所述事件要素片段包括所述事件类新闻的时间要素、地点要素、人物要素和事件内容要素中的至少一项;基于所述事件要素片段生成所述事件类新闻的摘要。本发明专利技术的技术方法基于事件新闻要素生成摘要,工作量可控,且能提高摘要的逻辑性。

【技术实现步骤摘要】
新闻摘要生成方法、装置、设备及计算机可读介质
本专利技术涉及信息处理技术,尤其涉及一种新闻摘要生成方法、装置、设备及计算机可读介质。
技术介绍
新闻摘要抽取是指对一篇或多篇新闻文章,抽取出简短、流畅、覆盖核心内容的文本。新闻摘要的通用技术包括基于句子的抽取法和以字符或者词为基础粒度的文本生成法。抽取法对于事件类新闻,其抽取的句子可能在逻辑上不连贯(即句子A与句子B可能是事件中不相邻的两个阶段的一部分,但在摘要中却连在了一起,导致逻辑出现问题),这对事件类新闻的摘要质量来说往往是致命的。然而受限于现有的机器学习技术,我们还较难对逻辑的连贯性做建模,因此短期内还不能找到一种通用的、解决逻辑可能不连贯的方法。文本生成法利用模型学习原文的语义等特征,之后按照自然语言生成方法逐字(或词)生成摘要结果,由于结果易出现逻辑混乱、连贯性差等问题,尚不能满足实际应用的需要。
技术实现思路
本专利技术实施例提供一种新闻摘要生成方法、装置、设备及计算机可读介质,以至少解决现有技术中的一个或多个技术问题。第一方面,本专利技术实施例提供了一种新闻摘要生成方法,包括:获取所述事件类新闻中的事件要素片段,其中,所述事本文档来自技高网...

【技术保护点】
1.一种新闻摘要生成方法,其特征在于,包括:获取所述事件类新闻中的事件要素片段,其中,所述事件要素片段包括所述事件类新闻的时间要素、地点要素、人物要素和事件内容要素中的至少一项;基于所述事件要素片段生成所述事件类新闻的摘要。

【技术特征摘要】
1.一种新闻摘要生成方法,其特征在于,包括:获取所述事件类新闻中的事件要素片段,其中,所述事件要素片段包括所述事件类新闻的时间要素、地点要素、人物要素和事件内容要素中的至少一项;基于所述事件要素片段生成所述事件类新闻的摘要。2.根据权利要求1所述的方法,其特征在于,所述获取所述事件类新闻中的事件要素片段的步骤包括:确定所述事件类新闻的有效正文;从所述有效正文中抽取所述事件要素片段。3.根据权利要求2所述的方法,其特征在于,所述从所述有效正文中抽取所述事件要素片段的步骤,包括:从所述有效正文的指定段落中抽取具有报头模式的句子作为报头句;或者根据句子与各报头句特征的匹配性,获得所述有效正文的每个句子的报头句匹配分数,将具有最高报头句匹配分数的句子作为报头句。4.根据权利要求3所述的方法,其特征在于,所述从所述有效正文中抽取所述事件要素片段的步骤还包括:根据句子与各原因句特征的匹配性,获得所述有效正文的每个句子的原因句匹配分数,将具有最高原因句匹配分数的句子作为原因句。5.根据权利要求4所述的方法,其特征在于,所述基于所述事件要素片段生成所述事件类新闻的摘要的步骤包括:将所述报头句作为所述摘要的首句;当所述原因句中具有原因的触发词以及所述报头句没有超过摘要字数限制时,将所述原因句添加至所述报头句的后面。6.根据权利要求3或4所述的方法,其特征在于,所述从所述有效正文中抽取所述事件要素片段的步骤还包括:根据句子与各意义句特征的匹配性,获得所述有效正文的每个句子的意义句匹配分数,将具有最高意义句匹配分数的句子作为意义句。7.根据权利要求6所述的方法,其特征在于,所述基于所述事件要素片段生成所述事件类新闻的摘要的步骤包括:将所述报头句作为所述摘要的首句;当所述意义句中具有意义的触发词以及所述报头句没有超过摘要字数限制时,将所述意义句添加至所述报头句的后面。8.根据权利要求6所述的方法,其特征在于,所述基于所述事件要素片段生成所述事件类新闻的摘要的步骤包括:将所述报头句作为所述摘要的首句;当原因句中具有原因...

【专利技术属性】
技术研发人员:徐伟刘家辰肖欣延吕雅娟佘俏俏
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1