基于注意力编码器的抽取式新闻摘要生成装置制造方法及图纸

技术编号：20329225 阅读：167 留言：0更新日期：2019-02-13 05:48

一种基于注意力编码器的抽取式新闻摘要生成装置，包括：语句编码器，用于获取文档，并将文档划分为多个句子；文档编码器，用于根据所述多个句子与多个句子之间的关系获取文档表示；语句抽取器，用于根据所述多个句子与所述文档表示抽取用于作为摘要的句子。能够更好的捕获句子间的联系和依赖关系，从而准确的进行摘要的提取，在生成摘要时可以展示更丰富的信息。

全部详细技术资料下载

【技术实现步骤摘要】
基于注意力编码器的抽取式新闻摘要生成装置
本专利技术涉及文档摘要抽取
，特别涉及一种基于注意力编码器的抽取式新闻摘要生成装置。
技术介绍
随着当下新闻数据的急剧增长，发展自动文摘系统的需求愈发迫切。抽取式文本摘要的方法是通过从文档中抽取显著包含文档主要信息的句子来生成摘要，这样生成的摘要更加通顺。在解决序列化问题中展现强大功能的编码-解码结构，已经成功应用到生成抽取式摘要中，其中编码器读入源句子并用固定长度的向量进行表示，随后解码器输出预测的每个句子的标签，即决定是否抽取某个句子作为摘要的一部分。但是，现有的针对自动文摘问题的基于编码-解码结构的方法过多地关注解码器部分，即这些方法通常在解码部分使用注意力机制，而不是在编码器中收集文档的更多信息。他们的关注点在于获取与源文档更加相关的句子，但却忽略了不同句子之间的关系。句子之间的关联信息同样包含了文档的很多特征，而且这些特征对选取文档的多种信息是很有帮助的。因此，相关技术需要改进。
技术实现思路
本专利技术的目的是提供一种基于注意力编码器的抽取式新闻摘要生成装置，能够更好的捕获句子间的联系和依赖关系。为解决上述问题，本专利技术的第一方面提供了一种基于注意力编码器的抽取式新闻摘要生成装置，包括：语句编码器，用于获取文档，并将文档划分为多个句子；文档编码器，用于根据所述多个句子与多个句子之间的关系获取文档表示；语句抽取器，用于根据所述多个句子与所述文档表示抽取用于作为摘要的句子。进一步地，所述文档编码器还包括：第一层，所述第一层用于获取多个句子之间的联系。第二层，所述第二层用于获取根据多个句子和多个句子之间的...

【技术保护点】
1.一种基于注意力编码器的抽取式新闻摘要生成装置，其特征在于，包括：语句编码器，用于获取文档，并将文档划分为多个句子；文档编码器，用于根据所述多个句子与多个句子之间的关系获取文档表示；语句抽取器，用于根据所述多个句子与所述文档表示抽取用于作为摘要的句子。

【技术特征摘要】
1.一种基于注意力编码器的抽取式新闻摘要生成装置，其特征在于，包括：语句编码器，用于获取文档，并将文档划分为多个句子；文档编码器，用于根据所述多个句子与多个句子之间的关系获取文档表示；语句抽取器，用于根据所述多个句子与所述文档表示抽取用于作为摘要的句子。2.根据权利要求1所述的基于注意力编码器的抽取式新闻摘要生成装置，其特征在于，所述文档编码器还包括：第一层，所述第一层用于获取多个句子之间的联系；第二层，所述第二层用于获取根据多个句子和多个句子之间的联系获...

【专利技术属性】
技术研发人员：陈洪辉，邵太华，蔡飞，刘俊先，罗爱民，郝泽鹏，陈皖玉，潘志强，郭昱普，
申请(专利权)人：中国人民解放军国防科技大学，
类型：发明
国别省市：湖南,43

全部详细技术资料下载我是这个专利的主人