用于生成抽象文本摘要的系统和方法技术方案

技术编号:31454373 阅读:34 留言:0更新日期:2021-12-18 11:20
本说明书实施例提供了用于生成文本摘要的系统和方法。示例性系统可以包括处理器和存储指令的非暂时性存储器,当处理器执行这些指令时,这些指令使系统执行各种操作。操作可以包括生成文档的文档表示。文档表示可以包括句法信息。操作还可以包括基于文档表示提取突出信息。该操作还可以包括基于句法信息和突出信息生成文档的摘要。息生成文档的摘要。息生成文档的摘要。

【技术实现步骤摘要】
【国外来华专利技术】用于生成抽象文本摘要的系统和方法


[0001]本说明书涉及用于生成文本摘要的系统和方法,更具体地,涉及利用句法信息和动态选择的突出信息生成抽象文本摘要的系统和方法。

技术介绍

[0002]文本摘要旨在自动生成由源文本的主要信息组成的摘要。摘要可以是标题或短文的形式。文本摘要通常作为自然语言处理(NLP)和信息检索(IR)的一部分进行。
[0003]现有的文本摘要方法分为两大类:抽取式和抽象式。提取文本摘要方法通过从源文本中提取句子或标记来产生摘要,这可以产生语法正确的摘要并保留源文本的含义。然而,这些提取方法严重依赖于源文档中的文本和提取的句子可能包含冗余信息或具有较差的可读性。抽象文本摘要方法通过生成可能不会出现在源文档中的新颖句子或标记来产生摘要。与提取对应物相比,抽象方法更难以实施,因为他们需要解决语义表示和自然语言生成等问题。
[0004]神经网络的最新进程已经看到了一种序列到序列(Seq2Seq)技术在抽象文本摘要中的应用,该技术最初为机器翻译开发。虽然在机器翻译中取得了巨大成功,但因为这两个应用之间的内在差异,在文本本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于生成文本摘要的系统,包括:至少一个处理器;以及至少一个存储指令的非暂时性存储器,当指令由至少一个处理器执行时,使系统执行操作,包括:生成文档的文档表示,所述文档表示包括句法信息;根据所述文档表示提取突出信息;以及基于所述句法信息和所述突出信息生成文档的摘要。2.根据权利要求1所述的系统,其中所述操作包括:由句法解析器生成文档中多个文本单元的解析树,所述解析树包括所述文本单元的结构标签。3.如权利要求2所述的系统,其中所述操作包括:将每个解析树序列化为标记序列;以及串联所述标记序列。4.根据权利要求3所述的系统,其中所述操作包括:将编码器应用于所述标记的串联序列以生成所述文档表示。5.如权利要求4所述的系统,其中所述编码器包括双向长期短期存储器(BiLSTM)。6.根据权利要求1所述的系统,其中所述操作包括:将动态选择门应用于所述文档表示以提取所述突出信息。7.如权利要求6所述的系统,其中所述操作包括:基于所述摘要中已生成的文本确定所述动态选择门。8.根据权利要求1所述的系统,其中所述操作包括:通过指针发生器网络确定基于上下文信息的切换概率;以及基于所述切换概率,通过从所述文档中选择所述单词或基于词汇数据库生成所述单词来确定所述摘要的单词。9.如权利要求8所述的系统,其中所述操作包括:通过所述指针发生器网络确定基于所述句法信息的所述上下文信息。10.根据权利要求1所述的系统,其中所述操作包括:最小化包括覆盖损失的损失函数,惩罚重复选择相同的编码器信息。11.一种生成文本摘要...

【专利技术属性】
技术研发人员:韩堃徐海洋
申请(专利权)人:北京嘀嘀无限科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1