具有强化学习的无监督文本概括制造技术

技术编号:36495328 阅读:9 留言:0更新日期:2023-02-01 15:12
提出了一种用于执行利用语言模型的Q学习以用于无监督文本概括的的计算机实现的方法。该方法包括:通过深度学习自然语言处理模型,利用单词嵌入将句子的每个单词映射到向量;将每个单词分配给动作和操作状态;通过计算局部编码和全局编码,为其操作状态表示“未操作”的单词中的每一个确定状态;以及以自我注意方式连接局部编码和全局编码,局部编码是基于单词的向量、动作和操作状态计算的,而全局编码是基于单词的每个局部编码计算的;以及经由编辑代理,基于状态,按照三个动作中的每一个确定每个单词的Q值。每个单词的Q值。每个单词的Q值。

【技术实现步骤摘要】
【国外来华专利技术】具有强化学习的无监督文本概括

技术介绍

[0001]本专利技术一般涉及无监督文本摘要,更具体地,涉及采用利用语言模型的Q语言方法的无监督文本摘要。
[0002]大量信息以文本形式存在,例如自由的、非结构化的或半结构化的文本,包括许多数据库字段、报告、备忘录、电子邮件、网站和新闻文章。这些信息可以是各种个人和实体所感兴趣的,例如商业经理、市场分析师、研究人员、私人公司、公共公司和政府机构。结果,已经开发了分析文本资源的方法。文本分析或文本数据分析可以涉及诸如文档分类、文档聚类、信息可视化、文本或文档概括以及文档交叉引用的功能。
[0003]文本摘要是指缩短长文本段的技术。本专利技术旨在创建仅具有该文献中概述的要点的连贯和流畅的概要。自动文本摘要是机器学习和自然语言处理(NLP)中的常见问题。

技术实现思路

[0004]根据一个实施例,提供了一种用于执行利用语言模型的Q学习以用于无监督文本概括的方法。该方法包括:通过深度学习自然语言处理(NPL)模型,利用单词嵌入将句子的每个单词映射到向量;将每个单词分配给动作和操作状态;通过计算局部编码和全局编码以及连接局部编码和全局编码,为其操作状态表示“未操作”的单词中的每一个确定状态;其中基于单词的向量、动作和操作状态来计算局部编码,并且基于单词的局部编码中的每一个以自我注意的方式来计算全局编码;以及经由编辑代理,基于状态,按照三个动作中的每一个确定每个单词的Q值。
[0005]根据另一实施例,提供了一种用于执行利用语言模型的Q学习以用于无监督文本概括的系统。该系统包括存储器和与存储器通信的一个或多个处理器,该一个或多个处理器被配置为经由通过深度学习自然语言处理(NPL)模型,利用单词嵌入将句子的每个单词映射到向量,将每个单词分配给动作和操作状态,通过计算局部编码和全局编码来为其操作状态表示“未操作”的单词中的每一个确定状态,并且连结局部编码和全局编码,其中基于单词的向量、动作和操作状态来计算局部编码,并且基于单词的局部编码中的每一个以自我注意方式来计算全局编码,并且经由编辑代理,基于状态按照三个动作中的每一个来为每个单词确定Q值。
[0006]根据又一实施例,提出了一种非暂时性计算机可读存储介质,其包括用于执行利用语言模型的Q学习以用于无监督文本概括的计算机可读程序。所述非暂时性计算机可读存储介质执行以下步骤:通过深度学习自然语言处理(NPL)模型,利用单词嵌入将句子的每个单词映射到向量;将每个单词分配给动作和操作状态;通过计算局部编码和全局编码以及连结局部编码和全局编码,对于其操作状态表示“未操作”的每个单词,其中基于单词的向量、动作和操作状态来计算局部编码,并且基于单词的局部编码中的每一个以自我关注的方式来计算全局编码;以及经由编辑代理,基于状态,按照三个动作中的每一个来确定每个单词的Q值。
[0007]根据一个实施例,提供了一种用于执行利用语言模型的Q学习以用于无监督文本
概括的方法。该方法包括:通过深度学习自然语言处理(NPL)模型,利用单词嵌入将句子的每个单词映射到向量;将每个单词分配给动作和操作状态;通过计算局部编码和全局编码,为其操作状态表示“未操作”的单词中的每一个确定状态,其中局部编码和全局编码是级联的;以及经由编辑代理,基于编辑操作“替换”、“保持”和“移除”,为每个单词确定Q值。
[0008]根据另一实施例,提供了一种用于执行利用语言模型的Q学习以用于无监督文本概括的系统。该系统包括存储器和与存储器通信的一个或多个处理器,该一个或多个处理器被配置为通过深度学习自然语言处理(NPL)模型,利用单词嵌入将句子的每个单词映射到向量中,将每个单词分配给动作和操作状态,通过计算局部编码和全局编码来为其操作状态表示“未操作”的单词中的每一个确定状态,其中局部编码和全局编码被级联;以及经由编辑代理,基于编辑操作“替换”、“保持”和“移除”来确定每个单词的Q值。
[0009]应当注意,参考不同的主题描述了示例性实施例。具体而言,一些实施例是参考方法类型权利要求来描述的,而其他实施例是参考装置类型权利要求来描述的。然而,本领域技术人员将从以上和以下描述中了解到,除非另外指出,除了属于一种类型的主题的特征的任何组合之外,与不同主题相关的特征之间的任何组合,特别是方法类型权利要求的特征与装置类型权利要求的特征之间的任何组合,也被认为是在本文件内描述的。
[0010]从以下结合附图阅读的对本专利技术的说明性实施例的详细描述中,这些和其它特征和优点将变得显而易见。
附图说明
[0011]本专利技术将参考以下附图在以下优选实施例的描述中提供细节,其中:
[0012]图1是示出根据本专利技术的实施例的用于无监督文本概括的利用语言模型的Q学习方法的框图/流程图;
[0013]图2是根据本专利技术的实施例的示出用于无监督文本摘要的利用语言模型的Q学习方法的状态和动作的表;
[0014]图3是根据本专利技术的实施例的用于迭代动作预测的示例性系统;
[0015]图4是根据本专利技术的一个实施例的用于由语言模型转换器进行的确定性变换的示例性机制;
[0016]图5是根据本专利技术的实施例的用于实现利用语言模型的Q学习方法以用于无监督文本摘要的示例性方法的框图/流程图;
[0017]图6是根据本专利技术的实施例在利用每个步骤中的动作序列进行压缩和重构之后计算报酬的示例;
[0018]图7是根据本专利技术的实施例的包括编辑代理和语言模型转换器的示例性处理系统;
[0019]图8是根据本专利技术实施例的示例性云计算环境的框图/流程图;以及
[0020]图9是根据本专利技术实施例的示例性抽象模型层的示意图。
[0021]在所有附图中,相同或相似的附图标记表示相同或相似的元件。
具体实施方式
[0022]根据本专利技术的实施例提供了用于采用利用语言模型的Q学习以用于无监督文本概
括的方法和设备。文本摘要是一种用于生成大量文本的简明和精确摘要同时关注传达有用信息的部分而不损失总体意义的技术。自动文本概括的目的是将冗长的文档转换成缩短的版本,如果手工完成,这可能是困难的并且花费昂贵。机器学习算法可以被训练以在产生概括的文本之前理解文档并且识别传达重要事实和信息的章节。
[0023]随着大量数据在数字空间中循环,需要开发可以自动缩短较长文本并递送可以传递预期消息的准确概要的机器学习算法。此外,应用文本概括减少了阅读时间,加速了信息搜索过程,并且增加了能够适合某一区域的信息量。在自然语言处理(NLP)中有两种主要类型的概括文本,即,基于提取的概括和基于抽象的概括。提取文本摘要技术包括从源文档中提取关键短语并将它们组合以形成摘要。根据所定义的度量进行提取,而不对文本进行任何改变。抽象技术需要解释和缩短源文档的各部分。当在深度学习问题中将抽象应用于文本摘要时,抽象可以克服提取方法的语法不一致性。抽象文本摘要算法创建了新的短语和句子,其从原始文本中转播最有用的信息。常规方法使用两个编码器

解码器,一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种在处理器上执行的用于执行利用语言模型的Q学习以用于无监督文本摘要的计算机实现的方法,所述方法包括:通过深度学习自然语言处理(NPL)模型,利用单词嵌入将句子的每个单词映射到向量中;将所述单词中的每一个分配给动作和操作状态;通过计算局部编码和全局编码,并且连接所述局部编码和所述全局编码,为其操作状态表示“未操作”的所述单词中的每一个确定状态,其中基于所述单词的向量、动作和操作状态来计算所述局部编码,并且基于所述单词的所述局部编码中的每一个以自我关注的方式来计算所述全局编码;以及经由编辑代理,基于所述状态,根据三个动作中的每一个来确定所述单词中的每一个的Q值。2.根据权利要求1所述的方法,其中所述三个动作是“替换”、“保持”和“移除”。3.根据权利要求2所述的方法,进一步包括将具有最高Q值的单词的所述动作和所述操作状态更新为具有最高Q值的动作并且将所述操作状态更新为“已操作”。4.根据权利要求3所述的方法,进一步包括重复所述确定步骤和所述更新步骤,直到所述单词的所有所述操作状态表示“已操作”。5.根据权利要求4所述的方法,还包括经由语言模型转换器将所述句子转换为掩蔽句子,其中具有“保留”的单词保留,并且具有“替换”和“移除”的单词改变为空记号。6.根据权利要求5所述的方法,还包括通过使用用于预测给定句子中的掩蔽部分的掩蔽语言模型将所述掩蔽句子中具有“替换”的每个空标志转换成预测单词来压缩所述句子。7.根据权利要求6所述的方法,还包括通过采用所述掩蔽语言模型将所述掩蔽句子中的所述空标志中的每一个转换成预测单词来从所述压缩句子重构所述句子。8.一种非暂时性计算机可读存储介质,包括在数据处理系统中的处理器上执行的计算机可读程序,所述计算机可读程序用于执行利用语言模型的Q学习以用于无监督文本摘要,其中所述计算机可读程序当在所述处理器上执行时使计算机执行以下步骤:通过深度学习自然语言处理(NPL)模型,利用单词嵌入将句子的每个单词映射到向量中;将所述单词中的每一个分配给动作和操作状态;通过计算局部编码和全局编码,并且连接所述局部编码和所述全局编码,为其操作状态表示“未操作”的所述单词中的每一个确定状态,其中基于所述单词的向量、动作和操作状态来计算所述局部编码,并且基于所述单词的所述局部编码中的每一个以自我关注的方式来计算所述全局编码;以及经由编辑代理,基于所述状态,根据三个动作中的每一个来确定所述单词中的每一个的Q值。9.根据权利要求8所述的非暂时性计算机可读存储介质,其中所述三个动作是“替换”、“保持”和“移除”。10.根据权利要求9所述的非暂时性计算机可读存储介质,其中具有最高Q值的所述单词的所述动作和所述操作状态被更新为具有最高Q值的动作并且所述操作状态被更新为“已操作”。
11.根据权利要求10所述的非暂时性计算机可读存储介质,其中重复所述确定步骤和所述更新步骤,直到所述单词的所有操作状态表示“已操作”。12.根据权利要求11所述的非暂时性计算机可读存储介质,其中所述句子经由语言模型转换器被转换为掩蔽的句子,其中具有“保持”的单词保留,并且具有“替换”和“移除”的单词改变为空标记。13.根据权利要求12所述的非暂时性计算机可读存储介质,其中通过使用用于预测给定句子中的掩蔽部分的掩蔽语言模型将所述掩蔽句子中具有“替换”的所述空标记中的每一个转换为预测单词来压缩所述句子。14.根据权利要求13所述的非暂时...

【专利技术属性】
技术研发人员:小比田凉介和地瞭良
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1