具有强化学习的无监督文本概括制造技术

技术编号：36495328 阅读：9 留言：0更新日期：2023-02-01 15:12

提出了一种用于执行利用语言模型的Q学习以用于无监督文本概括的的计算机实现的方法。该方法包括：通过深度学习自然语言处理模型，利用单词嵌入将句子的每个单词映射到向量；将每个单词分配给动作和操作状态；通过计算局部编码和全局编码，为其操作状态表示“未操作”的单词中的每一个确定状态；以及以自我注意方式连接局部编码和全局编码，局部编码是基于单词的向量、动作和操作状态计算的，而全局编码是基于单词的每个局部编码计算的；以及经由编辑代理，基于状态，按照三个动作中的每一个确定每个单词的Q值。每个单词的Q值。每个单词的Q值。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】具有强化学习的无监督文本概括

技术介绍

[0001]本专利技术一般涉及无监督文本摘要，更具体地，涉及采用利用语言模型的Q语言方法的无监督文本摘要。
[0002]大量信息以文本形式存在，例如自由的、非结构化的或半结构化的文本，包括许多数据库字段、报告、备忘录、电子邮件、网站和新闻文章。这些信息可以是各种个人和实体所感兴趣的，例如商业经理、市场分析师、研究人员、私人公司、公共公司和政府机构。结果，已经开发了分析文本资源的方法。文本分析或文本数据分析可以涉及诸如文档分类、文档聚类、信息可视化、文本或文档概括以及文档交叉引用的功能。
[0003]文本摘要是指缩短长文本段的技术。本专利技术旨在创建仅具有该文献中概述的要点的连贯和流畅的概要。自动文本摘要是机器学习和自然语言处理(NLP)中的常见问题。

技术实现思路

[0004]根据一个实施例，提供了一种用于执行利用语言模型的Q学习以用于无监督文本概括的方法。该方法包括：通过深度学习自然语言处理(NPL)模型，利用单词嵌入将句子的每个单词映射到向量；将每个单词分配给动作和操作状态；通过计算局部编码和全局编码以及连接局部编码和全局编码，为其操作状态表示“未操作”的单词中的每一个确定状态；其中基于单词的向量、动作和操作状态来计算局部编码，并且基于单词的局部编码中的每一个以自我注意的方式来计算全局编码；以及经由编辑代理，基于状态，按照三个动作中的每一个确定每个单词的Q值。
[0005]根据另一实施例，提供了一种用于执行利用语言模型的Q学习以用于无监督文本概括的系统。该系统...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种在处理器上执行的用于执行利用语言模型的Q学习以用于无监督文本摘要的计算机实现的方法，所述方法包括：通过深度学习自然语言处理(NPL)模型，利用单词嵌入将句子的每个单词映射到向量中；将所述单词中的每一个分配给动作和操作状态；通过计算局部编码和全局编码，并且连接所述局部编码和所述全局编码，为其操作状态表示“未操作”的所述单词中的每一个确定状态，其中基于所述单词的向量、动作和操作状态来计算所述局部编码，并且基于所述单词的所述局部编码中的每一个以自我关注的方式来计算所述全局编码；以及经由编辑代理，基于所述状态，根据三个动作中的每一个来确定所述单词中的每一个的Q值。2.根据权利要求1所述的方法，其中所述三个动作是“替换”、“保持”和“移除”。3.根据权利要求2所述的方法，进一步包括将具有最高Q值的单词的所述动作和所述操作状态更新为具有最高Q值的动作并且将所述操作状态更新为“已操作”。4.根据权利要求3所述的方法，进一步包括重复所述确定步骤和所述更新步骤，直到所述单词的所有所述操作状态表示“已操作”。5.根据权利要求4所述的方法，还包括经由语言模型转换器将所述句子转换为掩蔽句子，其中具有“保留”的单词保留，并且具有“替换”和“移除”的单词改变为空记号。6.根据权利要求5所述的方法，还包括通过使用用于预测给定句子中的掩蔽部分的掩蔽语言模型将所述掩蔽句子中具有“替换”的每个空标志转换成预测单词来压缩所述句子。7.根据权利要求6所述的方法，还包括通过采用所述掩蔽语言模型将所述掩蔽句子中的所述空标志中的每一个转换成预测单词来从所述压缩句子重构所述句子。8.一种非暂时性计算机可读存储介质，包括在数据处理系统中的处理器上执行的计算机可读程序，所述计算机可读程序用于执行利用语言模型的Q学习以用于无监督文本摘要，其中所述计算机可读程序当在所述处理器上执行时使计算机执行以下步骤：通过深度学习自然语言处理(NPL)模型，利用单词嵌入将句子的每个单词映射到向量中；将所述单词中的每一个分配给动作和操作状态；通过计算局部编码和全局编码，并且连接所述局部编码和所述全局编码，为其操作状态表示“未操作”的所述单词中的每一个确定状态，其中基于所述单词的向量、动作和操作状态来计算所述局部编码，并且基于所述单词的所述局部编码中的每一个以自我关注的方式来计算所述全局编码；以及经由编辑代理，基于所述状态，根据三个动作中的每一个来确定所述单词中的每一个的Q值。9.根据权利要求8所述的非暂时性计算机可读存储介质，其中所述三个动作是“替换”、“保持”和“移除”。10.根据权利要求9所述的非暂时性计算机可读存储介质，其中具有最高Q值的所述单词的所述动作和所述操作状态被更新为具有最高Q值的动作并且所述操作状态被更新为“已操作”。
11.根据权利要求10所述的非暂时性计算机可读存储介质，其中重复所述确定步骤和所述更新步骤，直到所述单词的所有操作状态表示“已操作”。12.根据权利要求11所述的非暂时性计算机可读存储介质，其中所述句子经由语言模型转换器被转换为掩蔽的句子，其中具有“保持”的单词保留，并且具有“替换”和“移除”的单词改变为空标记。13.根据权利要求12所述的非暂时性计算机可读存储介质，其中通过使用用于预测给定句子中的掩蔽部分的掩蔽语言模型将所述掩蔽句子中具有“替换”的所述空标记中的每一个转换为预测单词来压缩所述句子。14.根据权利要求13所述的非暂时...

【专利技术属性】
技术研发人员：小比田凉介，和地瞭良，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人