一种基于正负样本对抗训练的文本摘要生成方法技术

技术编号：22330172 阅读：33 留言：0更新日期：2019-10-19 12:17

本发明专利技术涉及一种基于正负样本对抗训练的文本摘要生成方法，该方法包括以下步骤：(1)建立文本与摘要对组成的专家摘要库；(2)建立一个由一个生成器和一个判别器组成的对抗训练网络；(3)负样本的生成：将文本输入生成器生成一批次摘要，其标签为假摘要，作为负样本使用。(4)判别器训练：由生成器生成的当前批次假摘要，与标签为真摘要的专家摘要一起用于训练判别器；(5)生成器训练：使用判别器返回的判断结果计算生成器的损失函数和更新梯度，通过循环对抗训练过程，直到整个对抗训练网络最终收敛，从而得到基于对抗训练网络的生成式文本摘要模型。与现有技术相比，本发明专利技术具有生成更符合人类语言规则、更能概括原文主旨的优势。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于正负样本对抗训练的文本摘要生成方法
本专利技术涉及人工智能自然语言处理
，尤其是涉及一种基于正负样本对抗训练的文本摘要生成方法。
技术介绍
互联网如今深刻地影响了人们的生活，越来越多的信息通过互联网进行传播，文本信息数据量也在指数级增长。但巨大的文字信息量增加了人们浏览查找的时间，降低了查找效率。从海量信息中准备高效获取关键信息成为一个问题，文本摘要可以较好地解决这个问题。文本摘要是对文档内容和主旨的精确概括。文本摘要技术是指对于给定的文本，机器能够自动地生成能够概括原文中心思想的摘要。而如何让机器生成的文本摘要更符合人类语言规则、更能概括原文主旨是文本摘要领域待解决的重要问题之一。文本摘要的技术主要是按实现方式分为抽取式文本摘要和生成式文本摘要两种。抽取式自动文本摘要是只从原文中抽取关键的句子或词语组成摘要，摘要中的文字均来自原文。其实现方式主要是基于统计信息、词汇链和图模型等方式。优点是没有过多语法问题，比较通顺。但缺点是要基于一些抽取模板和专家规则，扩展性很差且摘要过于冗长；如果原文中未有中心语句，则无法表达原文主旨。生成式文本摘要是在理解原文语义和思想的基础上，生成新的句子或词语组成摘要，摘要中的某些文字可能不来自原文。其实现方式主要是基于深度学习的编码器解码器模型。优点是扩展性强，只要有对应语言的文本摘要对数据，就可以训练模型；生成的摘要可以使用非原文词，短小精悍。缺点是容易出现一些语法错误，语句有时不够通顺，即不符合人类语言规则。现有的生成式文本摘要模型往往存在生成的摘要不符合人类语言规则、无法很好地概括原文主旨、学习摘要语言风格...

【技术保护点】
1.一种基于正负样本对抗训练的文本摘要生成方法，其特征在于，该方法包括以下步骤：步骤1：根据需求建立相应风格的专家摘要库；步骤2：建立对抗训练网络，所述对抗训练网络包括由解码器和编码器组成的生成器和判别器；步骤3：初始化对抗训练网络并将专家摘要库中的文本输入至对抗训练网络的生成器中以生成用于判别器训练需要的第一批次假摘要负样本；步骤4：利用专家摘要库和第一批次假摘要负样本对对抗训练网络中的判别器进行基于有监督学习的分类训练并根据判别器经训练后返回的分类判别结果计算更新梯度；步骤5：根据更新梯度更新生成器参数并再次将专家摘要库中的文本输入至经过参数更新的生成器中以生成第二批次假摘要负样本，并返回步骤4再次与专家摘要库配合并最终再次计算更新梯度；步骤6：循环迭代执行步骤4和步骤5中各自的训练直至生成器和判别器均收敛后训练结束，并利用训练结束后的生成器生成实际需求的文本摘要。

【技术特征摘要】
1.一种基于正负样本对抗训练的文本摘要生成方法，其特征在于，该方法包括以下步骤：步骤1：根据需求建立相应风格的专家摘要库；步骤2：建立对抗训练网络，所述对抗训练网络包括由解码器和编码器组成的生成器和判别器；步骤3：初始化对抗训练网络并将专家摘要库中的文本输入至对抗训练网络的生成器中以生成用于判别器训练需要的第一批次假摘要负样本；步骤4：利用专家摘要库和第一批次假摘要负样本对对抗训练网络中的判别器进行基于有监督学习的分类训练并根据判别器经训练后返回的分类判别结果计算更新梯度；步骤5：根据更新梯度更新生成器参数并再次将专家摘要库中的文本输入至经过参数更新的生成器中以生成第二批次假摘要负样本，并返回步骤4再次与专家摘要库配合并最终再次计算更新梯度；步骤6：循环迭代执行步骤4和步骤5中各自的训练直至生成器和判别器均收敛后训练结束，并利用训练结束后的生成器生成实际需求的文本摘要。2.根据权利要求1所述的一种基于正负样本对抗训练的文本摘要生成方法，其特征在于，所述的步骤4中的更新梯度的计算公式为：式中，表示更新梯度，m表示输入文本样本数量，i为自然数，G(si)表示生成器生成的假摘要，D(G(si))表示判别器对于假摘要的判别结果为真。3.根据权利要求1所述的一种基于正负样本对抗训练的文本摘要生成方法，其特征在于，所述的步骤2中的生成器采用单向或双向循环神经网络以构建所述解码器和...

【专利技术属性】
技术研发人员：向阳，邱俊，
申请(专利权)人：同济大学，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人