一种基于图文融合的生成式摘要生成方法技术

技术编号：23149248 阅读：48 留言：0更新日期：2020-01-18 13:32

本发明专利技术公开了一种基于图文融合的生成式摘要生成方法，其步骤包括：1)将给定的文本数据集划分为训练集、验证集和测试集；其中，文本数据集中的每一样本是一三元组(X,I,Y)，X是文本，I是文本X对应的图像，Y是文本X的摘要；2)对文本数据集的图像进行实体特征提取，并将提取的实体特征表示成与文本同维度的图像特征向量；3)使用训练集和训练集对应的图像特征向量对生成式摘要模型进行训练；4)输入一条文本和对应图像并生成该图像的图像特征向量，然后将该文本及其对应的图像特征向量输入到训练后的生成式摘要模型，得到该文本对应的摘要。本发明专利技术生成的摘要可以有效地调整文本中实体的权重，在一定程度缓解未登录词的问题。

A method of generating summary based on image and text fusion

全部详细技术资料下载

【技术实现步骤摘要】
一种基于图文融合的生成式摘要生成方法
本专利技术属于人工
，涉及一种基于图文融合的生成式摘要生成方法。
技术介绍
现有的生成式摘要方法主要基于深度学习的seq2seq框架和注意力机制实现的。Seq2Seq框架主要由编码器(encoder)和解码器(decoder)组成，编码和解码都由神经网络实现，神经网络可以是递归神经网络(RNN)或卷积神经网络(CNN)。其具体过程如下，编码器将输入的原文本编码成一个向量(context)，该向量是原文本的一个表征。然后，解码器负责从这个向量提取重要信息、生成文本摘要。注意力机制为了解决长序列到定长向量转化而造成的信息损失的瓶颈，即在解码器中将注意力关注于对应的上下文。虽然基于深度学习的seq2seq框架和注意力机制在摘要生成领域取得了一定的成绩，但是其趋向于生成高频词，从而会导致关键实体偏差的问题。一般情况下，关键实体的偏差有两种形式：第一、由于硬件资源的限制，一般会采用有限的词表，文章中的某些生僻关键实体词并不会出现在词表中，导致生成的摘要中缺失这些关键实体；第二、相对低频实体被忽略。为了关键实体偏差的问题，本专利技术提出一种基于图文融合的生成式摘要方法，该方法引入图片区域信息，联合注意力机制将图片特征有机融合于文本内容中，动态调整关键实体信息的权重，从而提升生成摘要的质量。
技术实现思路
本申请提案能解决现有生成式摘要关键实体缺失的问题，从而提升生成摘要的质量以及可读性。以上的技术问题是通过下列技术方案解决的：一种基于...

【技术保护点】
1.一种基于图文融合的生成式摘要生成方法，其步骤包括：/n1)将给定的文本数据集划分为训练集、验证集和测试集；其中，文本数据集中的每一样本是一三元组(X,I,Y)，X是文本，I是文本X对应的图像，Y是文本X的摘要；/n2)对文本数据集的图像进行实体特征提取，并将提取的实体特征表示成与文本同维度的图像特征向量；/n3)使用训练集和训练集对应的图像特征向量对生成式摘要模型进行训练；/n4)输入一条文本和对应图像并生成该图像的图像特征向量，然后将该文本及其对应的图像特征向量输入到训练后的生成式摘要模型，得到该文本对应的摘要。/n

【技术特征摘要】
1.一种基于图文融合的生成式摘要生成方法，其步骤包括：
1)将给定的文本数据集划分为训练集、验证集和测试集；其中，文本数据集中的每一样本是一三元组(X,I,Y)，X是文本，I是文本X对应的图像，Y是文本X的摘要；
2)对文本数据集的图像进行实体特征提取，并将提取的实体特征表示成与文本同维度的图像特征向量；
3)使用训练集和训练集对应的图像特征向量对生成式摘要模型进行训练；
4)输入一条文本和对应图像并生成该图像的图像特征向量，然后将该文本及其对应的图像特征向量输入到训练后的生成式摘要模型，得到该文本对应的摘要。

2.如权利要求1所述的方法，其特征在于，图像特征向量包括图像全局特征向量和图像中最大区域的三个实体向量。

3.如权利要求1或2所述的方法，其特征在于，所述生成式摘要模型包含特征提取模块、特征融合模块以及摘要生成模块；步骤2)中，特征提取模块使用区域卷积神经网络捕获每一图像的实体特征，然后选取区域最大的前三个实体特征作为候选区域；然后生成该图像全局特征的图像特征和三个候选区域的图像特征；然后将所述图像特征转换为与文本同维度的图像特征向量；步骤3)中进行训练时，对于同一样本，特征融合模块将该样本对应的文本向量和该样本对应的图像特征向量进行拼接，得到向量化表示的训练集、验证集和测试集；然后从向量化表示的训练集中选取k个样本依次输入到编码器中，得到文本和图像的联合编码hs，通过中间语义向量ct，计算解码器在当前状态ht，从而实现特征融合；然后摘要生成模块使用融合的特征生成摘要。

4.如权利要求3所述的方法，其特征在于，所述特征融合的方法为：在编码阶段当前时刻i的隐层输出为hs，在编码阶段当前时刻i解码器的隐状态为ht，通过转移矩阵Wa计算当前状...

【专利技术属性】
技术研发人员：曹亚男，徐灏，尚燕敏，刘燕兵，谭建龙，郭莉，
申请(专利权)人：中国科学院信息工程研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人