【技术实现步骤摘要】
文本摘要生成模型训练方法、文本摘要生成方法和装置
[0001]本申请涉及计算机
,特别是涉及一种文本摘要生成模型训练方法
、
文本摘要生成方法
、
装置
、
计算机设备
、
存储介质和计算机程序产品
。
技术介绍
[0002]随着计算机技术的发展,互联网中信息数量呈指数型快速增长,人们每天能够接触到海量的信息,例如时政新闻
、
热搜话题
、
社交聊天
、
讲座报告
、
学术论文等
。
为了帮助用户快速从互联网获取有效信息,自动文本摘要技术应运而生
。
自动文本摘要技术是通过各种技术,从文本中抽取
、
总结或是精炼其中的要点信息,用以概括和展示原始文本的主要内容或大意的文本摘要
。
[0003]目前,可以通过机器学习模型来生成文本摘要
。
传统技术中,通常是基于已知摘要的文章对应的文本信息和摘要信息训练得到文 ...
【技术保护点】
【技术特征摘要】
1.
一种文本摘要生成模型训练方法,其特征在于,所述方法包括:获取训练文本和所述训练文本对应的训练图像集合
、
标签文本摘要,获取所述训练文本对应的第一训练数据
、
掩码标签数据和掩码训练数据;所述掩码标签数据是第二训练数据经过掩码处理后被掩码的数据,所述掩码训练数据是第二训练数据中除掩码标签数据之外的其他数据,所述第一训练数据和所述第二训练数据是从所述训练图像集合和所述标签文本摘要中确定的;将所述训练文本和所述训练图像集合输入初始文本摘要生成模型,得到预测文本摘要,基于所述预测文本摘要和所述标签文本摘要之间的差异生成目标损失;将所述掩码训练数据和所述第一训练数据输入初始文本摘要生成模型,得到掩码预测数据,基于所述掩码标签数据和所述掩码预测数据之间的差异生成重构损失;基于所述目标损失和所述重构损失调整所述初始文本摘要生成模型的模型参数,直至满足收敛条件,得到目标文本摘要生成模型;所述目标文本摘要生成模型用于生成文本的文本摘要
。2.
根据权利要求1所述的方法,其特征在于,所述重构损失包括摘要重构损失,所述获取所述训练文本对应的第一训练数据
、
掩码标签数据和掩码训练数据,包括:获取所述训练图像集合作为第一训练数据,获取所述标签文本摘要作为第二训练数据;对所述标签文本摘要进行掩码处理得到摘要掩码标签数据和摘要掩码训练数据,获取摘要掩码标签数据作为掩码标签数据,获取摘要掩码训练数据作为掩码训练数据;所述将所述掩码训练数据和所述第一训练数据输入初始文本摘要生成模型,得到掩码预测数据,基于所述掩码标签数据和所述掩码预测数据之间的差异生成重构损失,包括:将所述训练图像集合和所述摘要掩码训练数据输入初始文本摘要生成模型,得到摘要掩码预测数据;基于所述摘要掩码标签数据和所述摘要掩码预测数据之间的差异生成摘要重构损失
。3.
根据权利要求1或2所述的方法,其特征在于,所述重构损失包括图像重构损失,所述获取所述训练文本对应的第一训练数据
、
掩码标签数据和掩码训练数据,包括:获取所述标签文本摘要作为第一训练数据,获取所述训练图像集合作为第二训练数据;对所述训练图像集合进行掩码处理得到图像掩码标签数据和图像掩码训练数据,获取图像掩码标签数据作为掩码标签数据,获取图像掩码训练数据作为掩码训练数据;所述将所述掩码训练数据和所述第一训练数据输入初始文本摘要生成模型,得到掩码预测数据,基于所述掩码标签数据和所述掩码预测数据之间的差异生成重构损失,包括:将所述标签文本摘要和所述图像掩码训练数据输入初始文本摘要生成模型,得到图像掩码预测数据;基于所述图像掩码标签数据和所述图像掩码预测数据之间的差异生成图像重构损失
。4.
根据权利要求1所述的方法,其特征在于,所述将所述训练文本和所述训练图像集合输入初始文本摘要生成模型,得到预测文本摘要,包括:将所述训练文本
、
所述训练图像集合和所述标签文本摘要输入初始文本摘要生成模型;
分别对所述训练文本和所述训练图像集合进行编码处理,得到训练文本特征和训练图像特征;融合所述训练文本特征和所述训练图像特征得到训练融合特征;基于所述标签文本摘要,对所述训练融合特征进行解码处理,得到预测文本摘要
。5.
根据权利要求4所述的方法,其特征在于,所述分别对所述训练文本和所述训练图像集合进行编码处理,得到训练文本特征和训练图像特征,包括:对所述训练文本进行特征提取,得到初始文本特征,对所述初始文本特征进行特征编码,得到所述训练文本特征;对所述训练图像集合中的训练图像进行对象识别,得到至少一个目标对象对应的对象图像特征;基于所述训练图像集合中各个训练图像对应的各个对象图像特征,得到所述训练图像集合对应的初始图像特征;对所述初始图像特征进行特征编码,得到所述训练图像特征
。6.
根据权利要求5所述的方法,其特征在于,所述基于所述训练图像集合中各个训练图像对应的各个对象图像特征,得到所述训练图像集合对应的初始图像特征,包括:分别对各个训练图像对应的图像标识
、
各个目标对象对应的对象标识
、
各个目标对象对应的识别位置进行特征提取,得到各个训练图像对应的图像标识特征
、
各个目标对象对应的对象标识特征
、
各个识别位置对应的识别位置特征;基于同一目标对象对应的对象标识特征
、
识别位置特征
、
对象图像特征
、
以及所属训练图像对应的图像标识特征,得到目标对象对应的初始图像子特征;基于各个训练图像中各个目标对象分别对应的初始图像子特征,得到所述初始图像特征
。7.
根据权利要求5所述的方法,其特征在于,当前初始特征为所述初始文本特征或所述初始图像特征,对所述当前初始特征进行特征编码,得到对应的当前训练特征,包括:对所述当前初始特征进行注意力处理,得到当前注意力特征;融合所述当前初始特征和所述当前注意力特征,得到初始融合特征;对所述初始融合特征进行特征变换,得到当前变换特征;融合所述当前变换特征和所述初始融合特征,得到目标融合特征;基于所述目标融合特征得到所述当前训练特征
。8.
根据权利要求4所述的方法,其特征在于,所述融合所述训练文本特征和所述训练图像特征得到训练融合特征,包括:对所述训练文本特征和所述训练图像特征进行模态间注意力处理,得到融合注意力特征;基于所述训练文本特征和所述融合注意力特征,得到图像过滤特征;基于所述图像过滤特征,对所述融合注意力特征进行特征过滤,得到融合增强特征;对所述融合增强特征和所述训练文本特征进行拼接处理,得到所述训练融合特征
。9.
根据权利要求8所述的方法,其特征在于,所述基于所述训练文本特征和所述融合注意力特征,得到图像过滤特征,包括:拼接所述训练文本特征和所述融合注意力特征,得到第一拼接特征;
基于第一模型参数,对所述第一拼接特征进行特征变换,得到第一变换特征;对所述第一变换特征进行特征映射,得到所述图像过滤特征
。10.
根据权利要求4所述的方法,其特征在于,所述标签文本摘要包括多个有序排列的训练摘要词语;所述基于所述标签文本摘要,对所述训练融合特征进行解码处理,得到预测文本摘要,包括:从所述标签文本摘要对应的各个词语位置中确定目标位置;从所述标签文本摘要中,获取在目标位置之前的训练摘要词语作为参考摘要词语,对参考摘要词语进行编码处理,得到参考摘要特征;基于所述训练融合特征和参考摘要特征,得到预测摘要特征;对预测摘要特征进行解码处理,得到目标位置对应的预测摘要词语;获取下一词语位置作为目标位置,返回所述从所述标签文本摘要中,获取在目标位置之前的训练摘要词语作为参考摘要词语的步骤执行,直至满足结束条件,得到多个预测摘要词语;基于各个预测摘要词语得到所述预测文本摘要
。11.
根据权利要...
【专利技术属性】
技术研发人员:梁云龙,孟凡东,徐金安,陈钰枫,
申请(专利权)人:北京交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。