标题生成模型的训练方法和标题生成方法、装置和介质制造方法及图纸

技术编号:37983231 阅读:8 留言:0更新日期:2023-06-30 09:58
本说明书实施例公开了一种标题生成模型的训练方法、标题生成方法、装置、存储介质及电子设备,方法包括:获取样本视频片段的训练文本,训练文本包括样本视频片段的样本拆条文本和样本拆条文本的前缀文本,前缀文本为被遮罩样本拆条文本中标注关键词的文本;将训练文本输入标题生成模型,通过标题生成模型,基于注意力机制对训练文本进行编码,得到训练文本的语义特征;通过标题生成模型,基于训练文本的语义特征进行预测,输出样本拆条文本中的预测关键词以及样本视频片段的预测标题;基于预测关键词与标注关键词之间的第一差异信息,以及预测标题与样本视频片段的标注标题之间的第二差异信息,对标题生成模型进行训练。对标题生成模型进行训练。对标题生成模型进行训练。

【技术实现步骤摘要】
标题生成模型的训练方法和标题生成方法、装置和介质


[0001]本说明书涉及计算机
,尤其涉及一种标题生成模型的训练方法、标题生成方法、装置、存储介质及电子设备。

技术介绍

[0002]随着计算机技术的发展,越来越多的用户会通过观看直播的方式来进行学习,比如,用户可以通过观看金融服务平台开设的直播来学习金融知识。在用户错过某场直播的情况下,金融服务平台也会提供直播回放服务,用户通过观看直播回放视频也能够学习金融知识。
[0003]相关技术中,由于直播回放视频的时间较长且通常会携带一些无效信息,技术人员往往会将直播回放视频切分为多个视频片段,为多个视频片段手动设置标题,通过标题来吸引用户观看对应的视频片段,从而节省用户的时间。
[0004]但是,这种手动设置标题的方式效率较低,亟须一种更加智能化的标题生成方法。

技术实现思路

[0005]本说明书提供一种标题生成模型的训练方法、标题生成方法、装置、存储介质及电子设备,能够训练一个标题生成模型来生成视频片段的标题,提高为视频片段设置标题的效率。
[0006]一方面,本说明书实施例提供一种标题生成模型的训练方法,包括:
[0007]获取样本视频片段的训练文本,所述训练文本包括所述样本视频片段的样本拆条文本和所述样本拆条文本的前缀文本,所述前缀文本为被遮罩所述样本拆条文本中标注关键词的文本;
[0008]将所述训练文本输入标题生成模型,通过所述标题生成模型,基于注意力机制对所述训练文本进行编码,得到所述训练文本的语义特征;
[0009]通过所述标题生成模型,基于所述训练文本的语义特征进行预测,输出所述样本拆条文本中的预测关键词以及所述样本视频片段的预测标题;
[0010]基于所述预测关键词与所述标注关键词之间的第一差异信息,以及所述预测标题与所述样本视频片段的标注标题之间的第二差异信息,对所述标题生成模型进行训练。
[0011]在一种可能的实施方式中,所述通过所述标题生成模型,基于注意力机制对所述训练文本进行编码,得到所述训练文本的语义特征包括:
[0012]通过所述标题生成模型,将所述前缀文本中的字符配置为全局注意力字符,将所述样本拆条文本中的字符配置为局部注意力字符,所述全局注意力字符表示与所述训练文本中全部字符进行注意力运算的字符,所述局部注意力字符表示与所述训练文本中部分字符进行注意力运算的字符;
[0013]通过所述标题生成模型,对所述训练文本中多个字符进行注意力编码,得到所述训练文本中多个字符的注意力特征;将所述多个字符的注意力特征进行融合,得到所述训
练文本的语义特征。
[0014]在一种可能的实施方式中,所述对所述训练文本中多个字符进行注意力编码,得到所述训练文本中多个字符的注意力特征包括:
[0015]对于所述多个字符中的任一字符,在所述字符属于所述前缀文本的情况下,确定所述字符与所述训练文本中其他字符之间的第一注意力权重;基于所述字符以及所述第一注意力权重,确定所述字符的注意力特征;
[0016]在所述字符属于所述样本拆条文本的情况下,确定所述字符与所述训练文本中的参考字符之间的第二注意力权重,所述参考字符是所述训练文本中所述字符周围的字符;基于所述字符以及所述第二注意力权重,确定所述字符的注意力特征。
[0017]在一种可能的实施方式中,所述在所述字符属于所述样本拆条文本的情况下,确定所述字符与所述训练文本中的参考字符之间的第二注意力权重包括:
[0018]在所述字符属于所述样本拆条文本的情况下,确定覆盖所述字符时滑动窗口中的所述参考字符,所述滑动窗口在所述训练文本上进行滑动;
[0019]确定所述字符的查询矩阵以及所述参考字符的键矩阵;
[0020]基于所述字符的查询矩阵以及所述参考字符的键矩阵,确定所述字符与所述训练文本中的参考字符之间的第二注意力权重。
[0021]在一种可能的实施方式中,所述通过所述标题生成模型,基于所述训练文本的语义特征进行预测,输出所述样本拆条文本中的预测关键词以及所述样本视频片段的预测标题包括:
[0022]通过所述标题生成模型,对所述训练文本的语义特征进行全连接和归一化,输出所述样本拆条文本中的预测关键词;
[0023]通过所述标题生成模型,基于所述训练文本的语义特征进行多轮迭代解码,输出所述样本视频片段的预测标题。
[0024]在一种可能的实施方式中,所述通过所述标题生成模型,基于所述训练文本的语义特征进行多轮迭代解码,输出所述样本视频片段的预测标题包括:
[0025]在第一轮迭代过程中,通过所述标题生成模型,基于所述训练文本的语义特征和开始字符进行迭代,输出所述样本视频片段的预测标题中的第一个字符;
[0026]在其他轮迭代过程中,通过所述标题生成模型,基于所述训练文本的语义特征和上轮迭代输出的字符,输出本轮迭代对应的字符。
[0027]在一种可能的实施方式中,所述基于所述预测关键词与所述标注关键词之间的第一差异信息,以及所述预测标题与所述样本视频片段的标注标题之间的第二差异信息,对所述标题生成模型进行训练包括:
[0028]基于所述第一差异信息和所述第二差异信息构建联合损失函数;
[0029]基于所述联合损失函数对所述标题生成模型进行训练。
[0030]在一种可能的实施方式中,所述样本拆条文本的标注关键词的获取方法包括:
[0031]对所述样本视频片段的样本拆条文本进行关键词识别,得到所述样本拆条文本的标注关键词。
[0032]一方面,本说明书实施例提供一种标题生成方法,包括:
[0033]获取目标视频片段的拆条文本,所述目标视频片段是对视频进行拆条后得到的;
[0034]将所述拆条文本输入标题生成模型,通过所述标题生成模型,基于注意力机制对所述拆条文本进行编码,得到所述拆条文本的语义特征;
[0035]通过所述标题生成模型,基于所述拆条文本的语义特征进行预测,输出所述目标视频片段的标题;
[0036]其中,所述标题生成模型是基于样本视频片段的训练文本、所述样本视频片段的标注标题以及所述训练文本中样本拆条文本的标注关键词训练得到的,所述训练文本还包括所述样本拆条文本的前缀文本,所述前缀文本为被遮罩所述样本拆条文本中所述标注关键词的文本。
[0037]在一种可能的实施方式中,所述通过所述标题生成模型,基于注意力机制对所述拆条文本进行编码,得到所述拆条文本的语义特征之后,所述方法还包括:
[0038]通过所述标题生成模型,基于所述拆条文本的语义特征进行预测,输出所述拆条文本中的关键词。
[0039]在一种可能的实施方式中,所述将所述拆条文本输入标题生成模型,通过所述标题生成模型,基于注意力机制对所述拆条文本进行编码,得到所述拆条文本的语义特征之前,所述方法还包括:
[0040]获取所述拆条文本中的参考关键词;
[0041]所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种标题生成模型的训练方法,包括:获取样本视频片段的训练文本,所述训练文本包括所述样本视频片段的样本拆条文本和所述样本拆条文本的前缀文本,所述前缀文本为被遮罩所述样本拆条文本中标注关键词的文本;将所述训练文本输入标题生成模型,通过所述标题生成模型,基于注意力机制对所述训练文本进行编码,得到所述训练文本的语义特征;通过所述标题生成模型,基于所述训练文本的语义特征进行预测,输出所述样本拆条文本中的预测关键词以及所述样本视频片段的预测标题;基于所述预测关键词与所述标注关键词之间的第一差异信息,以及所述预测标题与所述样本视频片段的标注标题之间的第二差异信息,对所述标题生成模型进行训练。2.根据权利要求1所述的方法,所述通过所述标题生成模型,基于注意力机制对所述训练文本进行编码,得到所述训练文本的语义特征包括:通过所述标题生成模型,将所述前缀文本中的字符配置为全局注意力字符,将所述样本拆条文本中的字符配置为局部注意力字符,所述全局注意力字符表示与所述训练文本中全部字符进行注意力运算的字符,所述局部注意力字符表示与所述训练文本中部分字符进行注意力运算的字符;通过所述标题生成模型,对所述训练文本中多个字符进行注意力编码,得到所述训练文本中多个字符的注意力特征;将所述多个字符的注意力特征进行融合,得到所述训练文本的语义特征。3.根据权利要求2所述的方法,所述对所述训练文本中多个字符进行注意力编码,得到所述训练文本中多个字符的注意力特征包括:对于所述多个字符中的任一字符,在所述字符属于所述前缀文本的情况下,确定所述字符与所述训练文本中其他字符之间的第一注意力权重;基于所述字符以及所述第一注意力权重,确定所述字符的注意力特征;在所述字符属于所述样本拆条文本的情况下,确定所述字符与所述训练文本中的参考字符之间的第二注意力权重,所述参考字符是所述训练文本中所述字符周围的字符;基于所述字符以及所述第二注意力权重,确定所述字符的注意力特征。4.根据权利要求3所述的方法,所述在所述字符属于所述样本拆条文本的情况下,确定所述字符与所述训练文本中的参考字符之间的第二注意力权重包括:在所述字符属于所述样本拆条文本的情况下,确定覆盖所述字符时滑动窗口中的所述参考字符,所述滑动窗口在所述训练文本上进行滑动;确定所述字符的查询矩阵以及所述参考字符的键矩阵;基于所述字符的查询矩阵以及所述参考字符的键矩阵,确定所述字符与所述训练文本中的参考字符之间的第二注意力权重。5.根据权利要求1所述的方法,所述通过所述标题生成模型,基于所述训练文本的语义特征进行预测,输出所述样本拆条文本中的预测关键词以及所述样本视频片段的预测标题包括:通过所述标题生成模型,对所述训练文本的语义特征进行全连接和归一化,输出所述样本拆条文本中的预测关键词;
通过所述标题生成模型,基于所述训练文本的语义特征进行多轮迭代解码,输出所述样本视频片段的预测标题。6.根据权利要求5所述的方法,所述通过所述标题生成模型,基于所述训练文本的语义特征进行多轮迭代解码,输出所述样本视频片段的预测标题包括:在第一轮迭代过程中,通过所述标题生成模型,基于所述训练文本的语义特征和开始字符进行迭代,输出所述样本视频片段的预测标题中的第一个字符;在其他轮迭代过程中,通过所述标题生成模型,基于所述训练文本的语义特征和上轮迭代输出的字符,输出本轮迭代对应的字符。7.根据权利要求1所述的方法,所述基于所述预测关键词与所述标注关键词之间的第一差异信息,以及所述预测标题与所述样本视频片段的标注标题之间的第二差异信息,对所述标题生成模型进行训练包括:基于所述第一差异信息和所述第二差异信息构建联合损失函数;基于所述联合损失函数对所述标题生成模型进行训练。8.根据权利要求1所述的方法,所述样本拆条文本的标注关键词的获取方法包括:对所述样本视频片段的样本拆条文本进行关键词识别,得到所述样本拆条文本的标注关键词。9.一种标题生成方法,包括:获取目标视频片段的拆条文本,所述目标视频片段是对视频进行拆条后得到的;将所述拆条文本输入标题生成模型,通...

【专利技术属性】
技术研发人员:王宁徐文强陈德
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1