标题生成方法、计算机设备、存储介质和计算机程序产品技术

技术编号:37764431 阅读:13 留言:0更新日期:2023-06-06 13:22
本申请涉及一种标题生成方法、计算机设备、存储介质和计算机程序产品。所述方法包括:将目标音视频输入至训练完成的语义特征提取模型,得到所述目标音视频的音视频语义特征;所述训练完成的语义特征提取模型通过视频样本和音频样本训练得到;对所述音视频语义特征进行编码处理,得到所述音视频语义特征的语义编码;将所述语义编码输入至训练完成的标题文本生成模型,得到所述目标音视频的标题文本;所述训练完成的标题文本生成模型通过样本语义编码训练得到。采用本方法能够提高视频标题生成效率。生成效率。生成效率。

【技术实现步骤摘要】
标题生成方法、计算机设备、存储介质和计算机程序产品


[0001]本申请涉及计算机
,特别是涉及一种标题生成方法、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]随着短视频等多媒体内容在社交平台的飞速发展,越来越多的用户开始在社交平台上发布短视频等多媒体内容。标题作为视频内容的直接反馈文本,一个好的标题能够吸引更多用户去观看视频。
[0003]目前,视频的标题文本依赖于发布者手动填写,多数发布者需要花费大量时间在标题的构思上,因而这种手动填写标题的方式存在效率较低的问题。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提高视频标题生成效率的标题生成方法、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面,本申请提供了一种标题生成方法。所述方法包括:
[0006]将目标音视频输入至训练完成的语义特征提取模型,得到所述目标音视频的音视频语义特征;所述训练完成的语义特征提取模型通过视频样本和音频样本训练得到;
[0007]对所述音视频语义特征进行编码处理,得到所述音视频语义特征的语义编码;
[0008]将所述语义编码输入至训练完成的标题文本生成模型,得到所述目标音视频的标题文本;所述训练完成的标题文本生成模型通过样本语义编码训练得到。
[0009]在其中一个实施例中,训练完成的语义特征提取模型通过如下方式训练得到:
[0010]将所述视频样本输入至待训练的语义特征提取模型中的视频特征提取模型,得到所述视频样本的视频语义特征;
[0011]将所述音频样本输入至所述待训练的语义特征提取模型中的音频特征提取模型,得到所述音频样本的音频语义特征;
[0012]根据所述视频语义特征和所述音频语义特征之间的特征相似度,得到所述待训练的语义特征提取模型的损失函数;
[0013]根据所述待训练的语义特征提取模型的损失函数,对所述待训练的语义特征提取模型进行迭代训练,得到所述训练完成的语义特征提取模型。
[0014]在其中一个实施例中,将所述视频样本输入至待训练的语义特征提取模型中的视频特征提取模型,得到所述视频样本的视频语义特征,包括:
[0015]将所述视频样本分别输入至所述视频特征提取模型中的图像编码器和视频编码器,得到所述视频样本的图像特征和视频特征;
[0016]将所述图像特征和所述视频特征进行拼接,得到拼接后特征;
[0017]将所述拼接后特征输入至所述视频特征提取模型中的特征融合网络,得到所述视频样本的视频语义特征。
[0018]在其中一个实施例中,将所述音频样本输入至所述待训练的语义特征提取模型中的音频特征提取模型,得到所述音频样本的音频语义特征,包括:
[0019]将所述音频样本输入至所述待训练的语义特征提取模型中的音频特征提取模型,得到所述音频样本的初始音频特征;
[0020]根据所述视频语义特征的特征维度,将所述初始音频特征输入至所述视频特征提取模型中的特征融合网络进行维度转换处理,得到所述音频语义特征。
[0021]在其中一个实施例中,训练完成的标题文本生成模型通过如下方式得到:
[0022]将所述样本语义编码,多次输入至待训练的标题文本生成模型中,得到所述样本语义编码的多个预测单词;
[0023]根据所述样本语义编码和所述样本语义编码的多个预测单词,得到所述待训练的标题文本生成模型的损失函数;
[0024]根据所述待训练的标题文本生成模型的损失函数,对所述待训练的标题文本生成模型进行迭代训练,得到所述训练完成的标题文本生成模型。
[0025]在其中一个实施例中,根据所述样本语义编码和所述样本语义编码的多个预测单词,得到所述待训练的标题文本生成模型的损失函数,包括:
[0026]对当前预测单词与所述当前预测单词的上一个预测单词进行条件概率处理,得到所述当前预测单词与所述上一个预测单词之间的第一条件概率;所述当前预测单词为所述样本语义编码的多个预测单词中除第一个预测单词以外的任意一个预测单词;
[0027]对所述样本语义编码和所述当前预测单词进行条件概率处理,得到所述样本语义编码与所述当前预测单词之间的第二条件概率;
[0028]根据基于所述第一条件概率和所述第二条件概率处理得到的概率联合分布,得到所述待训练的标题文本生成模型的损失函数。
[0029]在其中一个实施例中,对所述音视频语义特征进行编码处理,得到所述音视频语义特征的语义编码,包括:
[0030]获取所述目标音视频的关键词;
[0031]对所述关键词进行特征提取处理,得到所述关键词的关键词特征;
[0032]对所述关键词特征和所述音视频语义特征进行拼接处理,得到目标语义拼接特征;
[0033]对所述目标语义拼接特征进行编码处理,得到语义编码。
[0034]第二方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0035]将目标音视频输入至训练完成的语义特征提取模型,得到所述目标音视频的音视频语义特征;所述训练完成的语义特征提取模型通过视频样本和音频样本训练得到;
[0036]对所述音视频语义特征进行编码处理,得到所述音视频语义特征的语义编码;
[0037]将所述语义编码输入至训练完成的标题文本生成模型,得到所述目标音视频的标题文本;所述训练完成的标题文本生成模型通过样本语义编码训练得到。
[0038]第三方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0039]将目标音视频输入至训练完成的语义特征提取模型,得到所述目标音视频的音视
频语义特征;所述训练完成的语义特征提取模型通过视频样本和音频样本训练得到;
[0040]对所述音视频语义特征进行编码处理,得到所述音视频语义特征的语义编码;
[0041]将所述语义编码输入至训练完成的标题文本生成模型,得到所述目标音视频的标题文本;所述训练完成的标题文本生成模型通过样本语义编码训练得到。
[0042]第四方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
[0043]将目标音视频输入至训练完成的语义特征提取模型,得到所述目标音视频的音视频语义特征;所述训练完成的语义特征提取模型通过视频样本和音频样本训练得到;
[0044]对所述音视频语义特征进行编码处理,得到所述音视频语义特征的语义编码;
[0045]将所述语义编码输入至训练完成的标题文本生成模型,得到所述目标音视频的标题文本;所述训练完成的标题文本生成模型通过样本语义编码训练得到。
[0046]上述标题生成方法、计算机设备、存储本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种标题生成方法,其特征在于,所述方法包括:将目标音视频输入至训练完成的语义特征提取模型,得到所述目标音视频的音视频语义特征;所述训练完成的语义特征提取模型通过视频样本和音频样本训练得到;对所述音视频语义特征进行编码处理,得到所述音视频语义特征的语义编码;将所述语义编码输入至训练完成的标题文本生成模型,得到所述目标音视频的标题文本;所述训练完成的标题文本生成模型通过样本语义编码训练得到。2.根据权利要求1所述的方法,其特征在于,所述训练完成的语义特征提取模型通过如下方式训练得到:将所述视频样本输入至待训练的语义特征提取模型中的视频特征提取模型,得到所述视频样本的视频语义特征;将所述音频样本输入至所述待训练的语义特征提取模型中的音频特征提取模型,得到所述音频样本的音频语义特征;根据所述视频语义特征和所述音频语义特征之间的特征相似度,得到所述待训练的语义特征提取模型的损失函数;根据所述待训练的语义特征提取模型的损失函数,对所述待训练的语义特征提取模型进行迭代训练,得到所述训练完成的语义特征提取模型。3.根据权利要求2所述的方法,其特征在于,所述将所述视频样本输入至待训练的语义特征提取模型中的视频特征提取模型,得到所述视频样本的视频语义特征,包括:将所述视频样本分别输入至所述视频特征提取模型中的图像编码器和视频编码器,得到所述视频样本的图像特征和视频特征;将所述图像特征和所述视频特征进行拼接,得到拼接后特征;将所述拼接后特征输入至所述视频特征提取模型中的特征融合网络,得到所述视频样本的视频语义特征。4.根据权利要求2所述的方法,其特征在于,所述将所述音频样本输入至所述待训练的语义特征提取模型中的音频特征提取模型,得到所述音频样本的音频语义特征,包括:将所述音频样本输入至所述待训练的语义特征提取模型中的音频特征提取模型,得到所述音频样本的初始音频特征;根据所述视频语义特征的特征维度,将所述初始音频特征输入至所述视频特征提取模型中的特征融合网络进行维度转换处理,得到所述音频语义特征。5.根据权利要求1所述的方法,其...

【专利技术属性】
技术研发人员:洪思欣
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1