标题生成方法、计算机设备、存储介质和计算机程序产品技术

技术编号：37764431 阅读：13 留言：0更新日期：2023-06-06 13:22

本申请涉及一种标题生成方法、计算机设备、存储介质和计算机程序产品。所述方法包括：将目标音视频输入至训练完成的语义特征提取模型，得到所述目标音视频的音视频语义特征；所述训练完成的语义特征提取模型通过视频样本和音频样本训练得到；对所述音视频语义特征进行编码处理，得到所述音视频语义特征的语义编码；将所述语义编码输入至训练完成的标题文本生成模型，得到所述目标音视频的标题文本；所述训练完成的标题文本生成模型通过样本语义编码训练得到。采用本方法能够提高视频标题生成效率。生成效率。生成效率。

全部详细技术资料下载

【技术实现步骤摘要】
标题生成方法、计算机设备、存储介质和计算机程序产品

[0001]本申请涉及计算机
，特别是涉及一种标题生成方法、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]随着短视频等多媒体内容在社交平台的飞速发展，越来越多的用户开始在社交平台上发布短视频等多媒体内容。标题作为视频内容的直接反馈文本，一个好的标题能够吸引更多用户去观看视频。
[0003]目前，视频的标题文本依赖于发布者手动填写，多数发布者需要花费大量时间在标题的构思上，因而这种手动填写标题的方式存在效率较低的问题。

技术实现思路

[0004]基于此，有必要针对上述技术问题，提供一种能够提高视频标题生成效率的标题生成方法、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面，本申请提供了一种标题生成方法。所述方法包括：
[0006]将目标音视频输入至训练完成的语义特征提取模型，得到所述目标音视频的音视频语义特征；所述训练完成的语义特征提取模型通过视频样本和音频样本训练得到；
[0007]对所述音视频语义特征进行编码处理，得到所述音视频语义特征的语义编码；
[0008]将所述语义编码输入至训练完成的标题文本生成模型，得到所述目标音视频的标题文本；所述训练完成的标题文本生成模型通过样本语义编码训练得到。
[0009]在其中一个实施例中，训练完成的语义特征提取模型通过如下方式训练得到：
[0010]将所述视频样本输入至待训练的语义特征提取模型中的视频特征提取模型...

【技术保护点】

【技术特征摘要】
1.一种标题生成方法，其特征在于，所述方法包括：将目标音视频输入至训练完成的语义特征提取模型，得到所述目标音视频的音视频语义特征；所述训练完成的语义特征提取模型通过视频样本和音频样本训练得到；对所述音视频语义特征进行编码处理，得到所述音视频语义特征的语义编码；将所述语义编码输入至训练完成的标题文本生成模型，得到所述目标音视频的标题文本；所述训练完成的标题文本生成模型通过样本语义编码训练得到。2.根据权利要求1所述的方法，其特征在于，所述训练完成的语义特征提取模型通过如下方式训练得到：将所述视频样本输入至待训练的语义特征提取模型中的视频特征提取模型，得到所述视频样本的视频语义特征；将所述音频样本输入至所述待训练的语义特征提取模型中的音频特征提取模型，得到所述音频样本的音频语义特征；根据所述视频语义特征和所述音频语义特征之间的特征相似度，得到所述待训练的语义特征提取模型的损失函数；根据所述待训练的语义特征提取模型的损失函数，对所述待训练的语义特征提取模型进行迭代训练，得到所述训练完成的语义特征提取模型。3.根据权利要求2所述的方法，其特征在于，所述将所述视频样本输入至待训练的语义特征提取模型中的视频特征提取模型，得到所述视频样本的视频语义特征，包括：将所述视频样本分别输入至所述视频特征提取模型中的图像编码器和视频编码器，得到所述视频样本的图像特征和视频特征；将所述图像特征和所述视频特征进行拼接，得到拼接后特征；将所述拼接后特征输入至所述视频特征提取模型中的特征融合网络，得到所述视频样本的视频语义特征。4.根据权利要求2所述的方法，其特征在于，所述将所述音频样本输入至所述待训练的语义特征提取模型中的音频特征提取模型，得到所述音频样本的音频语义特征，包括：将所述音频样本输入至所述待训练的语义特征提取模型中的音频特征提取模型，得到所述音频样本的初始音频特征；根据所述视频语义特征的特征维度，将所述初始音频特征输入至所述视频特征提取模型中的特征融合网络进行维度转换处理，得到所述音频语义特征。5.根据权利要求1所述的方法，其...

【专利技术属性】
技术研发人员：洪思欣，
申请(专利权)人：腾讯音乐娱乐科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人