视频标题生成方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:30029672 阅读:25 留言:0更新日期:2021-09-15 10:19
本申请提供了一种视频标题生成方法、装置、计算机设备及存储介质,属于计算机技术领域。该方法包括:获取视频的内容标签;响应于内容标签指示视频属于教程视频,对视频的原始标题进行识别,得到原始标题的风格标签;响应于风格标签指示原始标题不符合表述风格,基于原始标题和视频,生成符合表述风格的目标标题。本申请以人工智能的自然语言处理技术为基础,充分利用了原始标题和教程视频的视频内容,自动高效地为教程视频生成教程标题,能够更加准确地体现出教程视频所教授的核心内容,便于用户从标题中直观地发现教程兴趣点,增强了教程视频对用户的吸引力,提高了教程视频的播放率,从而提高了教程视频的传播效率。从而提高了教程视频的传播效率。从而提高了教程视频的传播效率。

【技术实现步骤摘要】
视频标题生成方法、装置、计算机设备及存储介质


[0001]本申请涉及计算机
,特别涉及一种视频标题生成方法、装置、计算机设备及存储介质。

技术介绍

[0002]视频是用户分享和获取信息的一种重要形式。用户可以录制一些教程视频,以进行技能分享,并将其上传到视频分享平台,以便于其他用户了解和掌握技能。例如,教程视频包括美食制作视频、手机保养视频等。
[0003]视频标题对于吸引用户点击和观看视频起着非常重要的引导作用。目前,视频标题一般由用户自定义,录制视频的用户可以在上传视频之前,编辑一个视频标题,将视频和视频标题同时上传到视频分享平台。
[0004]对于教程视频来说,用户自定义的视频标题大多都不能准确地体现出视频的教程关键信息,教程视频难以通过视频标题被发现,播放率较低,传播效率低下,因此,亟需一种自动生成视频标题的方法,以提高教程视频的播放率,提高传播效率。

技术实现思路

[0005]本申请实施例提供了一种视频标题生成方法、装置、计算机设备及存储介质,能够提高教程视频的播放率,提高传播效率。所述技术方案如下。
[0006]一方面,提供了一种视频标题生成方法,所述方法包括:
[0007]获取视频的内容标签,所述内容标签用于指示所述视频是否属于教程视频;
[0008]响应于所述内容标签指示所述视频属于教程视频,对所述视频的原始标题进行识别,得到所述原始标题的风格标签,所述风格标签用于指示所述原始标题是否符合教程标题的表述风格;
[0009]响应于所述风格标签指示所述原始标题不符合所述表述风格,基于所述原始标题和所述视频,生成符合所述表述风格的目标标题。
[0010]一方面,提供了一种视频标题生成装置,所述装置包括:
[0011]教程视频识别模块,用于获取视频的内容标签,所述内容标签用于指示所述视频是否属于教程视频;
[0012]标题风格识别模块,用于响应于所述内容标签指示所述视频属于教程视频,对所述视频的原始标题进行识别,得到所述原始标题的风格标签,所述风格标签用于指示所述原始标题是否符合教程标题的表述风格;
[0013]标题生成模块,用于响应于所述风格标签指示所述原始标题不符合所述表述风格,基于所述原始标题和所述视频,生成符合所述表述风格的目标标题。
[0014]在一种可选的实现方式中,所述教程视频识别模块,包括:
[0015]视频特征提取单元,用于对所述视频进行特征提取,得到所述视频在多个维度上的特征向量;
[0016]教程视频识别单元,用于基于所述视频在多个维度上的特征向量,确定所述视频的内容标签。
[0017]在另一种可选的实现方式中,所述视频特征提取单元,包括:
[0018]内容获取子单元,用于获取所述视频的多个图像帧和多个音频帧;
[0019]图像特征提取子单元,用于基于所述多个图像帧,确定所述视频的图像维度的特征向量;
[0020]音频特征提取子单元,用于基于所述多个音频帧,确定所述视频的音频维度的特征向量;
[0021]文本特征提取子单元,用于基于所述视频对应的文本信息,确定所述视频的文本维度的特征向量。
[0022]在另一种可选的实现方式中,所述图像特征提取子单元,用于:
[0023]分别对所述多个图像帧进行特征提取,得到所述多个图像帧的多个特征向量;
[0024]将所述多个图像帧的多个特征向量进行聚合,得到所述视频的图像维度的特征向量。
[0025]在另一种可选的实现方式中,所述装置还包括:
[0026]文字识别模块,用于对所述多个图像帧进行文字识别,得到字幕文本;
[0027]语音识别模块,用于对所述多个音频帧进行语音识别,得到对白文本;
[0028]文本信息确定模块,用于将所述原始标题、所述字幕文本和所述对白文本确定为所述文本信息。
[0029]在另一种可选的实现方式中,所述教程视频识别单元,用于:
[0030]将所述视频在多个维度上的特征向量进行融合,得到所述视频的多模态向量;
[0031]基于所述多模态向量,确定所述视频的内容标签。
[0032]在另一种可选的实现方式中,所述标题生成模块,包括:
[0033]教程主体词确定单元,用于响应于所述风格标签指示所述原始标题不符合所述表述风格,确定所述视频对应的教程主体词;
[0034]标题生成单元,用于基于所述教程主体词、所述视频的视频类型和所述视频的多模态向量中的至少一个以及所述原始标题,生成所述目标标题;
[0035]其中,所述教程主体词用于表示所述视频的教程主题,所述多模态向量是对所述视频在多个维度上的特征向量进行融合得到的。
[0036]在另一种可选的实现方式中,所述教程主体词确定单元,用于:
[0037]响应于所述风格标签指示所述原始标题不符合所述表述风格,从所述原始标题中确定教程主体词;
[0038]响应于所述原始标题中不存在所述教程主体词,从所述视频的字幕文本和所述视频的对白文本中确定所述教程主体词。
[0039]在另一种可选的实现方式中,所述标题生成单元,包括:
[0040]分词划分子单元,用于将所述教程主体词和所述原始标题划分为多个分词;
[0041]标题词确定子单元,用于将所述视频类型、所述多模态向量和所述多个分词输入到标题生成模型中,通过所述标题生成模型确定多个标题词,所述标题生成模型用于生成符合所述表述风格的标题;
[0042]标题生成子单元,用于由所述多个标题词组成所述目标标题。
[0043]在另一种可选的实现方式中,所述标题词确定子单元,用于:
[0044]将所述视频类型、所述多模态向量和所述多个分词输入到标题生成模型中,获取所述多个分词的注意力权重;
[0045]响应于所述多个分词中的第一分词的注意力权重大于注意力阈值,将所述第一分词确定为所述标题词;
[0046]响应于所述多个分词的注意力权重均小于或等于所述注意力阈值,将所述标题生成模型输出的词确定为所述标题词。
[0047]在另一种可选的实现方式中,所述装置还包括:
[0048]视频类型确定模块,用于基于所述视频在多个维度上的特征向量,确定所述视频的视频类型。
[0049]在另一种可选的实现方式中,所述标题风格识别模块,用于:
[0050]响应于所述内容标签指示所述视频属于教程视频,将所述原始标题输入到风格识别模型中,得到所述风格识别模型输出的所述风格标签;
[0051]其中,所述风格识别模型是以第一类标题为正样本,以第二类标题和第三类标题中的至少一类为负样本进行训练得到的;所述第一类标题符合所述表述风格,且对应的视频属于教程视频;所述第二类标题是不属于教程视频的视频的原始标题;所述第三类标题不符合所述表述风格,且对应的视频属于教程视频。
[0052]一方面,提供了一种计算机设备,所述计算本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频标题生成方法,其特征在于,所述方法包括:获取视频的内容标签,所述内容标签用于指示所述视频是否属于教程视频;响应于所述内容标签指示所述视频属于教程视频,对所述视频的原始标题进行识别,得到所述原始标题的风格标签,所述风格标签用于指示所述原始标题是否符合教程标题的表述风格;响应于所述风格标签指示所述原始标题不符合所述表述风格,基于所述原始标题和所述视频,生成符合所述表述风格的目标标题。2.根据权利要求1所述的方法,其特征在于,所述获取视频的内容标签,包括:对所述视频进行特征提取,得到所述视频在多个维度上的特征向量;基于所述视频在多个维度上的特征向量,确定所述视频的内容标签。3.根据权利要求2所述的方法,其特征在于,所述对所述视频进行特征提取,得到所述视频在多个维度上的特征向量,包括:获取所述视频的多个图像帧和多个音频帧;基于所述多个图像帧,确定所述视频的图像维度的特征向量;基于所述多个音频帧,确定所述视频的音频维度的特征向量;基于所述视频对应的文本信息,确定所述视频的文本维度的特征向量。4.根据权利要求3所述的方法,其特征在于,所述基于所述多个图像帧,确定所述视频的图像维度的特征向量,包括:分别对所述多个图像帧进行特征提取,得到所述多个图像帧的多个特征向量;将所述多个图像帧的多个特征向量进行聚合,得到所述视频的图像维度的特征向量。5.根据权利要求3所述的方法,其特征在于,所述基于所述视频对应的文本信息,确定所述视频的文本维度的特征向量之前,所述方法还包括:对所述多个图像帧进行文字识别,得到字幕文本;对所述多个音频帧进行语音识别,得到对白文本;将所述原始标题、所述字幕文本和所述对白文本确定为所述文本信息。6.根据权利要求2所述的方法,其特征在于,所述基于所述视频在多个维度上的特征向量,确定所述视频的内容标签,包括:将所述视频在多个维度上的特征向量进行融合,得到所述视频的多模态向量;基于所述多模态向量,确定所述视频的内容标签。7.根据权利要求1所述的方法,其特征在于,所述响应于所述风格标签指示所述原始标题不符合所述表述风格,基于所述原始标题和所述视频,生成符合所述表述风格的目标标题,包括:响应于所述风格标签指示所述原始标题不符合所述表述风格,确定所述视频对应的教程主体词;基于所述教程主体词、所述视频的视频类型和所述视频的多模态向量中的至少一个以及所述原始标题,生成所述目标标题;其中,所述教程主体词用于表示所述视频的教程主题,所述多模态向量是对所述视频在多个维度上的特征向量进行融合得到的。8.根据权利要求7所述的方法,其特征在于,所述响应于所述风格标签指示所述原始标
题不符合所述表述风格,确定所述视频对应的教程主体词,包括:响应于所述风格标签指示所述原始标题不符合所述表述风格,从所述原始标题中确定教程主体词;响应于所述原始标题中不存在所述教程主体词,从所述视频的字幕文本和所述视频的对白文本中确定所述教程主体词。...

【专利技术属性】
技术研发人员:陈小帅
申请(专利权)人:腾讯科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1