用于生成信息的方法和装置制造方法及图纸

技术编号:20546538 阅读:46 留言:0更新日期:2019-03-09 19:27
本申请实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:获取目标视频;提取所述目标视频的视频特征向量,以及,提取所述目标视频的配乐的音频特征向量;将所述视频特征向量和所述音频特征向量进行融合,生成融合特征向量;将所述融合特征向量输入至预先训练的视频类别检测模型,得到目标视频的类别检测结果。该实施方式提高了视频类别检测的准确性。

Methods and devices for generating information

The embodiment of this application discloses methods and devices for generating information. One specific embodiment of the method includes: acquiring the target video; extracting the video feature vectors of the target video, and extracting the audio feature vectors of the music of the target video; fusing the video feature vectors and the audio feature vectors to generate the fusion feature vectors; and inputting the fusion feature vectors into the pre-trained video category detection model. The classification detection results of the target video are obtained. The implementation method improves the accuracy of video category detection.

【技术实现步骤摘要】
用于生成信息的方法和装置
本申请实施例涉及计算机
,具体涉及用于生成信息的方法和装置。
技术介绍
随着计算机技术的发展,视频类应用应运而生。用户可以利用视频类应用上传、发布视频。为保证视频质量以及便于向其他用户进行视频推送,通常需要确定用户上传的视频的类别。相关的方式,通常是利用视频中的帧进行模型训练,以使训练后的模型能够检测图像类别。而后,利用训练后的模型对待检测视频中的帧进行分类,基于帧的类别检测结果,确定视频类别。
技术实现思路
本申请实施例提出了用于生成信息的方法和装置。第一方面,本申请实施例提供了一种用于生成信息的方法,该方法包括:获取目标视频;提取目标视频中的帧的特征,生成视频特征向量,以及,提取目标视频的配乐的特征,生成音频特征向量;将视频特征向量和音频特征向量进行融合,生成融合特征向量;将融合特征向量输入至预先训练的视频类别检测模型,得到目标视频的类别检测结果,其中,视频类别检测模型用于表征视频的融合特征向量与视频类别的对应关系。在一些实施例中,将视频特征向量和音频特征向量进行融合,生成融合特征向量,包括:分别将视频特征向量和音频特征向量升维至目标维数;确定升维后的本文档来自技高网...

【技术保护点】
1.一种用于生成信息的方法,包括:获取目标视频;提取所述目标视频中的帧的特征,生成视频特征向量,以及,提取所述目标视频的配乐的特征,生成音频特征向量;将所述视频特征向量和所述音频特征向量进行融合,生成融合特征向量;将所述融合特征向量输入至预先训练的视频类别检测模型,得到目标视频的类别检测结果,其中,所述视频类别检测模型用于表征视频的融合特征向量与视频类别的对应关系。

【技术特征摘要】
1.一种用于生成信息的方法,包括:获取目标视频;提取所述目标视频中的帧的特征,生成视频特征向量,以及,提取所述目标视频的配乐的特征,生成音频特征向量;将所述视频特征向量和所述音频特征向量进行融合,生成融合特征向量;将所述融合特征向量输入至预先训练的视频类别检测模型,得到目标视频的类别检测结果,其中,所述视频类别检测模型用于表征视频的融合特征向量与视频类别的对应关系。2.根据权利要求1所述的用于生成信息的方法,其中,所述将所述视频特征向量和所述音频特征向量进行融合,生成融合特征向量,包括:分别将所述视频特征向量和所述音频特征向量升维至目标维数;确定升维后的视频特征向量与升维后的音频特征向量的向量积;将所述向量积作为音视频特征向量,将所述音视频特征向量中的特征值按照预设特征值数量切分为多组,确定各组的特征值之和;将各组的特征值之和进行汇总,生成融合特征向量。3.根据权利要求1所述的用于生成信息的方法,其中,所述将所述视频特征向量和所述音频特征向量进行融合,生成融合特征向量,包括:将所述视频特征向量和所述音频特征向量进行拼接,生成融合特征向量。4.根据权利要求1所述的用于生成信息的方法,其中,所述提取所述目标视频中的帧的特征,以生成视频特征向量,包括:提取所述目标视频中的至少一帧;将所述至少一帧输入至预先训练的视频特征提取模型,得到所述目标视频的视频特征向量,其中,所述视频特征提取模型用于提取视频特征。5.根据权利要求1所述的用于生成信息的方法,其中,所述视频类别检测模型通过如下步骤训练得到:提取样本集,其中,所述样本集中的样本包括样本视频和用于指示样本视频的类别的标注信息;对于样本集中的样本,提取该样本中的样本视频的样本视频特征向量,以及,提取该样本中的样本视频的配乐的样本音频特征向量,将所述样本视频特征向量和所述样本音频特征向量进行融合,生成样本融合特征向量;利用机器学习方法,将样本的样本融合特征向量作为输入,将所输入的样本融合特征向量对应的标注信息作为输出,训练得到视频类别检测模型。6.一种用于生成信息的装置,包括:获取单元,被配置成获取目标视频;提取单元,被配置成提取所述目标视频中的帧的特征,生成视频特征向量,以及,提取所述目标视频的配乐的特...

【专利技术属性】
技术研发人员:袁泽寰王长虎
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1