一种视频信息识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:21309869 阅读:37 留言:0更新日期:2019-06-12 11:16
本申请是关于一种视频信息识别方法、装置、电子设备及存储介质,所述方法包括:获取待识别的目标视频;提取所述目标视频的背景音乐的目标特征,其中,所述目标特征是与所述背景音乐的音频和/或文本有关的特征;将所述目标特征输入预先训练的神经网络模型,得到所述目标视频的音乐类别信息;其中,所述神经网络模型是根据样本视频和预先标定的所述样本视频的音乐类别信息训练得到的、用于识别所述目标视频的音乐类别的模型。本申请可以更高效地识别视频的音乐类别。

A Video Information Recognition Method, Device, Electronic Equipment and Storage Media

The present application relates to a video information recognition method, device, electronic equipment and storage medium. The method includes acquiring target video to be recognized, extracting target features of background music of the target video, in which the target features are related to the audio and/or text of the background music, and inputting the target features into a pre-trained neural network model. The neural network model is a model for identifying the music category of the target video, which is trained according to the music category information of the sample video and the pre-calibrated sample video. This application can identify the music category of video more efficiently.

【技术实现步骤摘要】
一种视频信息识别方法、装置、电子设备及存储介质
本申请涉及视频处理
,尤其涉及一种视频信息识别方法、装置、电子设备及存储介质。
技术介绍
随着科技的日益进步和互联网的普及,越来越多的人通过视频来传输信息和分享生活,个性化的视频推荐显得日益重要。由于视频的背景音乐蕴含着大量信息,因此,可以基于视频的背景音乐识别视频的音乐类别;进一步可以利用视频的音乐类别进行更加精准的视频推荐。其中,视频的音乐类别是:从演奏、演唱或曲风等角度,根据预定的分类标准对视频进行分类所得的类别信息。具体的,视频的音乐类别可以包括两种类别:第一类别和第二类别。例如,将专业的演奏或演唱方式视为第一类别,而将非专业的演奏或演唱方式视为第二类别,等等。目前,基于视频的背景音乐识别视频的音乐类别的方式为:人工聆听视频的背景音乐,进而基于经验确定视频的音乐类别。虽然人工方式可以确定视频的音乐类别,但很耗时、耗力,效率非常低。
技术实现思路
为克服相关技术中存在的问题,本申请提供一种视频信息识别方法、装置、电子设备及存储介质,以更高效地识别视频的音乐类别。根据本申请实施例的第一方面,提供一种视频信息识别方法,包括:获取待识本文档来自技高网...

【技术保护点】
1.一种视频信息识别方法,其特征在于,包括:获取待识别的目标视频;提取所述目标视频的背景音乐的目标特征,其中,所述目标特征是与所述背景音乐的音频和/或文本有关的特征;将所述目标特征输入预先训练的神经网络模型,得到所述目标视频的音乐类别信息;其中,所述神经网络模型是根据样本视频和预先标定的所述样本视频的音乐类别信息训练得到的、用于识别所述目标视频的音乐类别的模型。

【技术特征摘要】
1.一种视频信息识别方法,其特征在于,包括:获取待识别的目标视频;提取所述目标视频的背景音乐的目标特征,其中,所述目标特征是与所述背景音乐的音频和/或文本有关的特征;将所述目标特征输入预先训练的神经网络模型,得到所述目标视频的音乐类别信息;其中,所述神经网络模型是根据样本视频和预先标定的所述样本视频的音乐类别信息训练得到的、用于识别所述目标视频的音乐类别的模型。2.根据权利要求1所述的视频信息识别方法,其特征在于,所述神经网络模型的训练过程,包括:获取所述样本视频以及预先标定的所述样本视频的音乐类别;提取所述样本视频的样本背景音乐的样本特征,其中,所述样本特征是与所述样本背景音乐的音频和/或文本有关的特征;利用所述样本特征和预先标定的所述样本视频的音乐类别,训练初始的神经网络模型,得到训练完成的神经网络模型。3.根据权利要求1或2所述的视频信息识别方法,其特征在于,所述音乐类别信息包括:第一类别和第二类别;所述将所述目标特征输入预先训练的神经网络模型,得到所述目标视频的音乐类别信息,包括:将所述目标特征输入预先训练的神经网络模型,得到所述目标视频对应的第一概率值和第二概率值;其中,所述第一概率值为:所述目标视频的音乐类别为所述第一类别的概率,所述第二概率值为:所述目标视频的音乐类别为所述第二类别的概率;若所述第一概率值大于所述第二概率值,判定所述目标视频的音乐类别为所述第一类别;若所述第一概率值小于所述第二概率值,判定所述目标视频的音乐类别为所述第二类别。4.根据权利要求1或2所述的视频信息识别方法,其特征在于,所述目...

【专利技术属性】
技术研发人员:刘京鑫常超陈祯扬肖战勇
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1