视频识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:29937915 阅读:25 留言:0更新日期:2021-09-04 19:17
本公开公开了一种视频识别方法、装置、电子设备及存储介质,属于视频识别技术领域。该视频识别方法包括:向视频识别模型的至少一个模态特征提取模型输入待识别视频;各模态特征提取模型提取待识别视频的模态特征,获得与模态特征提取模型对应的模态的第一模态特征,向神经网络输入各模态特征提取模型提取的第一模态特征;神经网络获取模态特征提取模型提取的第一模态特征的重要度,并根据至少一个模态特征提取模型提取的第一模态特征和每一第一模态特征的重要度,生成第二模态特征;神经网络将第二模态特征输入至分类网络,分类网络基于第二模态特征确定待识别视频是否为异常视频。频。频。

【技术实现步骤摘要】
视频识别方法、装置、电子设备及存储介质


[0001]本公开涉及视频识别
,具体涉及一种视频识别方法、装置、电子设备及存储介质。

技术介绍

[0002]随着互联网和无线通信技术的飞速发展,人们之间进行信息共享的方式越来越丰富。视频分享作为一种新兴的信息分享功能,可以实现用户通过拍摄的视频(如时长为一分钟以内的短视频等)向他人展现自己生活的点点滴滴,提升用户分享信息的便捷性及趣味性。
[0003]目前,伴随着视频分享的迅速推广,人们拍摄并传播的视频也越来越多,需要对每一视频的视频类型进行分类,以便于对视频的管理,例如,将存在违法、违背社会公德或者低俗等内容的视频归类为异常视频,以便防止异常视频的传播。但是,目前对于视频所属的视频类型的识别通常是由人工进行标注,工作强度大,从而导致视频识别的效率低下。可见,目前的视频识别过程中存在效率低的问题。

技术实现思路

[0004]本公开实施例的目的是提供一种视频识别方法、装置、电子设备及存储介质,以解决目前的视频识别过程中存在效率低的问题。
[0005]本公开的技术方案如本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种视频识别方法,其特征在于,包括:向视频识别模型的至少一个模态特征提取模型输入待识别视频,所述至少一个模态特征提取模型与至少一个模态一一对应,所述视频识别模型还包括神经网络和分类网络,所述至少一个模态特征提取模型与所述神经网络连接,所述神经网络与所述分类网络连接,所述神经网络配置多头注意力机制,所述多头注意力机制配置各所述模态特征提取模型的重要度;各所述模态特征提取模型提取所述待识别视频的模态特征,获得与所述模态特征提取模型对应模态的第一模态特征,向所述神经网络输入各所述模态特征提取模型提取的第一模态特征;所述神经网络获取所述模态特征提取模型提取的第一模态特征的重要度,并根据所述至少一个模态特征提取模型提取的第一模态特征和每一所述第一模态特征的重要度,生成第二模态特征,其中,任一模态特征提取模型的重要度为所述任一模态特征提取模型提取的第一模态特征的重要度;所述神经网络将所述第二模态特征输入至所述分类网络,所述分类网络基于所述第二模态特征确定所述待识别视频是否为异常视频。2.根据权利要求1所述的方法,其特征在于,所述向视频识别模型的至少一个模态特征提取模型输入待识别视频之前,还包括:获取训练样本集;将训练样本集中的视频样本输入至第一待训练模型,并根据所述第一待训练模型的识别结果以及输入的视频样本的标注结果,计算得到所述第一待训练模型的第一损失,其中,所述第一待训练模型包括依次连接的至少一个模态特征提取模型、神经网络和分类网络;在所述第一损失未达到预设条件的情况下,更新所述神经网络的参数、所述分类网络的参数以及为所述至少一个模态特征提取模型配置的重要度,并将更新后的模型确定为所述第一待训练模型,重新执行将训练样本集中的视频样本输入至所述第一待训练模型、以及计算所述第一损失的步骤,直至所述第一损失达到第一预设条件,得到所述视频识别模型。3.根据权利要求2所述的方法,其特征在于,所述将训练样本集中的视频样本输入至第一待训练模型之前,还包括:将所述训练样本集的视频样本输入至包括模态特征提取网络的第二待训练模型中,所述模态特征提取网络用于提取目标模态的模态特征,所述目标模态为所述至少一个模态中任一模态;根据所述第二待训练模型的识别结果以及输入的视频样本的标注结果,计算得到所述第二待训练模型的第二损失;在所述第二损失未达到预设条件的情况下,更新所述模态特征提取网络的参数,并将更新后的模型确定为所述第二待训练模型,重新执行将训练样本集中的视频样本输入至所述第二待训练模型、以及计算所述第二损失的步骤,直至所述第二损失达到第二预设条件,得到所述目标模态对应的模态特征提取模型。4.根据权利要求2所述的方法,其特征在于,所述获取训练样本集,包括:获取第一样本集和第二样本集,所述第一样本集包括标注的视频样本,所述第二样本
集包括未标注的视频样本;将所述第一样本集输入至第M

1个识别模型中,训练得到第M个识别模型,所述M为正整数;将所述第二样本集中视频样本输入至所述第M个识别模型中,所述第M个识别模型对输入的视频样本进行标注,并将标注的视频样本加入至所述第一样本集中;在所述M个识别模型不满足训练停止条件的情况下,将所述第M个识别模型作为所述第M

1个识别模型,并重新执行将所述第一样本集输入至第M

1个识别模型中、以及将所述第二样本集...

【专利技术属性】
技术研发人员:张恒
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1