视频分类方法、装置、电子设备及存储介质制造方法及图纸

技术编号:35658594 阅读:10 留言:0更新日期:2022-11-19 16:56
本申请公开了一种视频分类方法、装置、电子设备及存储介质,属于人工智能技术领域。该方法包括:获取目标视频的视频特征信息;目标视频包括图像特征信息和文本特征信息;将视频特征信息输入至视频分类模型,对目标视频进行第一分类处理,得到目标视频对应的M个第一分类类别,并对图像特征信息和文本特征信息进行第二分类处理,得到目标视频对应的N个第二分类类别,M、N为正整数;基于M个第一分类类别,校准N个第二分类类别,并通过校准后的N个第二分类类别,确定目标视频对应的目标分类类别。确定目标视频对应的目标分类类别。确定目标视频对应的目标分类类别。

【技术实现步骤摘要】
视频分类方法、装置、电子设备及存储介质


[0001]本申请属于人工智能
,具体涉及一种视频分类方法、装置、电子设备及存储介质。

技术介绍

[0002]目前,电子设备可以对视频进行标签分类,从而使得用户可以快速查找到需求的视频。相关技术中,电子设备可以通过神经网络将视频的网络特征分布输出为标签,从而电子设备可以根据该标签确定视频类别。
[0003]然而,当神经网络输出的标签较多(例如十万)时,神经网络通过标签识别视频的类别的计算量也会增多,导致神经网络的收敛速度降低,如此,电子设备的视频分类效率较差。

技术实现思路

[0004]本申请实施例的目的是提供一种视频分类方法、装置、电子设备及存储介质,能够解决电子设备的视频分类效率较差的问题。
[0005]第一方面,本申请实施例提供了一种视频分类方法,该视频分类方法包括:获取目标视频的视频特征信息;目标视频包括图像特征信息和文本特征信息;将视频特征信息输入至视频分类模型,对目标视频进行第一分类处理,得到目标视频对应的M个第一分类类别,并对多个视频特征中的每个视频特征进行第二分类处理,得到目标视频对应的N个第二分类类别,M、N为正整数;基于M个第一分类类别,校准N个第二分类类别,并通过校准后的N个第二分类类别,确定目标视频对应的目标分类类别。
[0006]第二方面,本申请实施例提供了一种视频分类装置,该视频分类装置包括:获取模块、处理模块、校准模块和确定模块。获取模块,用于获取目标视频的视频特征信息;该目标视频包括图像特征信息和文本特征信息。处理模块,用于将视频特征信息输入至视频分类模型,对目标视频进行第一分类处理,得到目标视频对应的M个第一分类类别,并对多个视频特征中的每个视频特征进行第二分类处理,得到目标视频对应的N个第二分类类别,M、N为正整数。校准模块,用于基于M个第一分类类别,校准N个第二分类类别。确定模块,用于通过校准后的N个第二分类类别,确定目标视频对应的目标分类类别。
[0007]第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
[0008]第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
[0009]第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
[0010]第六方面,本申请实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如第一方面所述的方法。
[0011]在本申请实施例中,电子设备可以对目标视频进行第一分类处理,以得到目标视频对应的M个第一分类类别,并对目标视频的图像特征信息和文本特征信息进行第二分类处理,得到目标视频对应的N个第二分类类别,从而电子设备可以根据M个第一分类类别校准第二分类类别,并通过校准后的第二分类类别,确定目标视频对应的目标分类类别。本方案中,电子设备可以通过多个分支对目标视频的特征信息进行处理,而且通过第一分支指导第二分支的方式,可以提高目标视频所属分类的准确性,进而当电子设备输出的分类类别达到千万级别时,由于电子设备可以是通过不同分支之间的指导,确定目标视频所属的分类,进而电子设备可以通过不同细粒度之间的标签快速识别出目标视频对应的分类类别,如此,提升了电子设备识别视频分类的效率和准确性。
附图说明
[0012]图1是本申请实施例提供的一种视频分类方法的流程图;
[0013]图2是本申请实施例提供的一种视频分类方法的界面的实例示意图;
[0014]图3是本申请实施例提供的一种视频分类装置的结构示意图;
[0015]图4是本申请实施例提供的一种电子设备的硬件结构示意图之一;
[0016]图5是本申请实施例提供的一种电子设备的硬件结构示意图之二。
具体实施方式
[0017]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0018]本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
[0019]下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的视频分类方法进行详细地说明。
[0020]目前,随着通信技术的发展,电子设备中的功能也日渐增多,例如电子设备可以通过神经网络对视频进行分类,以使得用户可以根据分类快速查找到自身需求的视频,通常,电子设备可以通过神经网络中的一个全连接层将视频的网络特征分布输出为标签,从而根据该标签确定视频属于的分类,然而,当神经网络输出的标签较多(例如十万)时,单个全连接层无法完整的刻画特征到类别之间的映射,同时标签之间存在粗、细粒度之间的区别,电子设备需要通过神经网络先进行类别之间的粗粒度判别,然后再进行类别之间的细粒度判别。由于单个全连接层需要处理较多的数据量,导致神经网络的精度和神经网络的收敛速
度较差,如此,电子设备的视频分类效率较差。
[0021]本申请实施例中,电子设备可以对目标视频进行第一分类处理,以得到目标视频对应的M个第一分类类别,并对目标视频的图像特征信息和文本特征信息进行第二分类处理,得到目标视频对应的N个第二分类类别,从而电子设备可以根据M个第一分类类别校准第二分类类别,并通过校准后的第二分类类别,确定目标视频对应的目标分类类别。本方案中,电子设备可以通过多个分支对目标视频的特征信息进行处理,而且通过第一分支指导第二分支的方式,可以提高目标视频所属分类的准确性,进而当电子设备输出的分类类别达到千万级别时,由于电子设备可以是通过不同分支之间的指导,确定目标视频所属的分类,进而电子设备可以通过不同细粒度之间的标签快速识别出目标视频对应的分类类别,如此,提升了电子设备识别视频分类的效率和准确性。
[0022]本申请实施例提供的视频分类的执行主体可以为视频分类装置,该视频分类装置可以为电子设备,或电子设备中的功能模块。以下以电子设备为例,对本申请实施例提供的技术方案进行说明。
[0023]本申请实施例提供一种视频分类方法,图1示出了本申请实施例提供的一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频分类方法,其特征在于,所述方法包括:获取目标视频的视频特征信息;所述目标视频包括图像特征信息和文本特征信息;将所述视频特征信息输入至视频分类模型,对所述目标视频进行第一分类处理,得到所述目标视频对应的M个第一分类类别,并对所述图像特征信息和所述文本特征信息进行第二分类处理,得到所述目标视频对应的N个第二分类类别,M、N为正整数;基于所述M个第一分类类别,校准所述N个第二分类类别,并通过所述校准后的N个第二分类类别,确定所述目标视频对应的目标分类类别。2.根据权利要求1所述的方法,其特征在于,所述基于所述M个第一分类类别,校准所述N个第二分类类别,包括:获取第一类别信息,所述第一类别信息用于表征所述目标视频属于所述M个第一分类类别中的任一第一分类类别的概率;根据所述第一类别信息、所述M个第一分类类别和所述N个第二分类类别,校准所述N个第二分类类别。3.根据权利要求2所述的方法,其特征在于,所述获取第一类别信息,包括:对所述M个第一分类类别与预设类别进行交叉熵计算,得到M个第一损失值,每个第一损失值用于指示M个第一分类类别中的每个第一分类类别与预设类别之间的差异程度;对所述M个第一损失值进行采样处理,得到所述第一类别信息。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述通过所述校准后的N个第二分类类别,确定所述目标视频对应的目标分类类别之后,所述方法还包括:对所述校准后的N个第二分类类别与预设类别进行交叉熵计算,得到N个第二损失值,每个第二损失值用于表征所述校准后的N个第二分类类别中的每个第二分类类别与预设类别之间的差异程度;根据所述M个第一损失值和所述N个第二损失值,更新所述视频分类模型。5.根据权利要求1所述的方法,其特征在于,所述通过所述校准后的N个第二分类类别,确定所述目标视频对应的目标分类类别,包括:对所述校准后的N个第二分类类别进行采样处理,获取N个第二分类信息,每个第二分类信息用于表征所述目标视频属于校准后的N个第二分类类别的任一第二分类类别的概率;根据所述N个第二分类信息,确定所述目标视频对应的目标分类类别。6.根据权利要求1所述的方法,其特征在于,获取目标视频的视频特征信息,包括:提取所述目标视频的L视频帧对应的图像特征信息,以及所述目标视频对应的文本特征信息,L为大于1的整数;将所述图像特征信息和所述文本特征信息进行特征融合,得到所述视频特征信息。7.一种视频分类装置,其特征在于,所述视频分类装置包括:获取模块、处理模块、校准模块和确定模块;所述获取模块,用于获取目标视频的视频特征信息;所述目标视频包括图像特征信息和文本特征信息;所述处理...

【专利技术属性】
技术研发人员:肖达
申请(专利权)人:维沃移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1