为视频自动打标签的方法及装置、介质和电子设备制造方法及图纸

技术编号:20866440 阅读:26 留言:0更新日期:2019-04-17 09:20
本公开是关于一种为视频自动打标签的方法及装置、介质和电子设备,属于视频处理技术领域。该方法包括:响应于获取到视频,将所述视频分解成帧;将分解成的帧按照预定规则分组;将每一组的帧串联成视频帧序列;将所述视频帧序列输入机器学习模型,由所述机器学习模型输出视频帧序列的标签;基于视频帧序列的标签,为所述视频打标签。本公开通过机器学习模型自动为视频打标签,提高了打标签的准确率和效率。

【技术实现步骤摘要】
为视频自动打标签的方法及装置、介质和电子设备
本公开涉及视频处理
,具体而言,涉及一种为视频自动打标签的方法及装置、介质和电子设备。
技术介绍
视频标签是按照视频属性进行分类而设定的标签,是对视频内容进行排序以及向用户提供个性化推荐等的重要依据。近年来,通过视频进行传播信息、表现自我等具有很高的热度。用户寻找自己感兴趣的视频及某些商家或者平台推荐视频都需要依据视频的标签。尤其,通常视频中有很大部分是没有语音和字幕信息的。按照常规通过视频语音和字幕来给视频打标签的方法并不可行。而依赖人工标定的方式会造成对这部分视频打标签的低效率、低准确度问题。因此,需要提供一种新的为视频自动打标签的方法和装置、介质和电子设备。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种为视频自动打标签的方案,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的为视频打标签的低效率、低准确率问题。根据本公开的一个方面,提供一种为视频自动打标签的方法,包括:响应于获取到视频,将所述视频分解成帧;将分解成的帧按照预定规则分组;将每一组的帧串联成视频帧序列;将所述视频帧序列输入机器学习模型,由所述机器学习模型输出视频帧序列的标签;基于视频帧序列的标签,为所述视频打标签,其中,所述机器学习模型按照如下方式训练:将视频帧序列样本集合中的各视频帧序列样本输入所述机器学习模型,所述视频帧序列样本是将各种已知标签的视频按照所述预定规则分组,并将每一组的帧串联而成的,所述机器学习模型输出视频帧序列样本所来自的视频的标签,与视频已知标签进行比较,如果不一致,则调整所述机器学习模型中的系数,使所述机器学习模型输出的标签与该视频已知标签一致。在本公开的一种示例性实施例中,将分解成的帧按照预定规则分组包括:将连续预定数目个帧作为一组。在本公开的一种示例性实施例中,将分解成的帧按照预定规则分组包括:从分解的帧中随机取预定数目个帧作为一组。在本公开的一种示例性实施例中,将分解成的帧按照预定规则分组包括:将所述视频分解成的帧等分为N组,N为正整数,视频帧序列的数目也是N,将帧号为aN+i的帧组成第i个组,其中,a和i为正整数,0≦a≦N-1,1≦i≦N。在本公开的一种示例性实施例中,所述将每一组的帧串联成视频帧序列包括:按照每一帧的帧号的先后顺序将每一组的帧串联成视频帧序列。在本公开的一种示例性实施例中,所述基于视频帧序列的标签,为所述视频打标签,包括:将得到的视频帧序列的标签中概率权重占比最大的标签作为视频最终标签。在本公开的一种示例性实施例中,所述基于视频帧序列的标签,为所述视频打标签,包括:将得到的视频帧序列的标签中数目最大的前N个标签都作为为视频打的标签。在本公开的一种示例性实施例中,将得到的视频帧序列的标签中数目最大的标签作为为视频打的标签,包括:如果所述数目最大的标签有多个,增加分解成的帧分组的数目。在本公开的一种示例性实施例中,所述增加分解成的帧分组的数目包括:如果预定规则包括将连续预定数目个帧作为一组,则增加组的数目,使至少一部分组包含的帧部分重叠。在本公开的一种示例性实施例中,将分解成的帧按照预定规则分组包括:将分解成的帧按照第一预定规则分组,并按照第二预定规则分组,第一预定规则与第二预定规则不同。根据本公开的一个方面,提供一种为视频自动打标签的装置,包括:分解模块,用于响应于获取到视频,将所述视频分解成帧;分组模块,用于将分解成的帧按照预定规则分组;叠加模块,用于将每一组的帧串联成视频帧序列;第一标定模块,用于将所述视频帧序列输入机器学习模型,由所述机器学习模型输出视频帧序列的标签;第二标定模块,用于基于视频帧序列的标签,为所述视频打标签。根据本公开的一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述任一项所述的方法。根据本公开的一个方面,提供一种电子设备,其特征在于,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任一项所述的方法。本公开一种为视频自动打标签的方案。该方案中,响应于获取到视频,将所述视频分解成帧;将分解成的帧按照预定规则分组;将每一组的帧串联成视频帧序列;将所述视频帧序列输入机器学习模型,由所述机器学习模型输出视频帧序列的标签;基于视频帧序列的标签,为所述视频打标签。本公开通过机器学习模型自动为视频打标签,提高了打标签的准确率和效率,而且为了避免一帧一帧输入机器学习模型带来机器学习模型的低效率,采取分组后串联的方式,使输入机器学习模型的帧具有规律性,输入的高效性,进一步提高打标签的准确率。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示意性示出一种为视频自动打标签的方法的流程图。图2示意性示出一种为视频自动打标签的方法的应用场景示例图。图3示意性示出一种为视频自动打标签的装置的方框图。图4示意性示出一种用于实现上述为视频自动打标签方法的电子设备示例框图。图5示意性示出一种用于实现上述为视频自动打标签方法的计算机可读存储介质。具体实施方式现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。本示例实施方式中首先提供了一种为视频自动打标签的方法。该方法的一种应用场景中,首先根据用户视频使用的需求获取一些视频,这些使用的需求可以包括商业目的的推荐、视频展示平台的分类展示等;这些视频可以爬取自公共网络,也可以来自具有拍摄功能的拍摄设备,同时这些视频可以是具有字幕或者语音的,也可以不具有字幕或者语音,本示例性实施例中对此不做特殊限定。然后利用机器学习模型为这些视频自动标定标签,视频在推荐或者分类等过程中可以按照为视频标本文档来自技高网...

【技术保护点】
1.一种为视频自动打标签的方法,其特征在于,包括:响应于获取到视频,将所述视频分解成帧;将分解成的帧按照预定规则分组;将每一组的帧串联成视频帧序列;将所述视频帧序列输入机器学习模型,由所述机器学习模型输出视频帧序列的标签;基于视频帧序列的标签,为所述视频打标签,其中,所述机器学习模型按照如下方式训练:将视频帧序列样本集合中的各视频帧序列样本输入所述机器学习模型,所述视频帧序列样本是将各种已知标签的视频按照所述预定规则分组,并将每一组的帧串联而成的,所述机器学习模型输出视频帧序列样本所来自的视频的标签,与视频已知标签进行比较,如果不一致,则调整所述机器学习模型中的系数,使所述机器学习模型输出的标签与该视频已知标签一致。

【技术特征摘要】
1.一种为视频自动打标签的方法,其特征在于,包括:响应于获取到视频,将所述视频分解成帧;将分解成的帧按照预定规则分组;将每一组的帧串联成视频帧序列;将所述视频帧序列输入机器学习模型,由所述机器学习模型输出视频帧序列的标签;基于视频帧序列的标签,为所述视频打标签,其中,所述机器学习模型按照如下方式训练:将视频帧序列样本集合中的各视频帧序列样本输入所述机器学习模型,所述视频帧序列样本是将各种已知标签的视频按照所述预定规则分组,并将每一组的帧串联而成的,所述机器学习模型输出视频帧序列样本所来自的视频的标签,与视频已知标签进行比较,如果不一致,则调整所述机器学习模型中的系数,使所述机器学习模型输出的标签与该视频已知标签一致。2.根据权利要求1所述的方法,其特征在于,所述预定规则包括:将连续预定数目个帧作为一组。3.根据权利要求1所述的方法,其特征在于,所述预定规则包括:将所述视频分解成的帧等分为N组,N为正整数,叠加帧的数目也是N,将帧号为aN+i的帧组成第i个组,其中,a和i为正整数,0≦a≦N-1,1≦i≦N。4.根据权利要求1所述的方法,其特征在于,所述将每一组的帧串联成视频帧序列包括:按照每一帧的帧号的先后顺序将每一组的帧串联成视频帧序列。5.根据权利要求1所述的方法,其特征在于,所述基于视频帧序列的标签,为所述视频打标签,包括:将得到的视频帧序列的标签中数目最大的标签作为为视频打的标签。6.根据权利要求5所述的方法,其特征在于,将得到的视频帧序列的...

【专利技术属性】
技术研发人员:陈方毅陈晓君李君懿陶建
申请(专利权)人:杭州柚子街信息科技有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1