视频筛选方法、视频筛选装置及终端设备制造方法及图纸

技术编号:27030731 阅读:16 留言:0更新日期:2021-01-12 11:13
本申请提供的一种视频筛选方法,包括:基于视频训练集,对第一分类模型进行训练,获得训练完成的第一分类模型;针对多个所述基础视频和多个所述拓展视频中的每一个视频,将所述视频输入所述训练完成的第一分类模型,获得所述训练完成的第一分类模型针对所述视频得到的特征向量;根据所述视频训练集中的各个视频所分别对应的特征向量,从所述视频训练集中,筛选出目标视频。通过上述方法,可以提升视频数据集的质量。

【技术实现步骤摘要】
视频筛选方法、视频筛选装置及终端设备
本申请属于视频处理
,尤其涉及视频筛选方法、视频筛选装置、终端设备及计算机可读存储介质。
技术介绍
目前,各类机器学习模型大量应用于对图像、视频的分类、检测等场景中。在实际应用场景中,对于给定任务(如视频分类),开发者需要收集足够数量的训练数据集,并通过训练数据集对指定的机器学习模型(如视频分类模型)进行训练,从而使得该指定的机器学习模型对于给定任务获得较好的性能表现。可见,训练数据集的质量是决定机器学习模型实际表现的关键因素之一。而在视频分类等应用场景中,相较于图像数据集,视频数据集因为数据量大、标注成本高而有着更高的收集难度,导致目前的视频数据集的质量往往较差,从而在通过视频训练集进行模型训练等具体应用中,限制了训练得到的视频分类模型的性能。
技术实现思路
本申请实施例提供了视频筛选方法、视频筛选装置、终端设备及计算机可读存储介质,可以提升视频数据集的质量。第一方面,本申请实施例提供了一种视频筛选方法,包括:基于视频训练集,对第一分类模型进行训练,获得训练完成的第一分类模型,其中,所述视频训练集中包括多个基础视频,以及各个所述基础视频所分别对应的拓展视频,每一个所述拓展视频根据对应的基础视频而得到;针对多个所述基础视频和多个所述拓展视频中的每一个视频,将所述视频输入所述训练完成的第一分类模型,获得所述训练完成的第一分类模型针对所述视频得到的特征向量;根据所述视频训练集中的各个视频所分别对应的特征向量,从所述视频训练集中,筛选出目标视频。第二方面,本申请实施例提供了一种视频筛选装置,包括:第一训练模块,用于基于视频训练集,对第一分类模型进行训练,获得训练完成的第一分类模型,其中,所述视频训练集中包括多个基础视频,以及各个所述基础视频所分别对应的拓展视频,每一个所述拓展视频根据对应的基础视频而得到;特征提取模块,用于针对多个所述基础视频和多个所述拓展视频中的每一个视频,将所述视频输入所述训练完成的第一分类模型,获得所述训练完成的第一分类模型针对所述视频得到的特征向量;筛选模块,用于根据所述视频训练集中的各个视频所分别对应的特征向量,从所述视频训练集中,筛选出目标视频。第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器、显示器以及存储在上述存储器中并可在上述处理器上运行的计算机程序,其特征在于,上述处理器执行上述计算机程序时实现如第一方面上述的视频筛选方法。第四方面,本申请实施例提供了一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现如第一方面上述的视频筛选方法。第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中上述的视频筛选方法。本申请实施例与现有技术相比存在的有益效果是:本申请实施例中,可以基于视频训练集,对第一分类模型进行训练,获得训练完成的第一分类模型,其中,所述视频训练集中包括多个基础视频,以及各个所述基础视频所分别对应的拓展视频。由于每一个所述拓展视频根据对应的基础视频而得到,即,每一个扩展视频与其对应的基础视频是具有一定的相似性的,因此,根据多个基础视频和各个所述基础视频所分别对应的拓展视频训练所述第一分类模型,可以使得训练完成的第一分类模型更好地识别出相似的视频,并能够对相似的视频提取出相似的特征向量,从而在后续处理过程中,保证通过训练完成的第一分类模型对输入的视频提取特征向量的准确性;然后,针对多个所述基础视频和多个所述拓展视频中的每一个视频,将所述视频输入所述训练完成的第一分类模型,获得所述训练完成的第一分类模型针对所述视频得到的特征向量;此时,可以通过训练完成的第一分类模型分别提取各个视频的特征向量,以根据所述视频训练集中的各个视频所分别对应的特征向量,从所述视频训练集中,筛选出目标视频,从而可以根据需求,基于所述特征向量对所述视频训练集中的各个视频进行数据清洗,获得符合期望的目标视频。此时,由于所述目标视频为基于所述特征向量对所述视频训练集中的各个视频进行数据清洗后得到,因此,所得到的所述目标视频更符合期望,从而获得质量更高的视频数据集。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请一实施例提供的一种视频筛选方法的流程示意图;图2是本申请一实施例提供的步骤S101的一种流程示意图;图3是本申请一实施例提供的对所述第一分类模型和所述第三分类模型进行训练的一种示意图;图4是本申请一实施例提供的一种视频筛选装置的结构示意图;图5是本申请一实施例提供的终端设备的结构示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。本申请实施例提供的视频筛选方法可以应用于服务器、台式电脑、手机、平板电脑、可穿戴设备、车载设备、增强现实(augmentedreality,AR)/虚拟现实(virtualreality,VR)设备、笔记本电脑、超级移动个人计算机(ul本文档来自技高网...

【技术保护点】
1.一种视频筛选方法,其特征在于,包括:/n基于视频训练集,对第一分类模型进行训练,获得训练完成的第一分类模型,其中,所述视频训练集中包括多个基础视频,以及各个所述基础视频所分别对应的拓展视频,每一个所述拓展视频根据对应的基础视频而得到;/n针对多个所述基础视频和多个所述拓展视频中的每一个视频,将所述视频输入所述训练完成的第一分类模型,获得所述训练完成的第一分类模型针对所述视频得到的特征向量;/n根据所述视频训练集中的各个视频所分别对应的特征向量,从所述视频训练集中,筛选出目标视频。/n

【技术特征摘要】
1.一种视频筛选方法,其特征在于,包括:
基于视频训练集,对第一分类模型进行训练,获得训练完成的第一分类模型,其中,所述视频训练集中包括多个基础视频,以及各个所述基础视频所分别对应的拓展视频,每一个所述拓展视频根据对应的基础视频而得到;
针对多个所述基础视频和多个所述拓展视频中的每一个视频,将所述视频输入所述训练完成的第一分类模型,获得所述训练完成的第一分类模型针对所述视频得到的特征向量;
根据所述视频训练集中的各个视频所分别对应的特征向量,从所述视频训练集中,筛选出目标视频。


2.如权利要求1所述的视频筛选方法,其特征在于,在基于视频训练集,对第一分类模型进行训练之前,包括:
针对每一个基础视频,以预设采样率对所述基础视频进行采样,获得所述基础视频对应的部分或全部的拓展视频,其中,若采样获得的拓展视频的数量为两个以上,则,采样获得的各个拓展视频在所述基础视频中所分别对应的起始采样帧不同。


3.如权利要求1所述的视频筛选方法,其特征在于,在基于视频训练集,对第一分类模型进行训练之前,包括:
针对每一个基础视频,对所述基础视频的各个视频帧中的指定图像区域进行图像提取,获得所述基础视频对应的部分或全部的拓展视频,其中,若图像提取获得的拓展视频的个数为两个以上,则,图像提取获得的各个拓展视频在所述基础视频中所分别对应的指定图像区域不同。


4.如权利要求1所述的视频筛选方法,其特征在于,在基于视频训练集,对第一分类模型进行训练之前,包括:
针对每一个基础视频,向所述基础视频中的每一视频帧添加指定噪声,获得所述基础视频对应的部分或全部的拓展视频,其中,若添加指定噪声获得的拓展视频的数量为两个以上,则,添加指定噪声获得的各个拓展视频所分别对应的指定噪声不同。


5.如权利要求1所述的视频筛选方法,其特征在于,所述基于视频训练集,对第一分类模型进行训练,获得训练完成的第一分类模型,包括:
在每一次迭代训练中,从所述视频训练集中随机获取第一视频和第二视频;
将所述第一视频输入所述第一分类模型,将所述第二视频输入第三分类模型,并获取所述第一分类模型针对所述第一视频得到的第一训练结果以及获取所述第三分类模型针对所述第二视频得到的第二训练结果,其中,所述第三分类模型的结构与所述第一分类模型的结构相同;
基于所述第一训练结果和所述第二训练结果,根据预设损失函数得到当前损失值,并判断所述当前损失值是否符合预设条件;
若所述当前损失值符合预设条件,则将所述第一分类模型作为训练完成的第一分类模型;
若所述当前损失值不符合预设条件,则根据所述第一训练结果和所述第二训练结果对所述第一分类模型进行更新,并根据更新后的所述第一分类模型,执行下一次迭代训练。


6.如权利要求5所述的视频筛选方法,其特征在于,所述预设损失函数包括关于所述第一分类模型的第一分类损失函数、关于所述第三分类模型的第二分类损失函数,以及所述第一分类模型与所述第三分类模型之间的相似性损失函数;
所述第一训练结果包括所述第一分类模型中的指定中间层针对所述第一视频输出的第一特征向量,还包括所述第一分类模型对所述第一视频的第一分类结果;
所述第二训练结果包括所述第三分类模型中的指定中间层针对所述第二视频输出的第二特征向量,还包括所述第...

【专利技术属性】
技术研发人员:尹康
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1