视频分类方法、装置、终端设备及计算机可读存储介质制造方法及图纸

技术编号:22330219 阅读:46 留言:0更新日期:2019-10-19 12:18
本申请适用于视频分类技术领域,提供了视频分类方法、装置、终端设备及计算机可读存储介质,包括:对视频文件执行图像质量筛选操作,得到图像质量满足要求的视频帧;对所述视频帧执行人脸检测操作,确定人脸在视频帧的信息,所述人脸在视频帧的信息包括人脸数量和位置;根据所述人脸数量和位置裁剪出相应数量的人脸,并抽取所述人脸的人脸代表特征;根据所述人脸代表特征对所述人脸进行分类。通过上述方法,能够极大提高了视频人脸代表特征的抽取速度,并且,由于根据获取的人脸代表特征对人脸进行分类,因此,提高了分类结果的准确度。

【技术实现步骤摘要】
视频分类方法、装置、终端设备及计算机可读存储介质
本申请属于视频分类
,尤其涉及视频分类方法、装置、终端设备及计算机可读存储介质。
技术介绍
人物分类属于视频分类中的一个子任务,人物视频分类是指给定一个视频片段,根据视频片段包含的人物对视频进行分类。当前视频分类的主流算法包括:基于长短期记忆网络(LongShort-TermMemory,LSTM)和基于3维卷积神经网络(3DConvolutionalNeuralNetworks,3D-CNN)。其中,经典的基于LSTM的方案通常结合了LSTM和CNN两种模型,这种结合充分利用了LSTM时序特征提取的优势和CNN空间特征提取的优势。而3D-CNN则是在2D的CNN基础上进行扩展衍生得到。这两种方法在视频分类任务中都表现出了不错的效果,但是由于采用的模型太过于复杂,因此很难直接应用到生产环境中。特别是3D-CNN方案,该方案将卷积网络的可训练参数扩展了一个维度,导致参数数量急剧增加,而大量的网络参数直接导致网络训练的复杂度过高和计算资源大量被消耗。故,需要提供一种新的方法以解决上述技术问题。
技术实现思路
有鉴于此,本申请实施例提供了视频分类方法、装置、终端设备及计算机可读存储介质,以解决现有技术中难以快速对视频文件的人脸进行分类的问题。本申请实施例的第一方面提供了一种视频分类方法,包括:对视频文件执行图像质量筛选操作,得到图像质量满足要求的视频帧;对所述视频帧执行人脸检测操作,确定人脸在视频帧的信息,所述人脸在视频帧的信息包括人脸数量和位置;根据所述人脸数量和位置裁剪出相应数量的人脸,并抽取所述人脸的人脸代表特征;根据所述人脸代表特征对所述人脸进行分类。本申请实施例的第二方面提供了一种视频分类装置,包括:图像质量筛选单元,用于对视频文件执行图像质量筛选操作,得到图像质量满足要求的视频帧;人脸检测单元,用于对所述视频帧执行人脸检测操作,确定人脸在视频帧的信息,所述人脸在视频帧的信息包括人脸数量和位置;人脸代表特征抽取单元,用于根据所述人脸数量和位置裁剪出相应数量的人脸,并抽取所述人脸的人脸代表特征;人脸分类单元,用于根据所述人脸代表特征对所述人脸进行分类。本申请实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述方法的步骤。本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述方法的步骤。本申请实施例与现有技术相比存在的有益效果是:由于先对视频文件执行图像质量筛选操作,因此,能够有效减少冗余的视频文件,并且,通过对筛选后的视频文件执行人脸检测、裁剪等操作,因此,能够从裁剪出的人脸中快速确定出人脸代表特征,从而在根据该人脸代表特征实现人脸的分类时,无需采用复杂的模型,极大提高了人脸分类的速度,并且,由于根据获取的人脸代表特征对人脸进行分类,因此,提高了分类结果的准确度。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例提供的第一种视频分类方法的流程示意图;图2是本申请实施例提供的第二种视频分类方法的流程示意图;图3是本申请实施例提供的视频分类装置的结构示意图;图4是本申请实施例提供的终端设备的示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。为了说明本申请所述的技术方案,下面通过具体实施例来进行说明。应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。具体实现中,本申请实施例中描述的终端设备包括但不限于诸如具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话、膝上型计算机或平板计算机之类的其它便携式设备。还应当理解的是,在某些实施例中,上述设备并非便携式通信设备,而是具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的台式计算机。在接下来的讨论中,描述了包括显示器和触摸敏感表面的终端设备。然而,应当理解的是,终端设备可以包括诸如物理键盘、鼠标和/或控制杆的一个或多个其它物理用户接口设备。终端设备支持各种应用程序,例如以下中的一个或多个:绘图应用程序、演示应用程序、文字处理应用程序、网站创建应用程序、盘刻录应用程序、电子表格应用程序、游戏应用程序、电话应用程序、视频会议应用程序、电子邮件应用程序、即时消息收发应用程序、锻炼支持应用程序、照片管理应用程序、数码相机应用程序、数字摄影机应用程序、web浏览应用程序、数字音乐播放器应用程序和/或数字视频播放器应用程序。可以在终端设备上执行的各种应用程序可以使用诸如触摸敏感表面的至少一个公共物理用户接口设备。可以在应用程序之间和/或相应应用程序内调整和/或改变触摸敏感表面的一个或多个功能以及终端上显示的相应信息。这样,终端的公共物理架构(例如,触摸敏感表面)可以支持具有对用户而言直观且透明的用户界面的各种应用程序。实施例:图1示出了本申请实施例提供的第一种视频分类方法的流程图,本实施例中,主要针对视频文件包含的人脸进行分类,详述如下:步骤S11,对视频文件执行图像质量筛选操作,得到图像质量满足要求的视频帧;其中,对视频帧进行图像质量筛选包括:判断前景物体的边缘是否满足要求、判断视频帧的噪声是否满足要求、亮度值是否满足要求、灰度值的离散程度是否满足要求等等。在本实施例中,可采用上述列举的任一种或几种的图像质量筛选操作(或采用上述没有列举的图像质量筛选操作)对视频文件的视频帧进行筛选处理,此处不作限定。由于对视频文件先执行一次筛选操作,因此,能够有效减少后续需要处理的视频帧的数量。在一些实施例中,由于视本文档来自技高网...

【技术保护点】
1.一种视频分类方法,其特征在于,包括:对视频文件执行图像质量筛选操作,得到图像质量满足要求的视频帧;对所述视频帧执行人脸检测操作,确定人脸在视频帧的信息,所述人脸在视频帧的信息包括人脸数量和位置;根据所述人脸数量和位置裁剪出相应数量的人脸,并抽取所述人脸的人脸代表特征;根据所述人脸代表特征对所述人脸进行分类。

【技术特征摘要】
1.一种视频分类方法,其特征在于,包括:对视频文件执行图像质量筛选操作,得到图像质量满足要求的视频帧;对所述视频帧执行人脸检测操作,确定人脸在视频帧的信息,所述人脸在视频帧的信息包括人脸数量和位置;根据所述人脸数量和位置裁剪出相应数量的人脸,并抽取所述人脸的人脸代表特征;根据所述人脸代表特征对所述人脸进行分类。2.如权利要求1所述的视频分类方法,其特征在于,所述根据所述人脸数量和位置裁剪出相应数量的人脸,并抽取所述人脸的人脸代表特征,包括:根据所述人脸数量和位置裁剪出相应数量的人脸,并对裁剪出的人脸执行对齐操作;抽取对齐后的所述人脸的人脸特征,对抽取的人脸特征进行聚类,并对每个聚类得到的类别进行特征池化,得到对应类别下的人脸代表特征;对应地,所述根据所述人脸代表特征对所述人脸进行分类具体为:将人脸代表特征输入到预先训练好的分类器中,得到所述人脸代表特征对应的人脸类别。3.如权利要求2所述的视频分类方法,其特征在于,所述人脸在视频帧的信息还包括人脸锚点,此时,所述根据所述人脸数量和位置裁剪出相应数量的人脸,并对裁剪出的人脸执行对齐操作,具体包括:根据所述人脸数量和位置裁剪出相应数量的人脸,再根据人脸锚点旋转裁剪出的人脸,以把所述人脸校正成正向的人脸,所述正向的人脸作为对齐后的人脸。4.如权利要求1所述的视频分类方法,其特征在于,所述对视频文件执行图像质量筛选操作,得到图像质量满足要求的视频帧,包括:以视频帧为单位,计算视频文件的视频帧的以下至少一个参数值:图像均值、图像标准差和图像平均梯度;若计算的参数值都大于或等于预设的参数阈值,则判定所述参数值对应的视频帧的图像质量满足要求,所...

【专利技术属性】
技术研发人员:康健
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1