视频图像的检测方法、装置、电子设备及存储介质制造方法及图纸

技术编号:25709895 阅读:28 留言:0更新日期:2020-09-23 02:56
本申请公开了视频图像的检测方法、装置、电子设备及存储介质,涉及图像处理、深度学习技术领域。本申请中的方法的具体实现方案为:从视频图像中检测人脸区域,得到人脸区域图像;将所述人脸区域图像转换为灰度图像;将所述灰度图像转换为一维功率谱;获取所述一维功率谱对应的特征数据;将所述特征数据输入经过训练的分类器,得到所述视频图像的检测结果。本申请可以将视频图像中的人脸区域图像转换为对应的一维功率谱,从而可以在不损失图像信息的情况下,有效地减少了表征视频图像的特征数量,降低了图像数据处理的运算复杂度,在确保检测准确度的前提下,显著提高了分类器的数据处理速度。

【技术实现步骤摘要】
视频图像的检测方法、装置、电子设备及存储介质
本申请涉及图像处理、深度学习
中的计算机视觉技术,尤其涉及一种视频图像的检测方法、装置、电子设备及存储介质。
技术介绍
随着人工智能的发展,近来出现了DeepFake这种基于神经网络的自动换脸技术,其可以使用某人的面部自动替换视频中的一个人的面部。此技术如果被不正当使用,会产生侵犯肖像权或名誉权、散步谣言、引发公共事件等严重后果。现有技术中,一般通过非特定特征提取,或者直接进行端对端方式训练得到的深度模型进行假脸识别。然而现有技术中的方式需要建立规模较大的数据集对模型进行长期训练,数据处理量大,训练时间长。
技术实现思路
本公开提供一种视频图像的检测方法、装置、电子设备及存储介质,可以有效地减少表征视频图像的特征数量,降低了图像数据处理的运算复杂度。第一方面,本公开实施例提供一种视频图像的检测方法,所述方法包括:从视频图像中检测人脸区域,得到人脸区域图像;将所述人脸区域图像转换为灰度图像;将所述灰度图像转换为一维功率谱;获取所述一维功率谱对应的特征数据;将所述特征数据输入经过训练的分类器,得到所述视频图像的检测结果。本实施例中,可以将视频图像中的人脸区域图像转换为对应的一维功率谱,从而可以在不损失图像信息的情况下,有效地减少了表征视频图像的特征数量,降低了图像数据处理的运算复杂度,在确保检测准确度的前提下,显著提高了分类器的数据处理速度。第二方面,本公开实施例提供一种视频图像的检测装置,所述装置包括:第一检测模块,用于从视频图像中检测人脸区域,得到人脸区域图像;第一处理模块,用于将所述人脸区域图像转换为灰度图像;第二处理模块,用于将所述灰度图像转换为一维功率谱;获取模块,用于获取所述一维功率谱对应的特征数据;第二检测模块,用于将所述特征数据输入经过训练的分类器,得到所述视频图像的检测结果。本实施例中,可以将视频图像中的人脸区域图像转换为对应的一维功率谱,从而可以在不损失图像信息的情况下,有效地减少了表征视频图像的特征数量,降低了图像数据处理的运算复杂度,在确保检测准确度的前提下,显著提高了分类器的数据处理速度。第三方面,本公开提供一种电子设备,包括:处理器和存储器;存储器中存储有所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行如第一方面中任一项所述的视频图像的检测方法。第四方面,本公开提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面中任一项所述的视频图像的检测方法。第五方面,本公开实施例提供一种程序产品,所述程序产品包括:计算机程序,所述计算机程序存储在可读存储介质中,服务器的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得服务器执行第一方面中任一所述的视频图像的检测方法。第六方面,本公开提供一种视频图像的检测方法,所述方法包括:将视频图像转换为灰度图像;其中,所述视频图像包含人脸区域;将所述灰度图像转换为一维功率谱;获取所述一维功率谱对应的特征数据;将所述特征数据输入经过训练的分类器,得到所述视频图像的检测结果。本实施例中,可以将视频图像中的人脸区域图像转换为对应的一维功率谱,从而可以在不损失图像信息的情况下,有效地减少了表征视频图像的特征数量,降低了图像数据处理的运算复杂度,在确保检测准确度的前提下,显著提高了分类器的数据处理速度。上述申请中的一个实施例具有如下优点或有益效果:减少了表征视频图像的特征数量,降低了图像数据处理的运算复杂度。因为采用从视频图像中检测人脸区域,得到人脸区域图像;将所述人脸区域图像转换为灰度图像;将所述灰度图像转换为一维功率谱;获取所述一维功率谱对应的特征数据;将所述特征数据输入经过训练的分类器,得到所述视频图像的检测结果的技术手段,所以克服了现有图像检测运算复杂度高,数据处理量大的技术问题,通过将视频图像中的人脸区域图像转换为对应的一维功率谱,从而可以在不损失图像信息的情况下,有效地减少了表征视频图像的特征数量,降低了图像数据处理的运算复杂度,在确保检测准确度的前提下,达到了显著提高分类器的数据处理速度的技术效果。上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。附图说明附图用于更好地理解本方案,不构成对本公开的限定。其中:图1是可以实现本公开实施例的视频图像的检测方法的原理示意图;图2是根据本公开第一实施例的示意图;图3是根据本公开第二实施例的示意图;图4是根据本公开第三实施例的示意图;图5是根据本公开第四实施例的示意图;图6是用来实现本公开实施例的电子设备的框图。具体实施方式以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。下面以具体地实施例对本公开的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。随着人工智能的发展,近来出现了DeepFake这种基于神经网络的自动换脸技术,其可以使用某人的面部自动替换视频中的一个人的面部。此技术如果被不正当使用,会产生侵犯肖像权或名誉权、散步谣言、引发公共事件等严重后果。现有技术中,一般通过非特定特征提取,或者直接进行端对端方式训练得到的深度模型进行假脸识别。然而现有技术中的方式需要建立规模较大的数据集对模型进行长期训练,数据处理量大,训练时间长。针对上述技术问题,本公开旨在提供一种视频图像的检测方法、装置、电子设备及存储介质,可以有效地减少表征视频图像的特征数量,降低了图像数据处理的运算复杂度。本公开提供的方法可以应用于具备图像处理能力的各种设备,例如服务器、计算机、手机等等图1是可以实现本公开实施例的视频图像的检测方法的原理示意图,如图1所示,由于Deepfake类的换脸技术,是以使用某人的面部自动替换视频中的一个人的面部。因此,本文档来自技高网...

【技术保护点】
1.一种视频图像的检测方法,所述方法包括:/n从视频图像中检测人脸区域,得到人脸区域图像;/n将所述人脸区域图像转换为灰度图像;/n将所述灰度图像转换为一维功率谱;/n获取所述一维功率谱对应的特征数据;/n将所述特征数据输入经过训练的分类器,得到所述视频图像的检测结果。/n

【技术特征摘要】
1.一种视频图像的检测方法,所述方法包括:
从视频图像中检测人脸区域,得到人脸区域图像;
将所述人脸区域图像转换为灰度图像;
将所述灰度图像转换为一维功率谱;
获取所述一维功率谱对应的特征数据;
将所述特征数据输入经过训练的分类器,得到所述视频图像的检测结果。


2.根据权利要求1所述的方法,其中,所述将所述灰度图像转换为一维功率谱,包括:
通过二维离散傅里叶变换,将所述灰度图像转换为二维频谱;
将二维频谱中的零频率分量移至所述二维频谱的中心位置,得到移频后的二维频谱;
对所述移频后的二维频谱进行径向平均计算,得到一维功率谱。


3.根据权利要求2所述的方法,在对所述移频后的二维频谱进行径向平均计算之前,所述方法还包括:
对所述移频后的二维频谱中的各个频率进行取绝对值和取对数运算,以使得所述移频后的二维数据的各个频率在预设的数值范围内。


4.根据权利要求2所述的方法,其中,对所述移频后的二维频谱进行径向平均计算,得到一维功率谱,包括:
确定所述人脸区域图像的中心点;
基于所述中心点,获取所述移频后的二维频谱落在每个径向单元内的数值;其中,不同径向单元之间的半径差为固定值;
对落在每个径向单元中的数值进行平均值计算,得到每个径向单元对应的数值;其中,所有径向单元对应的数值构成所述一维功率谱。


5.根据权利要求1-4中任一项所述的方法,其中,所述获取所述一维功率谱对应的特征数据,包括:
将所述一维功率谱表示为一维向量;
当所述一维向量中的数值数量小于预设阈值,则对所述一维向量进行插值处理,得到插值后的向量;
对所述插值后的向量进行归一化处理,得到所述一维功率谱对应的特征数据。


6.根据权利要求5所述的方法,其中,对所述插值后的向量进行归一化处理,包括:
将所述插值后的向量中的各个数值分别除以排在第一顺序位的数值。


7.根据权利要求1-4中任一项所述的方法,其中,将所述特征数据输入经过训练的分类器,得到所述视频图像的检测结果,包括:
将所述特征数据输入经过训练的分类器,由所述经过训练的分类器输出所述视频图像中的人脸区域图像是否被篡改。


8.根据权利要求1-4中任一项所述的方法,在将所述特征数据输入经过训练的分类器之前,还包括:
构建训练集;其中,所述训练集中包含有标注结果的视频图像;所述标注结果包括:人脸被篡改,或者人脸未被篡改;
通过所述训练集迭代训练分类器,得到经过训练的分类器。


9.一种视频图像的检测装置,所述装置包括:
第一检测模块,用于从视频图像中检测人脸区域,得到人脸区域图像;
第一处理模块,用于将所述人脸区域图像转换为灰度图像;
第二处理模块,用于将所述灰度图像转换为一维功率谱;
获取模块,用于获取所述一维功率谱对应的特征数据;
第二检测模块,用于将所...

【专利技术属性】
技术研发人员:王洋熊俊峰郝新张欢吕中厚王文华
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1