人脸检测方法、装置、电子设备以及可读存储介质制造方法及图纸

技术编号:27818225 阅读:11 留言:0更新日期:2021-03-30 10:23
本公开实施例公开了一种人脸检测方法、装置、电子设备以及可读存储介质。该人脸检测方法包括:通过主干卷积神经网络处理人脸图像数据,其中,所述主干卷积神经网络包括多个处理阶段,每个所述处理阶段输出第一特征图;通过特征融合网络处理多个所述第一特征图,得到多个第二特征图;基于所述多个第二特征图,确定多个预测框;获取在柔性最大值运算下表明置信度的第一阈值;将所述第一阈值转化为在加减运算下表明置信度的第二阈值;基于所述预测框和所述第二阈值确定预测结果。通过将柔性最大值的阈值比较转化为加减运算的阈值比较,极大地节省了计算量,提高了处理效率,也降低了在终端部署模型的难度。端部署模型的难度。端部署模型的难度。

【技术实现步骤摘要】
人脸检测方法、装置、电子设备以及可读存储介质


[0001]本公开涉及人脸识别
,具体涉及一种人脸检测方法、装置、电子设备以及可读存储介质。

技术介绍

[0002]随着人体身份识别核验技术和图像智能检测识别技术的不断发展,人脸识别技术也日趋成熟,人脸识别应用越来越趋于终端,web端,并且输入条件的降低使人机交互更加便利。一般来说人脸识别技术包含人脸检测技术、人脸关键点定位技术、人脸特征提取技术和人脸属性分析技术。本专利技术人发现,现有人脸检测算法计算量大,耗时多难以在终端(例如门禁)中部署。

技术实现思路

[0003]为了解决相关技术中的问题,本公开实施例提供一种人脸检测方法、装置、电子设备以及可读存储介质。
[0004]第一方面,本公开实施例中提供了一种人脸检测方法。
[0005]具体地,所述人脸检测方法,包括:通过主干卷积神经网络处理人脸图像数据,其中,所述主干卷积神经网络包括多个处理阶段,每个所述处理阶段输出第一特征图;通过特征融合网络处理多个所述第一特征图,得到多个第二特征图;基于所述多个第二特征图,确定多个预测框;获取在柔性最大值运算下表明置信度的第一阈值;将所述第一阈值转化为在加减运算下表明置信度的第二阈值;基于所述预测框和所述第二阈值确定预测结果。
[0006]结合第一方面,本公开在第一方面的第一种实现方式中,通过下式将所述第一阈值转化为所述第二阈值:,其中,t1为第一阈值,t2为第二阈值。
[0007]结合第一方面,本公开在第一方面的第二种实现方式中,所述主干卷积神经网络包括交替设置的多个普通卷积层和多个深度可分离卷积层。
[0008]结合第一方面、第一方面的第一种或第二种实现方式中的任一项,本公开在第一方面的第三种实现方式中,所述通过特征融合网络处理多个所述第一特征图,得到多个第二特征图包括:通过第一融合子网络处理多个所述第一特征图,用于在所述第一特征图之间融合特征,得到多个第三特征图;通过第二融合子网络分别处理所述多个第三特征图,得到多个第二特征图。
[0009]结合第一方面的第三种实现方式,本公开在第一方面的第四种实现方式中,多个
所述第一特征图至少包括特征图C1和特征图C2,所述特征图C1的尺寸大于特征图C2的尺寸,所述通过第一融合子网络处理多个所述第一特征图,用于在所述第一特征图之间融合特征,得到多个第三特征图包括:分别通过1
×
1的卷积层处理所述特征图C1和C2,得到通道数相同的特征图M1和P2;对P2上采样得到特征图M2_up,并与M1叠加,得到特征图M1_add;通过3
×
3的卷积层处理M1_add,得到特征图P1,其中,P1和P2为第三特征图,所述上采样使用最近邻插值算法实现。
[0010]结合第一方面的第三种实现方式,本公开在第一方面的第五种实现方式中,所述通过第二融合子网络分别处理所述多个第三特征图,得到多个第二特征图包括对每个第三特征图P执行以下操作:通过具有第一输出通道数的卷积层处理P,得到特征图S1;通过具有第二输出通道数的卷积层处理P,得到特征图T;通过两个卷积通道分别处理T,得到特征图S2和S3,其中,S2和S3的通道数为所述第二输出通道数;按通道叠加S1、S2和S3,得到具有预定通道数的第二特征图F。
[0011]结合第一方面、第一方面的第一种至第五种实现方式中的任一项,本公开在第一方面的第六种实现方式中,所述基于所述多个第二特征图,确定多个预测框包括:基于所述第二特征图中的像素点确定锚点位置;基于所述第二特征图的尺寸确定锚点框的尺寸,其中,所述第二特征图的尺寸与所述锚点框的尺寸之间呈负相关关系;基于所述第二特征图的下采样倍率和所述锚点框的尺寸确定各个锚点位置产生的预测框的密度;基于所述锚点位置、锚点框的尺寸以及各个锚点位置产生的预测框的密度确定多个预测框,每个所述预测框包括以下信息:所述预测框的位置和尺寸,所述预测框为正样本的第一置信度以及所述预测框为负样本的第二置信度。
[0012]结合第一方面的第六种实现方式,本公开在第一方面的第七种实现方式中,所述基于所述预测框和所述第二阈值确定预测结果包括:基于所述第一置信度和所述第二置信度的差值,确定预测得分大于第二阈值的预测框;通过二叉树插值和中序排序算法对所述预测得分大于第二阈值的预测框按照预测得分排序,得到排序结果;根据所述排序结果,通过非极大值抑制处理所述预测得分大于第二阈值的预测框,以过滤重复的预测框,得到预测结果。
[0013]结合第一方面、第一方面的第一种至第七种实现方式中的任一项,本公开在第一方面的第八种实现方式中,该方法还包括:获得样本图像;将所述样本图像的亮度映射到特定区间,以构造增广图像;基于所述样本图像和所述增广图像训练包括所述主干卷积神经网络和特征融合
网络在内的人脸检测模型。
[0014]第二方面,本公开实施例中提供了一种人脸检测装置。
[0015]具体地,所述人脸检测装置,包括:特征提取模块,被配置为通过主干卷积神经网络处理人脸图像数据,其中,所述主干卷积神经网络包括多个处理阶段,每个所述处理阶段输出第一特征图;特征融合模块,被配置为通过特征融合网络处理多个所述第一特征图,得到多个第二特征图;预测框确定模块,被配置为基于所述多个第二特征图,确定多个预测框;阈值获取模块,被配置为获取在柔性最大值运算下表明置信度的第一阈值;阈值转化模块,被配置为将所述第一阈值转化为在加减运算下表明置信度的第二阈值;结果确定模块,被配置为基于所述预测框和所述第二阈值确定预测结果。
[0016]第三方面,本公开实施例提供了一种电子设备,包括存储器和处理器,其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现如第一方面、第一方面的第一种到第八种实现方式中任一项所述的方法。
[0017]第四方面,本公开实施例中提供了一种计算机可读存储介质,其上存储有计算机指令,该计算机指令被处理器执行时实现如第一方面、第一方面的第一种到第八种实现方式中任一项所述的方法。
[0018]根据本公开实施例提供的技术方案,通过将柔性最大值的阈值比较转化为加减运算的阈值比较,极大地节省了计算量,提高了处理效率,也降低了在终端部署模型的难度。
[0019]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
[0020]结合附图,通过以下非限制性实施方式的详细描述,本公开的其它特征、目的和优点将变得更加明显。以下是对附图的说明。
[0021]图1示出根据本公开实施例的人脸检测方法的流程图。
[0022]图2示出根据本公开实施例的通过特征融合网络处理多个所述第一特征图,得到多个第二特征图的流程图。
[0023]图3示出根据本公开实施例的通过第一融合子网络处理多个所述第一特征图,得到多个第三特征图的流程图。
[0024]图4示出根据本公开实施例的通过第二融合本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种人脸检测方法,包括:通过主干卷积神经网络处理人脸图像数据,其中,所述主干卷积神经网络包括多个处理阶段,每个所述处理阶段输出第一特征图;通过特征融合网络处理多个所述第一特征图,得到多个第二特征图;基于所述多个第二特征图,确定多个预测框;获取在柔性最大值运算下表明置信度的第一阈值;将所述第一阈值转化为在加减运算下表明置信度的第二阈值;基于所述预测框和所述第二阈值确定预测结果。2.根据权利要求1所述的方法,其中,通过下式将所述第一阈值转化为所述第二阈值:,其中,t1为第一阈值,t2为第二阈值。3.根据权利要求1所述的方法,其中,所述主干卷积神经网络包括交替设置的多个普通卷积层和多个深度可分离卷积层。4.根据权利要求1~3任一项所述的方法,其中,所述通过特征融合网络处理多个所述第一特征图,得到多个第二特征图包括:通过第一融合子网络处理多个所述第一特征图,用于在所述第一特征图之间融合特征,得到多个第三特征图;通过第二融合子网络分别处理所述多个第三特征图,得到多个第二特征图。5.根据权利要求4所述的方法,其中,多个所述第一特征图至少包括特征图C1和特征图C2,所述特征图C1的尺寸大于特征图C2的尺寸,所述通过第一融合子网络处理多个所述第一特征图,用于在所述第一特征图之间融合特征,得到多个第三特征图包括:分别通过1
×
1的卷积层处理所述特征图C1和C2,得到通道数相同的特征图M1和P2;对P2上采样得到特征图M2_up,并与M1叠加,得到特征图M1_add;通过3
×
3的卷积层处理M1_add,得到特征图P1,其中,P1和P2为第三特征图,所述上采样使用最近邻插值算法实现。6.根据权利要求4所述的方法,其中,所述通过第二融合子网络分别处理所述多个第三特征图,得到多个第二特征图包括对每个第三特征图P执行以下操作:通过具有第一输出通道数的卷积层处理P,得到特征图S1;通过具有第二输出通道数的卷积层处理P,得到特征图T;通过两个卷积通道分别处理T,得到特征图S2和S3,其中,S2和S3的通道数为所述第二输出通道数;按通道叠加S1、S2和S3,得到具有预定通道数的第二特征图F。7.根据权利要求1~3任一项所述的方法,其中,所述...

【专利技术属性】
技术研发人员:罗伯特
申请(专利权)人:北京澎思科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1