一种人脸检测的方法与设备技术

技术编号:24331798 阅读:71 留言:0更新日期:2020-05-29 19:58
本申请的目的是提供一种人脸检测的方法与设备,根据本申请的方案,通过对于每个特征提取层对应的特征图中的每个锚点,判断该锚点在所述目标图像中对应的多个预设框中是否存在与感兴趣区域的匹配度大于或等于预定的匹配度阈值的预设框,能够过滤不需要检测区域,例如已检测或跟踪到的人脸框,使得不需要检测区域不参与人脸检测的运算,避免重复计算,降低计算量;进一步地,本申请在较靠前的特征提取层对应的特征图上采集小尺度的预设框,因而可以检测到更小的人脸,增加小人脸检测的敏感性和准确性。

A method and equipment of face detection

【技术实现步骤摘要】
一种人脸检测的方法与设备
本申请涉及通信领域,尤其涉及一种用于人脸检测的技术。
技术介绍
人脸检测是在公共安全领域中的基础需求,而现有的人脸检测算法主要包括传统的人脸检测方法和基于深度学习的人脸检测方法。传统的人脸检测方法准确率和算法的适应能力比基于深度神经网络的人脸检测方法差,而基于深度学习的人脸检测方法,一般堆叠多个卷积模块,导致计算量大,无法检测到小目标,且很难在资源受限的嵌入式设备上实现实时的人脸检测。
技术实现思路
本申请的一个目的是提供一种人脸检测的方法与设备。根据本申请的一个方面,提供了一种人脸检测的方法,该方法包括:将目标图像输入人脸检测网络,其中,所述人脸检测网络包括已训练的主干网络、筛选层及检测层,所述主干网络包括依次连接的多个卷积模块,所述多个卷积模块中包括一个或多个特征提取层;所述主干网络获取所述目标图像在每个特征提取层对应的特征图,对于该特征图中的每个锚点,所述筛选层判断该锚点在所述目标图像中对应的一个或多个预设框中是否存在与感兴趣区域的匹配度大于或等于预定匹配度阈值的预设框;若存在,则去除该特征图上的该锚点;否则,所述主干网络获得该锚点对应的一个或多个人脸框偏移量;所述检测层根据每个剩余锚点对应的一个或多个人脸框偏移量,获得在所述目标图像中对应的人脸框,并根据所获得的所有人脸框确定所述目标图像中的目标人脸框。根据本申请的一个方面,提供了一种人脸检测的计算机设备,该计算机设备包括:一一模块,用于将目标图像输入人脸检测网络,其中,所述人脸检测网络包括已训练的主干网络、筛选层及检测层,所述主干网络包括依次连接的多个卷积模块,所述多个卷积模块中包括一个或多个特征提取层;一二模块,用于所述主干网络获取所述目标图像在每个特征提取层对应的特征图,对于该特征图中的每个锚点,所述筛选层判断该锚点在所述目标图像中对应的一个或多个预设框中是否存在与感兴趣区域的匹配度大于或等于预定匹配度阈值的预设框;若存在,则去除该特征图上的该锚点;否则,所述主干网络获得该锚点对应的一个或多个人脸框偏移量;一三模块,用于所述检测层根据每个剩余锚点对应的一个或多个人脸框偏移量,获得在所述目标图像中对应的人脸框,并根据所获得的所有人脸框确定所述目标图像中的目标人脸框。根据本申请的一个方面,提供了一种人脸检测的设备,其中,该设备包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行如下操作:将目标图像输入人脸检测网络,其中,所述人脸检测网络包括已训练的主干网络、筛选层及检测层,所述主干网络包括依次连接的多个卷积模块,所述多个卷积模块中包括一个或多个特征提取层;所述主干网络获取所述目标图像在每个特征提取层对应的特征图,对于该特征图中的每个锚点,所述筛选层判断该锚点在所述目标图像中对应的一个或多个预设框中是否存在与感兴趣区域的匹配度大于或等于预定匹配度阈值的预设框;若存在,则去除该特征图上的该锚点;否则,所述主干网络获得该锚点对应的一个或多个人脸框偏移量;所述检测层根据每个剩余锚点对应的一个或多个人脸框偏移量,获得在所述目标图像中对应的人脸框,并根据所获得的所有人脸框确定所述目标图像中的目标人脸框。根据本申请的一个方面,提供了一种存储指令的计算机可读介质,所述指令在被执行时使得系统进行如下操作:将目标图像输入人脸检测网络,其中,所述人脸检测网络包括已训练的主干网络、筛选层及检测层,所述主干网络包括依次连接的多个卷积模块,所述多个卷积模块中包括一个或多个特征提取层;所述主干网络获取所述目标图像在每个特征提取层对应的特征图,对于该特征图中的每个锚点,所述筛选层判断该锚点在所述目标图像中对应的一个或多个预设框中是否存在与感兴趣区域的匹配度大于或等于预定匹配度阈值的预设框;若存在,则去除该特征图上的该锚点;否则,所述主干网络获得该锚点对应的一个或多个人脸框偏移量;所述检测层根据每个剩余锚点对应的一个或多个人脸框偏移量,获得在所述目标图像中对应的人脸框,并根据所获得的所有人脸框确定所述目标图像中的目标人脸框。与现有技术相比,本申请提供一种用于人脸检测的轻量级深度神经网络,通过对于每个特征提取层对应的特征图中的每个锚点,判断该锚点在所述目标图像中对应的多个预设框中是否存在与感兴趣区域的匹配度大于或等于预定的匹配度阈值的预设框,能够过滤不需要检测区域,例如已检测或跟踪到的人脸框,使得不需要检测区域不参与人脸检测的运算,避免重复计算,降低计算量;进一步地,本申请在较靠前的特征提取层对应的特征图上采集小尺度的预设框,因而可以检测到更小的人脸,增加小人脸检测的敏感性和准确性。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1示出根据本申请一个实施例的一种人脸检测的方法流程图;图2示出根据本申请一个示例的人脸检测网络的结构示意图;图3示出模块(block)的一个单元结构图;图4示出模块(block)的另一个单元结构图;图5示出根据本申请一个实施例的一种人脸检测的计算机设备结构图;图6示出可被用于实施本申请中所述的各个实施例的示例性系统;图7示出根据本申请一个示例的人脸检测网络中的主干网络对应的各项参数图。附图中相同或相似的附图标记代表相同或相似的部件。具体实施方式下面结合附图对本申请作进一步详细描述。在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(例如,中央处理器(CentralProcessingUnit,CPU))、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RandomAccessMemory,RAM)和/或非易失性内存等形式,如只读存储器(ReadOnlyMemory,ROM)或闪存(FlashMemory)。内存是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(Phase-ChangeMemory,PCM)、可编程随机存取存储器(ProgrammableRandomAccessMemory,PRAM)、静态随机存取存储器(StaticRandom-AccessMemory,SRAM)、动态随机存取存储器(DynamicRandomAccessMemory,DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(Electrically-ErasableProgrammableRead-OnlyMemory,EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CompactDiscR本文档来自技高网...

【技术保护点】
1.一种人脸检测的方法,其中,所述方法包括:/n将目标图像输入人脸检测网络,其中,所述人脸检测网络包括已训练的主干网络、筛选层及检测层,所述主干网络包括依次连接的多个卷积模块,所述多个卷积模块中包括一个或多个特征提取层;/n所述主干网络获取所述目标图像在每个特征提取层对应的特征图,对于该特征图中的每个锚点,所述筛选层判断该锚点在所述目标图像中对应的一个或多个预设框中是否存在与感兴趣区域的匹配度大于或等于预定匹配度阈值的预设框;若存在,则去除该特征图上的该锚点;否则,所述主干网络获得该锚点对应的一个或多个人脸框偏移量;/n所述检测层根据每个剩余锚点对应的一个或多个人脸框偏移量,获得在所述目标图像中对应的人脸框,并根据所获得的所有人脸框确定所述目标图像中的目标人脸框。/n

【技术特征摘要】
1.一种人脸检测的方法,其中,所述方法包括:
将目标图像输入人脸检测网络,其中,所述人脸检测网络包括已训练的主干网络、筛选层及检测层,所述主干网络包括依次连接的多个卷积模块,所述多个卷积模块中包括一个或多个特征提取层;
所述主干网络获取所述目标图像在每个特征提取层对应的特征图,对于该特征图中的每个锚点,所述筛选层判断该锚点在所述目标图像中对应的一个或多个预设框中是否存在与感兴趣区域的匹配度大于或等于预定匹配度阈值的预设框;若存在,则去除该特征图上的该锚点;否则,所述主干网络获得该锚点对应的一个或多个人脸框偏移量;
所述检测层根据每个剩余锚点对应的一个或多个人脸框偏移量,获得在所述目标图像中对应的人脸框,并根据所获得的所有人脸框确定所述目标图像中的目标人脸框。


2.根据权利要求1所述的方法,其中,所述方法还包括:
将多个训练样本及对应的标签信息输入待训练的人脸检测网络进行迭代训练,其中,所述待训练的人脸检测网络包括待训练的主干网络及多任务损失层,所述多任务损失层包括分类损失函数和回归损失函数。


3.根据权利要求2所述的方法,其中,将多个训练样本及对应的标签信息输入待训练的人脸检测网络进行迭代训练,包括:
对于每个训练样本,所述待训练的主干网络获取该训练样本在每个特征提取层对应的特征图,对于该特征图中的每个锚点,所述主干网络对该锚点执行卷积核大小为1*1的卷积运算,获得该锚点对应的一个或多个人脸框偏移量;
所述多任务损失层基于该一个或多个人脸框偏移量、该训练样本对应的标签信息进行迭代训练。


4.根据权利要求1至3中任一项所述的方法,其中,所述一个或多个特征提取层中包括位于所述多个卷积模块中的预定层级之前的至少一个卷积模块。


5.根据权利要求1所述的方法,其中,所述方法还包括:
确定所述目标图像的感兴趣区域。


6.根据权利要求5所述的方法,其中,所述确定所述目标图像的感兴趣区域,包括:
对所述目标图像对应的视频帧执行跟踪算法,获得所述目标图像对应的跟踪结果,并将所述跟踪结果在所述目标图像中对应的区域确定为所述目标图像的感兴趣区域。


7.根据权利要求1所述的方法,其中,所述筛选层判断该锚点在所述目标图像中对应的一个或多个预设框中是否存在与感兴趣区域的匹配度大于或等于预定匹配度阈值的预设框,还包括:
对于该锚点在所述目标图像中的一个或多个预设框,所述筛选层获得该预设框与感兴趣区域之间的重叠度和/或相似度,根...

【专利技术属性】
技术研发人员:李生金侯晓辉
申请(专利权)人:亮风台上海信息科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1