多任务卷积神经网络模型及使用方法、装置和存储介质制造方法及图纸

技术编号:24499076 阅读:48 留言:0更新日期:2020-06-13 04:16
本发明专利技术公开了一种多任务卷积神经网络模型,及使用所述模型同时对输入图像中的人脸目标进行边界框检测和关键点定位的方法、装置及存储介质。所述模型中的区域提取模块能够检测输入图像中人脸边界框的位置,而关键点定位模块能够定位人脸关键点的坐标;并且,关键点定位模块通过使用全局管道注意力机制和全局空间注意力机制,能够让模型学习特征图的管道权值和空间权值,从而在不同的维度中挖掘出更具识别能力的特征和信息;使用所述模型同时对输入图像中的人脸目标进行边界框检测和关键点定位的方法在各种非约束条件下,包括表情、姿态和遮挡,都可以获得精确的结果,且该方法简洁高效,更具有鲁棒性。本发明专利技术广泛应用于图像处理技术领域。

Multi task convolution neural network model and its application, device and storage medium

【技术实现步骤摘要】
多任务卷积神经网络模型及使用方法、装置和存储介质
本专利技术涉及图像处理
,尤其是一种多任务卷积神经网络模型,及使用所述模型同时对输入图像中的人脸目标进行边界框检测和关键点定位的方法、装置及存储介质。
技术介绍
人脸检测技术最初起源于人脸识别,是计算机视觉领域中一个核心并且历史悠久的研究分支,是人脸相关应用里至关重要的第一步。在近几十年里,人脸检测已经引起了人们的高度重视,被认为是图像分析中成功的应用之一。面孔是复杂的、多维的、有意义的视觉刺激,开发一个面部识别的计算模型是困难的。计算机通过运用一定的搜索匹配方法在给定的图像中检测出是否包含人脸,并确定人脸所在的具体位置、大小、姿态的过程就是指人脸检测,同时其被认为是人脸相关研究应用的前提和基础,用它来辅助人们完成对生物特征的识别,将是一件具有重大研究价值和意义的事情。人脸检测是许多后续人脸分析相关应用的关键步骤,例如人脸对齐、人脸识别、人脸跟踪等。人脸检测效果的优劣对后续相关应用的性能起着决定性作用,它也属于目标检测的一种特定情况。人脸检测的最终目的就是在给定任意图像中判断是否有人脸的存本文档来自技高网...

【技术保护点】
1.一种多任务卷积神经网络模型,用于同时对输入图像中的人脸目标进行边界框检测和关键点定位,其特征在于,包括区域提取模块和关键点定位模块;/n所述区域提取模块包含多个级联的卷积栈,每个所述卷积栈由多个卷积层组成,以分别输出不同语义的特征图;所述区域提取模块用于检测输入图像中人脸边界框的位置;/n所述关键点定位模块包括第一子模块、第二子模块和第三子模块;/n所述第一子模块用于执行任务间的特征融合,所述任务间的特征融合为根据所述区域提取模块检测到的人脸边界框的位置,提取相应的人脸特征图,并融合所述人脸特征图得到第一融合特征图;/n所述第二子模块用于执行任务内的特征融合,所述任务内的特征融合为采用密集...

【技术特征摘要】
1.一种多任务卷积神经网络模型,用于同时对输入图像中的人脸目标进行边界框检测和关键点定位,其特征在于,包括区域提取模块和关键点定位模块;
所述区域提取模块包含多个级联的卷积栈,每个所述卷积栈由多个卷积层组成,以分别输出不同语义的特征图;所述区域提取模块用于检测输入图像中人脸边界框的位置;
所述关键点定位模块包括第一子模块、第二子模块和第三子模块;
所述第一子模块用于执行任务间的特征融合,所述任务间的特征融合为根据所述区域提取模块检测到的人脸边界框的位置,提取相应的人脸特征图,并融合所述人脸特征图得到第一融合特征图;
所述第二子模块用于执行任务内的特征融合,所述任务内的特征融合为采用密集编码结构,将所述第一融合特征图进行连续编码,得到第二融合特征图;
所述第三子模块用于将所述第二融合特征图进行解码后,使用卷积算子对解码后的特征图进行编码,以输出相应的关键点热度图,并根据所述关键点热度图,定位关键点坐标。


2.根据权利要求1所述的一种多任务卷积神经网络模型,其特征在于,区域提取模块检测输入图像中人脸边界框的位置这一操作,具体包括:
区域提取模块获取输入图像;
经过多次并行卷积处理得到区域类别响应图,每个所述区域类别响应图对应多个区域位置响应图;
所述区域类别响应图中的每个像素点限定相应尺度的参考区域;
所述区域位置响应图修正相应参考区域的位置和大小;
检测得到输入图像中人脸边界框的位置。


3.根据权利要求1所述的一种多任务卷积神经网络模型,其特征在于,第一子模块执行任务间的特征融合这一操作,具体包括:
根据所述区域提取模块检测到的人脸边界框的位置,提取多幅相应的人脸特征图;
分别采用感兴趣区域对齐方法和L2标准化方法处理所述多幅相应的人脸特征图,以统一不同特征图的大小和量纲,并得到第一人脸特征图;
使用全局管道注意力机制,将所述第一人脸特征图进行管道加权处理,得到第二人脸特征图;
使用全局空间注意力机制,将所述第二人脸特征图进行空间维度加权处理,得到第一融合特征图。


4.根据权利要求3所述的一种多任务卷积神经网络模型,其特征在于,所述全局管道注意力机制是通过以下步骤执行的:
利用两个并行的分离式卷积过滤器,分别从水平方向和垂直方向对所述第一人脸特征图进行全局编码,得到一维特征图;
合并所述一维特征图;
进行卷积操作,以恢复所述一维特征图的管道维度;
通过sigmoid操作归一化相应的特征值,以生成...

【专利技术属性】
技术研发人员:梁延研林旭新于晓渊
申请(专利权)人:中能国际建筑投资集团有限公司
类型:发明
国别省市:澳门;82

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1