一种基于注意力导向机制的人脸检测方法、系统、存储介质及终端技术方案

技术编号:28037577 阅读:10 留言:0更新日期:2021-04-09 23:20
本发明专利技术公开了一种基于注意力导向机制的人脸检测方法、系统、存储介质及终端,该方法包括:获取待检测的目标图像,并将待检测的目标图像输入预先训练的人脸检测模型中首先通过卷积块中扩展的VGG16对待检测的目标图像进行特征提取生成特征图序列,并从特征图序列中选取6个层作为第一分支原始特征图;人脸检测模型的上下文提取模块对第一分支原始特征图中每个特征图进行通道拼接,生成拼接后的特征图;人脸检测模型的注意力引导模块采集拼接后的特征图对应的语义关系和空间信息,生成采集后的特征图;基于第一分支原始特征图与采集后的特征图生成第二分支增强特征图;根据增强特征图得到检测出的人脸图像。因此,采用本申请实施例,可以提升了人脸检测精度。

【技术实现步骤摘要】
一种基于注意力导向机制的人脸检测方法、系统、存储介质及终端
本专利技术涉及计算机的深度学习
,特别涉及一种基于注意力导向机制的人脸检测方法、系统、存储介质及终端。
技术介绍
基于深度学习的人脸检测任务中,对于小目标、小人脸的检测难度很大,面临许多技术挑战,这是因为图片分辨率比较低,图片模糊,背景噪音多。现有的小脸检测方法主要包括传统的图像金字塔和多尺度滑动窗口检测小脸;数据扩增方法,增加小脸样本数量和种类来提升小脸检测性能;基于特征融合的方法,将高层、低层的多尺度特征融合来提升检测性能;基于锚采样和匹配策略的方法;利用上下文信息的方法等。由于视觉任务中上下文信息对性能提升至关重要,所以许多检测算法都设计了提取上下文信息的层间融合结构,例如DenseNet具有密集跨层连接实现特征复用,FPN融合高层和底层的特征信息,DeepLabV3具有ASPP结构来增大感受野。DSFD作为一种双分支人脸检测算法,结合FPN和RFB思想,提出了一种特征增强模块(FEM),不仅使用不同层级间的特征信息,同时使用空洞卷积获取更大感受野的特征,从而获得了更多的辨识度高且鲁棒性强的特征。但是FEM模块只是将FPN融合后的特征图分组处理后进行拼接用于增大感受野,没有将细粒度和粗粒度的上下文特征有效融合,从而降低了识别精度。
技术实现思路
本申请实施例提供了一种基于注意力导向机制的人脸检测方法、系统、存储介质及终端。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。第一方面,本申请实施例提供了一种基于注意力导向机制的人脸检测方法,方法包括:获取待检测的目标图像,并将待检测的目标图像输入预先训练的人脸检测模型中;其中,人脸检测模型中包括卷积块和注意力引导特征增强模块;注意力引导特征增强模块包括注意力引导模块和上下文提取模块;采用卷积块中扩展的VGG16对待检测的目标图像进行特征提取操作生成特征图序列,并从特征图序列中选取6个层作为第一分支原始特征图;基于上下文提取模块对第一分支原始特征图中每个特征图进行通道拼接,生成拼接后的特征图;根据注意力引导模块采集拼接后的特征图对应的语义关系和空间信息,生成采集后的特征图;基于第一分支原始特征图与采集后的特征图生成第二分支增强特征图;将第二分支增强特征图输入到人脸检测模型的SSD目标检测算法头部后,得到检测出的人脸图像。可选的,基于上下文提取模块对第一分支原始特征图中每个特征图进行通道拼接,生成拼接后的特征图,包括:上下文提取模块将第一分支原始特征图进行通道分组,生成三组特征图序列;上下文提取模块将三组特征图序列进行特征处理,生成三组特征处理后的特征图序列;上下文提取模块将三组空洞卷积后的特征图序列中各特征图通过1*1卷积参数再次特征融合后生成三组再次卷积的特征图序列;上下文提取模块将三组再次卷积的特征图序列进行拼接处理,生成拼接后的特征图。可选的,上下文提取模块将三组特征图序列进行特征处理,生成三组特征处理后的特征图序列,包括:上下文提取模块针对三组特征通道中的第一组采用不同空洞卷积层提取人脸的多尺度特性信息,生成第一精细化后的特征图序列;其中,空洞卷积参数为3*3,空洞卷积的卷记率为3;上下文提取模块针对三组特征通道中的第二组采用1*1卷积增加有效特征权重的数量,生成第二精细化后的特征图序列;上下文提取模块针对三组特征通道中的第三组进行全局特征提取,生成全局的特征图序列;上下文提取模块将第一精细化后的特征图序列、第二精细化后的特征图序列以及全局的特征图序列进行通道拼接,生成拼接后的特征图序列;上下文提取模块采用1*1卷积参数将三组空洞卷积后的特征图序列进行特征融合,生成三组特征处理后的特征图序列。可选的,上下文提取模块针对三组特征通道中的第三组进行全局特征提取,生成全局的特征图序列,包括:上下文提取模块针对三组特征通道中的第三组采用全局平均池化(GAP)处理,生成池化后的特征图序列;上下文提取模块将池化后的特征图序列采用1*1卷积参数改变通道维数,生成改变后的特征图序列;上下文提取模块将改变后的特征图序列上采样到预设阈值的空间维度,生成全局的特征图序列。可选的,根据注意力引导模块采集拼接后的特征图对应的语义关系和空间信息,生成采集后的特征图,包括:注意力引导模块提取拼接后的特征图中任意两个位置之间的语义关系;注意力引导模块收集拼接后的特征图中任意两个位置之间的空间信息;注意力引导模块将语义关系和空间信息进行合并后,生成采集后的特征图。可选的,按照以下步骤生成预先训练的人脸检测模型,包括:采用经过扩展的卷积神经网络VGG16创建骨干网络;将卷积块和注意力引导特征增强模块添加至创建的骨干网络中,生成人脸检测模型;其中,注意力引导特征增强模块由注意力引导模块(AM)和上下文提取模块(CEM)组成;加载第一分支的检测层序列,并将人脸检测模型的骨干网络中的6个层作为第一分支的检测层序列,生成替换后的人脸检测模型;采集带有人脸图像的训练样本,并将带有人脸图像的训练样本输入替换后的人脸检测模型中进行训练,输出人脸检测模型的渐进锚损失值;当人脸检测模型的渐进锚损失值达到预设最小值时,生成训练后的人脸检测模型。可选的,当人脸检测模型的渐进锚损失值达到预设最小值时,生成训练后的人脸检测模型,包括:当人脸检测模型的渐进锚损失值未达到预设最小值时,继续执行采集带有人脸图像的训练样本的步骤;或者当采集带有人脸图像的训练样本训练次数未到达预设次数时,继续执行采集带有人脸图像的训练样本的步骤。第二方面,本申请实施例提供了一种基于注意力导向机制的人脸检测系统,该系统包括:图像获取模块,用于获取待检测的目标图像,并将待检测的目标图像输入预先训练的人脸检测模型中;其中,人脸检测模型中包括卷积块和注意力引导特征增强模块;注意力引导特征增强模块包括注意力引导模块和上下文提取模块;第一分支原始特征图生成模块,用于采用卷积块中扩展的VGG16对待检测的目标图像进行特征提取操作生成特征图序列,并从特征图序列中选取6个层作为第一分支原始特征图;第一特征图生成模块,用于基于上下文提取模块对第一分支原始特征图中每个特征图进行通道拼接,生成拼接后的特征图;第二特征图生成模块,用于根据注意力引导模块采集拼接后的特征图对应的语义关系和空间信息,生成采集后的特征图;增强特征图生成模块,用于基于第一分支原始特征图与采集后的特征图生成第二分支增强特征图;人脸图像输出模块,用于将第二分支增强特征图输入到人脸检测模型的SSD目标检测算法头部后,得到检测出的本文档来自技高网...

【技术保护点】
1.一种基于注意力导向机制的人脸检测方法,其特征在于,所述方法包括:/n获取待检测的目标图像,并将所述待检测的目标图像输入预先训练的人脸检测模型中;其中,所述人脸检测模型中包括卷积块和注意力引导特征增强模块;所述注意力引导特征增强模块包括注意力引导模块和上下文提取模块;/n采用所述卷积块中扩展的VGG16对所述待检测的目标图像进行特征提取操作生成特征图序列,并从所述特征图序列中选取6个层作为第一分支原始特征图;/n基于所述上下文提取模块对所述第一分支原始特征图中每个特征图进行通道拼接,生成拼接后的特征图;/n根据注意力引导模块采集所述拼接后的特征图对应的语义关系和空间信息,生成采集后的特征图;/n基于所述第一分支原始特征图与所述采集后的特征图生成第二分支增强特征图;/n将所述第二分支增强特征图输入到人脸检测模型的SSD目标检测算法头部后,得到检测出的人脸图像。/n

【技术特征摘要】
1.一种基于注意力导向机制的人脸检测方法,其特征在于,所述方法包括:
获取待检测的目标图像,并将所述待检测的目标图像输入预先训练的人脸检测模型中;其中,所述人脸检测模型中包括卷积块和注意力引导特征增强模块;所述注意力引导特征增强模块包括注意力引导模块和上下文提取模块;
采用所述卷积块中扩展的VGG16对所述待检测的目标图像进行特征提取操作生成特征图序列,并从所述特征图序列中选取6个层作为第一分支原始特征图;
基于所述上下文提取模块对所述第一分支原始特征图中每个特征图进行通道拼接,生成拼接后的特征图;
根据注意力引导模块采集所述拼接后的特征图对应的语义关系和空间信息,生成采集后的特征图;
基于所述第一分支原始特征图与所述采集后的特征图生成第二分支增强特征图;
将所述第二分支增强特征图输入到人脸检测模型的SSD目标检测算法头部后,得到检测出的人脸图像。


2.根据权利要求1所述的方法,其特征在于,所述基于所述上下文提取模块对所述第一分支原始特征图中每个特征图进行通道拼接,生成拼接后的特征图,包括:
上下文提取模块将所述第一分支原始特征图进行通道分组,生成三组特征图序列;
上下文提取模块将所述三组特征图序列进行特征处理,生成三组特征处理后的特征图序列;
上下文提取模块将所述三组空洞卷积后的特征图序列中各特征图通过1*1卷积参数再次特征融合后生成三组再次卷积的特征图序列;
上下文提取模块将所述三组再次卷积的特征图序列进行拼接处理,生成拼接后的特征图。


3.根据权利要求2所述的方法,其特征在于,所述上下文提取模块将所述三组特征图序列进行特征处理,生成三组特征处理后的特征图序列,包括:
上下文提取模块针对所述三组特征通道中的第一组采用不同空洞卷积层提取人脸的多尺度特性信息,生成第一精细化后的特征图序列;其中,所述空洞卷积参数为3*3,所述空洞卷积的卷记率为3;
上下文提取模块针对所述三组特征通道中的第二组采用1*1卷积增加有效特征权重的数量,生成第二精细化后的特征图序列;
上下文提取模块针对所述三组特征通道中的第三组进行全局特征提取,生成全局的特征图序列;
上下文提取模块将所述第一精细化后的特征图序列、第二精细化后的特征图序列以及全局的特征图序列进行通道拼接,生成拼接后的特征图序列;
上下文提取模块采用1*1卷积参数将所述三组空洞卷积后的特征图序列进行特征融合,生成三组特征处理后的特征图序列。


4.根据权利要求3所述的方法,其特征在于,所述上下文提取模块针对所述三组特征通道中的第三组进行全局特征提取,生成全局的特征图序列,包括:
上下文提取模块针对所述三组特征通道中的第三组采用全局平均池化(GAP)处理,生成池化后的特征图序列;
上下文提取模块将所述池化后的特征图序列采用1*1卷积参数改变通道维数,生成改变后的特征图序列;
上下文提取模块将所述改变后的特征图序列上采样到预设阈值的空间维度,生成全局的特征图序列。


5.根据权利要求1所述的方法,其特征在于,所述根据...

【专利技术属性】
技术研发人员:赵磊
申请(专利权)人:特斯联科技集团有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1