一种基于全局注意力的人脸特征点定位方法及系统技术方案

技术编号:26731259 阅读:38 留言:0更新日期:2020-12-15 14:33
本发明专利技术的一种基于全局注意力的人脸特征点定位方法及系统,包括:获取人脸局部图像;把获取到的图像输入事先训练好的基于全局注意力的人脸特征点定位模型,对于输入的人脸局部图像,经过基于全局注意力的人脸特征点定位模型前向运算后,直接输出人脸特征点位置;本发明专利技术的基于全局注意力的人脸特征点定位方法及系统,基于深度学习技术,利用残差网络机制和全局注意力融合机制,获取人脸图像的具有全局语义信息和局部语义信息的融合特征,使得深度神经网络模型能够兼顾人脸图像的全局信息和局部信息,精准的计算出人脸特征点位置,人脸特征点定位更加精准,鲁棒性更高。

【技术实现步骤摘要】
一种基于全局注意力的人脸特征点定位方法及系统
本专利技术涉及人脸识别
,具体涉及一种基于全局注意力的人脸特征点定位方法及系统。
技术介绍
人脸特征点定位是指在人脸图像上,通过机器视觉技术精确的定位出脸部的关键特征点位置,关键特征点包括嘴角、眼角、鼻尖等器官位置以及脸部轮廓等位置。人脸特征点定位是人脸识别系统、表情识别系统和人脸属性分析系统等应用领域的技术基础,人脸特征点定位的质量好坏会直接影响到后续工作的可靠性和精准度。近20年来,人脸特征点定位算法一直是机器视觉领域的研究热点,涌现出很多经典算法,具体算法可以分为以下几类:(1)基于传统技术的人脸特征点定位算法,该类算法主要基于人脸的统计形状模型方法和级联回归的方法,如经典的算法:ASM、AAM、SDM、LBF等。该类算法的特点是利用人脸器官的几何位置关系,采用统计方法和级联优化的方法获取最终的人脸特征点位置,由于算法提取人脸特征的表达能力有限,并且对人脸特征点之间的形状约束并没有考虑,该类算法的特征点定位精准度误差较大。(2)基于深度学习的人脸特征点定位算法,近本文档来自技高网...

【技术保护点】
1.一种基于全局注意力的人脸特征点定位方法,其特征在于:/n获取人脸局部图像;/n把获取到的图像输入事先训练好的基于全局注意力的人脸特征点定位模型,对于输入的人脸局部图像,经过基于全局注意力的人脸特征点定位模型前向运算后,直接输出人脸特征点位置;/n其中,/n所述基于全局注意力的人脸特征点定位模型的网络结构包括:/nconv0层是一个核尺寸为7×7,跨度为2×2的卷积层;/nmaxpool0层是一个核尺寸为2×2,跨度为2×2的最大值池化层;/nconv0层和maxpool0层共同组成了一个特征图分辨率快速下降网络;/nresblock0、resblock1、resblock2、resbloc...

【技术特征摘要】
1.一种基于全局注意力的人脸特征点定位方法,其特征在于:
获取人脸局部图像;
把获取到的图像输入事先训练好的基于全局注意力的人脸特征点定位模型,对于输入的人脸局部图像,经过基于全局注意力的人脸特征点定位模型前向运算后,直接输出人脸特征点位置;
其中,
所述基于全局注意力的人脸特征点定位模型的网络结构包括:
conv0层是一个核尺寸为7×7,跨度为2×2的卷积层;
maxpool0层是一个核尺寸为2×2,跨度为2×2的最大值池化层;
conv0层和maxpool0层共同组成了一个特征图分辨率快速下降网络;
resblock0、resblock1、resblock2、resblock3均是resnet网络的resblock残差模块;
GFM0、GFM1、GFM2、GFM3均是全局注意力融合模块;
ave-pool层是一个全局均值池化层;fc层是一个输出特征为2xN维的全连接层,N表示人脸特征点的个数。


2.根据权利要求1所述的基于全局注意力的人脸特征点定位方法,其特征在于:所述resblock残差模块的具体网络结构包括:
rconv2层是一个核尺寸为1x1,跨度为2x2的卷积层,rconv0层是一个核尺寸为3x3,跨度为2x2的卷积层,rconv1层、rconv3层、rconv4层均是一个核尺寸为3x3,跨度为1x1的卷积层,eltsum0层和eltsum1层均是合并层,其作用是把多个输入特征图按对应元素相加合并成一个输出特征图。


3.根据权利要求2所述的基于全局注意力的人脸特征点定位方法,其特征在于:所述全局注意力融合模块的具体网络结构包括:
gfmconv0、gfmconv1、gfmconv2均是核尺寸为1×1,跨度为1×1的卷积层,reshape0、reshape1、reshape2、reshape3均是特征图尺寸变换层,其作用是调整输入特征图尺寸以满足后续特征层运算的需要;
globalavepool0是一个基于特征图通道维度的全局均值池化层,globalmaxpool0是一个基于特征图通道维度的全局最大值池化层;globalavepool0层的输出特征图和globalmaxpool0层的输出特征图按通道维度进行拼接;gfmconv是一个核尺寸为7×7,跨度为1×1的卷积层,用于提取输入特征图上各个像素位置的重要程度权值;
sigmod层是sigmod类型的激活函数;scale层是按像素加权层,其作用是对输入特征图按照像素位置进行逐个加权,加权...

【专利技术属性】
技术研发人员:张卡何佳戴亮亮尼秀明
申请(专利权)人:安徽清新互联信息科技有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1