一种适合前端的人脸识别网络结构制造技术

技术编号:27569160 阅读:27 留言:0更新日期:2021-03-09 22:15
本发明专利技术提供一种适合前端的人脸识别网络结构,所述网络中使用了下采样直达全连接层的思想,将每个小模块结果的特征图经过下采样后直接与全连接层连接,从而有效的利用了每个小模块提取的特征。在每个卷积中,使用交叉拼接上面卷积的结果,有效避免局部特征的加强和特征的消失。每个模块的输入中都拼接上面各个模块的结果,从而避免梯度的消失。从而避免梯度的消失。从而避免梯度的消失。

【技术实现步骤摘要】
一种适合前端的人脸识别网络结构


[0001]本专利技术涉及人脸图像识别
,特别涉及一种适合前端的人脸识别网络结构。

技术介绍

[0002]随着科技的不断发展,特别是计算机视觉技术的发展,人脸识别技术广泛应用于信息安全、电子认证等各个领域,图像特征提取方法具有良好的识别性能。人脸识别是指基于已知的人脸样本库,利用图像处理和/或模式识别技术从静态或者动态场景中,识别一个或多个人脸的技术。但是目前的人脸识别技术包括1、应用到人脸识别中的各种网络:Inception、ResNet、VGG、MobileNet、AlexNet、GoogLeNet、Inception-ResNet;2、人脸识别训练的框架结构有facenet和insightface。目前人脸识别技术包括的缺点有:1、当前前端的网络,使用了独立卷积、特征图加法、各种尺寸的卷积核等,不适合很多AI芯片,导致AI芯片无法实现其网络。2、计算量相对较大。3、识别率相对较低。

技术实现思路

[0003]为了解决上述现有技术中存在的问题,本专利技术的目的在于:
[0004]1、使用的算子很少,只有3
×
3的卷积核、采用特征图拼接(concat)操作、下采样操作和全连接操作。
[0005]2、计算量小,计算量不到1G的乘法,模型(参数为浮点)大小只有29M。
[0006]3、提高人脸识别率使之达到99.8%。
[0007]本专利技术提供一种适合前端的人脸识别网络结构,所述网络使用下采样直达全连接层的形式,在所述网络中设置网络模块,每个模块的结果的特征图经过下采样处理后,直接与全连接层连接,在每个卷积处理中,使用交叉拼接上面卷积处理的结果,每个模块的输入中都拼接上面各个模块的结果。
[0008]所述的卷积处理为所述每个模块使用的卷积都是3
×
3的卷积核的处理,卷积后进行归一化处理,再进行激励函数的处理。
[0009]在每层卷积的设计中,单独设计输出特征图个数。
[0010]所述的下采样处理为处理内核大小为2
×
2、步长为2的下采样处理。
[0011]进一步包括首先对输入的图像数据data先进行均衡化处理;对data进行卷积核为3
×
3、步长为1的卷积处理,生成特征图。
[0012]所述的网络模块进一步包括:经历第一种降低特征图长宽处理;所述第一种降低特征图长宽处理包括:
[0013][1.1]将图像数据经过卷积处理生成的特征图进行卷积核为3
×
3、步长为2的卷积处理,生成特征图的深度为32,生成的特征图为48
×
48
×
32;
[0014][1.2]将[1.1]中所述的图像数据经过卷积处理的特征图进行下采样处理,处理内核大小为2
×
2、步长那个为2的卷积处理,生成特征图的深度为32,生成的特征图为48
×
48
×
64。
[0015]所述的网络模块进一步包括:经历第二种降低特征图长宽处理;所述的第二种降低特征图长宽处理进一步包括:
[0016]输入数据分别in_data1,in_data2,in_data3,N;
[0017][2.1]将in_data1进行卷积核为3
×
3、步长为2的卷积处理,生成特征图的深度为N,生成的特征图为W
×
H
×
N;
[0018][2.2]将in_data2进行下采样处理,处理内核大小为2
×
2、步长为2的下采样处理,生成特征图与输入特征图的深度一样,这里设为M,生成的特征图为W
×
H
×
M;
[0019][2.3]将in_data3进行下采样处理,处理内核大小为2
×
2、步长为2的下采样处理,生成特征图与输入特征图的深度一样,这里设为M,生成的特征图为W
×
H
×
M。
[0020]所述的网络模块包括:第一模块,第二模块,第三模块和第四模块。
[0021]所述的网络的最后一个模块最终全连接到192个数据上。
[0022]本申请的优势在于:
[0023]1.网络中使用了下采样直达全连接层的思想,将每个小模块结果的特征图经过下采样后直接与全连接层连接,从而有效的利用了每个小模块提取的特征。在每个卷积中,使用交叉拼接上面卷积的结果,有效避免局部特征的加强和特征的消失。每个模块的输入中都拼接上面各个模块的结果,从而避免梯度的消失。
[0024]2.使用单独设计输出特征图个数的方案,可以有效的降低计算量,最大程度的提高卷积提取特征的效率。
附图说明
[0025]此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,并不构成对本专利技术的限定。
[0026]图1是本专利技术的网络结构的示意框图。
[0027]图2-1至图2-22是本专利技术涉及的具体实施方式的流程框图。
具体实施方式
[0028]在人脸识别领域,目前一些相关的
的术语包括:
[0029]1、深度学习:深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。
[0030]2、卷积核:卷积核是用来做图像处理时的矩阵,与原图像做运算的参数。卷积核通常是一个列矩阵数组成(例如3*3的矩阵),该区域上每个方格都有一个权重值。矩阵形状一般是1
×
1,3
×
3,5
×
5,7
×
7,1
×
3,3
×
1,2
×
2,1
×
5,5
×
1,


[0031]3、卷积:将卷积核的中心放置在要计算的像素上,一次计算核中每个元素和其覆盖的图像像素值的乘积并求和,得到的结构就是该位置的新像素值,这个过程称为卷积。
[0032]4、特征图:输入数据通过卷积计算后得到的结果称之为特征图,数据通过全连接后生成的结果也称为特征图。特征图大小一般表示为长
×

×
深度,或1
×
深度。
[0033]5、步长:卷积核中心位置再坐标上移动的长度。
[0034]6:两端非对齐处理:图像或数据通过卷积核大小为3且步长为2处理时,会导致两侧数据不够,此时采用丢弃两侧或一侧数据,这种现象叫做两端非对其处理。
[0035]7、前端人脸检测:在AI芯片或普通芯片上使用的人脸检测功能称之为前端人脸检测,前端人脸检测的速度和正确率都比云端服务器人脸检测的低。
[0036]8、激励函数:神经网络中的每个节点接受输入值,并将输本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种适合前端的人脸识别网络结构,其特征在于,所述网络使用下采样直达全连接层的形式,在所述网络中设置网络模块,每个模块的结果的特征图经过下采样处理后,直接与全连接层连接,在每个卷积处理中,使用交叉拼接上面卷积处理的结果,每个模块的输入中都拼接上面各个模块的结果。2.根据权利要求1所述的一种适合前端的人脸识别网络结构,其特征在于,所述的卷积处理为所述每个模块使用的卷积都是3
×
3的卷积核的处理,卷积后进行归一化处理,再进行激励函数的处理。3.根据权利要求1所述的一种适合前端的人脸识别网络结构,其特征在于,在每层卷积的设计中,单独设计输出特征图个数。4.根据权利要求1所述的一种适合前端的人脸识别网络结构,其特征在于,所述的下采样处理为处理内核大小为2
×
2、步长为2的下采样处理。5.根据权利要求1所述的一种适合前端的人脸识别网络结构,其特征在于,进一步包括首先对输入的图像数据data先进行均衡化处理;对data进行卷积核为3
×
3、步长为1的卷积处理,生成特征图。6.根据权利要求1所述的一种适合前端的人脸识别网络结构,其特征在于,所述的网络模块进一步包括:经历第一种降低特征图长宽处理;所述第一种降低特征图长宽处理包括:[1.1]将图像数据经过卷积处理生成的特征图进行卷积核为3
×
3、步长为2的卷积处理,生成特征图的深度为32,生成的特征图为48
×
48
×
32;[1.2]将[1.1]中所述的图像数据经过卷积处理的特征...

【专利技术属性】
技术研发人员:田凤彬
申请(专利权)人:北京君正集成电路股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1