人脸识别方法技术

技术编号:30245315 阅读:19 留言:0更新日期:2021-10-09 20:28
人脸识别方法,其中,采用基于深度学习的人脸识别算法,来对图像中的人脸区域进行人脸识别,包括:确定卷积神经网络的结构;根据卷积神经网络的结构,来将一个或多个卷积结果和/或输入数值归纳到在同一个坐标系下;根据卷积神经网络的结构,来将同一个坐标系下的一个或多个卷积结果和/或输入数值进行合并;根据所述合并的结果,来计算向下一层卷积神经网络传递时的移位和偏移量的量化结果。本发明专利技术将诸如ResNet类、GoogLeNet类或Inception

【技术实现步骤摘要】
人脸识别方法


[0001]本专利技术涉及人工智能
,特别是涉及一种人脸识别方法。

技术介绍

[0002]通过深度学习能够获得人脸检测的结果,是实现人脸识别的基础。具体的,现有技术中,实现人脸检测的方法包括:使用手机,智能摄像头将外界信息采集送入到硬件的处理单元,通过深度学习方法获得人脸检测的结果,然后将结果送入到深度学习人脸识别的算法中,进行人脸识别,最终的结果是在一副图像或者视频中,用方框框上人脸的位置和大小,并在上面标出人脸的名字。
[0003]关于其中的深度学习,目前卷积神经网络在物体分类,人脸/人形检测,人脸识别,图像分割上都取得了相当高的准确度,但是如果想把卷积神经网络算法应用到边缘端上,比如智能手机、智能摄像头等,会由于模型的高精度数据表示和算法所占用的储存空间面临速度,功耗等问题。
[0004]因此,亟需一种能够在手机,智能摄像头等边缘端上实现的人脸检测方法。
[0005]目前公认的成功并流行的卷积神经网络结构有如下几种,AlexNet,VGG,ResNet和GoogLeNet类。
[0006]其中,AlexNet是较早的卷积神经网络,它首先是5个卷积层,后面连接着3个全连层。
[0007]VGG对比于AlexNet的改进是采用多个连续的3x3卷积核来代替掉AlexNet中的较大的卷积核(11x11,5x5)。
[0008]ResNet的出现,可以让我们去训练更加深的网络,在VGG的基础上,出现了短路连接插入形成残差网络的新结构。
[0009]GoogLeNet基于深度学习网络中大部分的输出的激活值是冗余的,设计了一种称为Inception的模块,这个模块使用密集的小尺寸卷积核来近似稀疏的CNN。
[0010]现有技术中的深度学习网络架构的偏移量的量化算法都是针对于AlexNet,VGG结构的偏移量的量化算法。

技术实现思路

[0011]本专利技术解决的技术问题是:如何在智能手机、智能摄像头等边缘端上实现高性能的人脸检测。
[0012]为了解决上述技术问题,本专利技术实施例提供一种人脸识别方法,包括:
[0013]获得待识别的图像;
[0014]通过人脸检测手段,来检测图像中的人脸区域;
[0015]从人脸区域中提取人脸表征;
[0016]采用基于深度学习的人脸识别算法,来对图像中的人脸区域进行人脸识别;
[0017]其中,所述采用基于深度学习的人脸识别算法,来对图像中的人脸区域进行人脸
识别包括:
[0018]确定卷积神经网络的结构;
[0019]根据卷积神经网络的结构,来将一个或多个卷积结果和/或输入数值归纳到在同一个坐标系下;
[0020]根据卷积神经网络的结构,来将同一个坐标系下的一个或多个卷积结果和/或输入数值进行合并;
[0021]根据所述合并的结果,来计算向下一层卷积神经网络传递时的移位和偏移量的量化结果。
[0022]可选的,所述获得待识别的图像包括:
[0023]采集视频流;
[0024]获得视频流中的图像帧,作为待识别的图像。
[0025]可选的,所述根据卷积神经网络的结构,来将一个或多个卷积结果和/或输入数值归纳到在同一个坐标系下;包括:
[0026]对于ResNet类卷积神经网络,通过以下公式,来将输入数值和卷积结果归纳到同一个坐标系下:
[0027]Y

=Y<<shift
(a-b),pos
[0028]Y

=Y>>shift
|a-b|,neg
[0029]其中,Y`表示第二归纳结果,Y表示第二卷积结果,a表示输入数值的移位,b表示第二卷积结果的移位。
[0030]可选的,所述根据卷积神经网络的结构,来将同一个坐标系下的一个或多个卷积结果和/或输入数值进行合并包括:
[0031]对于ResNet类卷积神经网络,通过以下公式,来将同一个坐标系下的输入数值和卷积结果进行合并:
[0032]Z=X+Y

[0033]其中,Z表示合并结果,X表示输入数值,Y`表示第二归纳结果。
[0034]可选的,所述根据卷积神经网络的结构,来将一个或多个卷积结果和/或输入数值归纳到在同一个坐标系下;包括:
[0035]对于ResNet类卷积神经网络,通过以下公式,来将输入数值和卷积结果归纳到同一个坐标系下:
[0036][0037][0038]其中,X`表示第一归纳结果,Y`表示第二归纳结果,Y表示第二卷积结果,a表示输入数值的移位,b表示第二卷积结果的移位。
[0039]可选的,所述根据卷积神经网络的结构,来将同一个坐标系下的一个或多个卷积结果和/或输入数值进行合并包括:
[0040]对于ResNet类卷积神经网络,通过以下公式,来将同一个坐标系下的输入数值和卷积结果进行合并:
[0041]Z=X

+Y

[0042]其中,Z表示合并结果,X`表示第一归纳结果,Y`表示第二归纳结果。
[0043]可选的,所述根据卷积神经网络的结构,来将一个或多个卷积结果和/或输入数值归纳到在同一个坐标系下包括:
[0044]对于Inception类卷积神经网络,通过以下公式,来将输入数值和卷积结果归纳到同一个坐标系下:
[0045]Y

=Y<<shift
(a-b),pos
[0046]Y

=Y>>shift
|a-b|,neg
[0047]Z

=Y<<shift
(a-c),pos
[0048]Z

=Y>>shift
|a-c|,neg
[0049]其中,Y`表示第二归纳结果,Z`表示第三归纳结果,Y表示第二卷积结果,a表示输入数值的移位,b表示第二卷积结果的移位,c表示第三卷积结果的移位。
[0050]可选的,所述根据卷积神经网络的结构,来将同一个坐标系下的一个或多个卷积结果和/或输入数值进行合并包括:
[0051]对于Inception类卷积神经网络,通过以下公式,来将同一个坐标系下的输入数值和卷积结果进行合并:
[0052]Z=X+Y

+Z

[0053]其中,Z表示合并结果,X表示输入数值,Y`表示第二归纳结果,Z`表示第三归纳结果。
[0054]可选的,所述根据卷积神经网络的结构,来将一个或多个卷积结果和/或输入数值归纳到在同一个坐标系下包括:
[0055]对于Inception类卷积神经网络,通过以下公式,来将输入数值和卷积结果归纳到同一个坐标系下:
[0056][0057][0058][0059]其中,X`表示第一归纳结果,Y`表示第二归纳结果,Z`表示第三归纳结果,Y表示第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种人脸识别方法,其特征在于,包括:获得待识别的图像;通过人脸检测手段,来检测图像中的人脸区域;从人脸区域中提取人脸表征;采用基于深度学习的人脸识别算法,来对图像中的人脸区域进行人脸识别;其中,所述采用基于深度学习的人脸识别算法,来对图像中的人脸区域进行人脸识别包括:确定卷积神经网络的结构;根据卷积神经网络的结构,来将一个或多个卷积结果和/或输入数值归纳到在同一个坐标系下;根据卷积神经网络的结构,来将同一个坐标系下的一个或多个卷积结果和/或输入数值进行合并;根据所述合并的结果,来计算向下一层卷积神经网络传递时的移位和偏移量的量化结果。2.如权利要求1所述的人脸识别方法,其特征在于,所述获得待识别的图像包括:采集视频流;获得视频流中的图像帧,作为待识别的图像。3.如权利要求1所述的人脸识别方法,其特征在于,所述根据卷积神经网络的结构,来将一个或多个卷积结果和/或输入数值归纳到在同一个坐标系下;包括:对于ResNet类卷积神经网络,通过以下公式,来将输入数值和卷积结果归纳到同一个坐标系下:Y

=Y<<shift
(a-b),pos
Y

=Y>>shift
|a-b|,neg
其中,Y`表示第二归纳结果,Y表示第二卷积结果,a表示输入数值的移位,b表示第二卷积结果的移位。4.如权利要求3所述的人脸识别方法,其特征在于,所述根据卷积神经网络的结构,来将同一个坐标系下的一个或多个卷积结果和/或输入数值进行合并包括:对于ResNet类卷积神经网络,通过以下公式,来将同一个坐标系下的输入数值和卷积结果进行合并:Z=X+Y

其中,Z表示合并结果,X表示输入数值,Y`表示第二归纳结果。5.如权利要求1所述的人脸识别方法,其特征在于,所述根据卷积神经网络的结构,来将一个或多个卷积结果和/或输入数值归纳到在同一个坐标系下;包括:对于ResNet类卷积神经网络,通过以下公式,来将输入数值和卷积结果归纳到同一个坐标系下:坐标系下:
其中,X`表示第一归纳结果,Y`表示第二归纳结果,Y表示第二卷积结果,a表示输入数值的移位,b表示第二卷积结果的移位。6.如权利要求5所述的人脸识别方法,其特征在于,所述根据卷积神经网络的结构,来将同一个坐标系下的一个或多个卷积结果和/或输入数值进行合并包括:对于ResNet类卷积神经网络,通过以下公式,来将同一个坐标系下的输入数值和卷积结果进行合并:Z=X

+Y

其中,Z表示合并结果,X`表示第一归纳结果,Y`表示第二归纳结果。7.如权利要求1所述的人脸识别方法,其特征在于,所述根据卷积神经网络的结构,来将一个或多个卷积结果和/或输入数值归纳到在同一个坐标系下包括:对于Inception类卷积神经网络,通过以下公式,来将输入数值和卷积结果归纳到同一个坐标系下:Y

=Y<<shift
(a-b),pos
Y

=Y>>shift
|a-b|,neg
Z

=Y<<shift
(a-c),pos
Z

=Y>>shift
|a-c|,neg
其中,Y`表示第二归纳结果,Z`表示第三归纳结果,Y表示第二卷积结果,a表示输入数值的移位,b表示第二卷积结果的移位,c表示第三卷积结果的移位。8.如权利要求7所述的人脸识别方法,其特征在于,所述根据卷积神经网络的结构,来将同一个坐标系下的一个或多个卷积结果和/或输入数值进行合并包括:对于I...

【专利技术属性】
技术研发人员:吴同达声蔚
申请(专利权)人:上海齐感电子信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1