一种人脸检测的方法、装置及设备制造方法及图纸

技术编号:18576391 阅读:55 留言:0更新日期:2018-08-01 11:26
本申请公开了一种人脸检测的方法、装置及设备,用以解决现有技术中MTCNN的全连接层限制输入维度而影响检测效果的问题。所述目标识别方法包括:获取待检测图像;将所述待检测图像进行前置处理,并将得到的输出结果输入至卷积网络的卷积层;将通过所述卷积层处理得到的输出结果输入至所述卷积网络中包含有设定卷积核的特殊卷积层,得到至少一个特征矩阵;根据所述至少一个特征矩阵得到特征向量,并将所述特征向量输入至所述卷积网络的Softmax层;根据所述Softmax层的输出结果,对所述待检测图像进行人脸检测。

A method, device and equipment for face detection

The present application discloses a method, device and equipment for face detection to solve the problem that the full connection layer of MTCNN in the existing technology restricts the input dimension and affects the detection effect. The target recognition method includes: obtaining the image to be detected, preprocessing the image to be detected, and input the resulting output to the convolution layer of the convolution network; input the output results obtained through the coiling layer to a special convolution layer containing the convolution kernel in the convolution network, and At least one feature matrix; a feature vector is obtained according to the at least one characteristic matrix, and the feature vector is input to the Softmax layer of the convolution network, and face detection is performed on the detected image according to the output result of the Softmax layer.

【技术实现步骤摘要】
一种人脸检测的方法、装置及设备
本申请涉及计算机
,尤其涉及一种人脸检测的方法、装置及设备。
技术介绍
当前,图像处理技术已经应用在诸多领域中,如人脸检测、人工智能、身份识别、目标提取等,为人们在这些领域中的工作提供了可靠的依据与指导。随着计算机技术的不断发展,图像处理技术在这些领域的地位也将越发重要。在人脸检测领域所包含众多人脸检测算法中,多任务级联卷积网络(Multi-taskCascadedConvolutionalNetworks,MTCNN)在检测速度和检测性能上的表现十分出众,因此受到人们的极大欢迎。在MTCNN中分为ProposalNetwork(P-net)、RefineNetwork(R-net)以及OutputNetwork(O-net)三个级联卷积网络,待检测图像首先经过第一级卷积网络P-net的处理后,得到多个人脸候选框,而后需要将得到的多个人脸候选框所框定的图像作为输入,输入到下一级卷积网络R-net进行处理,得到精确人脸候选框,进而将得到的精确人脸候选框所框定的图像作为输入,再输入到最后一级卷积网络O-net进行处理,最终得到能够在该待检测图像中标识出人脸的人脸框。上述R-net和O-net中设有全连接层,全连接层通常要求输入至全连接层的数据的维度是固定的,这样也就限制了输入至R-net和O-net的数据的维度。为此,通常需要将上一级卷积网络得到的数据调整成同一维度,再输入至下一级卷积网络中。例如,通过P-net得到尺寸不同的人脸候选框后,需要将这些人脸候选框所框定的图像调整成同一尺寸(即俗称为resize),而后再将调整后的各人脸候选框所框定的图像输入至R-net中。但是,若是将不同尺寸的人脸候选框所框定的图像resize至同一尺寸,这必然会造成各人脸候选框所框定的图像中一些信息的损失,从而可能影响最终的检测效果。
技术实现思路
本申请实施例提供一种人脸检测的方法、装置及设备,用于解决现有技术中,MTCNN的全连接层限制输入维度而影响检测效果的问题。本申请实施例采用下述技术方案:本申请实施例提供的一种人脸检测的方法,包括:获取待检测图像;将所述待检测图像进行前置处理,并将得到的输出结果输入至卷积网络的卷积层;将通过所述卷积层处理得到的输出结果输入至所述卷积网络中包含有设定卷积核的特殊卷积层,得到至少一个特征矩阵;根据所述至少一个特征矩阵得到特征向量,并将所述特征向量输入至所述卷积网络的Softmax层;根据所述Softmax层的输出结果,对所述待检测图像进行人脸检测。本申请实施例提供的一种人脸检测的装置,包括:获取模块,获取待检测图像;处理模块,将所述待检测图像进行前置处理,并将得到的输出结果输入至卷积网络的卷积层;第一输入模块,将通过所述卷积层处理得到的输出结果输入至所述卷积网络中包含有设定卷积核的特殊卷积层,得到至少一个特征矩阵;第二输入模块,根据所述至少一个特征矩阵得到特征向量,并将所述特征向量输入至所述卷积网络的Softmax层;检测模块,根据所述Softmax层的输出结果,对所述待检测图像进行人脸检测。本申请实施例提供的一种人脸检测的设备,包括一个或多个存储器以及处理器,所述存储器存储程序,并且被配置成由所述一个或多个处理器执行以下步骤:获取待检测图像;将所述待检测图像进行前置处理,并将得到的输出结果输入至卷积网络的卷积层;将通过所述卷积层处理得到的输出结果输入至所述卷积网络中包含有设定卷积核的特殊卷积层,得到至少一个特征矩阵;根据所述至少一个特征矩阵得到特征向量,并将所述特征向量输入至所述卷积网络的Softmax层;根据所述Softmax层的输出结果,对所述待检测图像进行人脸检测。本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:由于现有技术中全连接层对输入的维度限制,通常需要将卷积层处理得到的输出结果调整到固定的维度输入到全连接层中,并得到特征向量。而在本申请实施例中,可将卷积层得到的输出结果输入至包含有设定卷积核的特殊卷积层中,得到至少一个特征矩阵,并根据得到的特征矩阵再得到特征向量,无需将该输出结果调整成固定的维度再输入至该特殊卷积层。这样使得在人脸检测的过程中,信息不会因调整输入维度而受到损失,从而提高了人脸检测的效果。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1为本申请实施例提供的一种人脸检测的流程示意图;图2为本申请实施例提供的将全连接层替换为特殊卷积层的示意图;图3为本申请实施例提供的一种人脸检测的装置示意图;图4为本申请实施例提供的一种人脸检测的设备示意图。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。图1为本申请实施例提供的一种人脸检测的流程示意图,具体包括以下步骤:S101:获取待检测图像。在本申请实施例中,可以获取待检测图像,并对待检测图像进行人脸检测。其中,获取待检测图像的途径可以有很多,例如,可以根据用户执行的输入操作,获取该待检测图像,也可以预设的图像采集装置进行图像采集,并将采集到的图像作为待检测图像。在本申请实施例中,进行人脸检测的执行主体可以是终端、服务器等设备,为了方便描述,后续将以终端作为执行主体,对本申请实施例提供的数据处理方法进行说明。在获取到待检测图像后,终端可以将该待检测图像进行放大或缩小,得到不同尺寸的各待检测图像,也即得到俗称的图像金字塔。而之所以需要对该待检测图像进行尺寸调整,得到不同尺寸的各待检测图像,是因为在实际应用中,该待检测图像中实际上可能包含有多个人脸,其中,尺寸过大或过小的人脸通常较难检测,需要将这些人脸调整成合适的尺寸。因此,可以通过将该待检测图像进行放大或缩小的方式,将该待检测图像中一些尺寸较小或尺寸过大的人脸调整到合适的尺寸,以使终端后续能够有效的检测出这些人脸。S102:将所述待检测图像进行前置处理,并将得到的输出结果输入至卷积网络的卷积层。终端获取到尺寸不一的各待检测图像后,可以将各待检测图像进行前置处理,得到相应的输出。其中,这里提到的前置处理可以是指:终端可以通过MTCNN中第一级卷积网络(也即P-net)所包含的各卷积层以及Softmax层,分别对各待检测图像,得到多个尺寸不同的人脸候选框。由于各人脸候选框是通过不同尺寸的待检测图像得出的,所以,终端可以按照待检测图像的原始尺寸,将各人脸候选框进行放大或缩小,以确定出各人脸候选框在该待检测图像上原始尺寸的大小,继而将经过调整后的各人脸候选框呈现在原始尺寸的待检测图像中。在实际应用中,待检测图像经过P-net的卷积处理后,通常会得到多个人脸候选框以及各人脸候选框对应的边界回归向量。终端可以将各人脸候选框根据边界回归向量进行校准,并通过非极大值抑制(NonMaximumSuppression,NMS),将一些重叠度比较高的人脸候选框进行合并本文档来自技高网
...

【技术保护点】
1.一种人脸检测的方法,其特征在于,所述方法用于通过多任务级联卷积网络MTCNN进行人脸检测,包括:获取待检测图像;将所述待检测图像进行前置处理,并将得到的输出结果输入至卷积网络的卷积层;将通过所述卷积层处理得到的输出结果输入至所述卷积网络中包含有设定卷积核的特殊卷积层,得到至少一个特征矩阵;根据所述至少一个特征矩阵得到特征向量,并将所述特征向量输入至所述卷积网络的Softmax层;根据所述Softmax层的输出结果,对所述待检测图像进行人脸检测。

【技术特征摘要】
1.一种人脸检测的方法,其特征在于,所述方法用于通过多任务级联卷积网络MTCNN进行人脸检测,包括:获取待检测图像;将所述待检测图像进行前置处理,并将得到的输出结果输入至卷积网络的卷积层;将通过所述卷积层处理得到的输出结果输入至所述卷积网络中包含有设定卷积核的特殊卷积层,得到至少一个特征矩阵;根据所述至少一个特征矩阵得到特征向量,并将所述特征向量输入至所述卷积网络的Softmax层;根据所述Softmax层的输出结果,对所述待检测图像进行人脸检测。2.如权利要求1所述的方法,其特征在于,根据所述至少一个特征矩阵得到特征向量,并将所述特征向量输入至所述卷积网络的Softmax层,具体包括:针对每个特征矩阵,将该特征矩阵中包含的各元素进行求和,得到特征值;根据得到的各特征值,确定特征向量,并将所述特征向量输入至所述卷积网络的Softmax层。3.如权利要求1~2任一所述的方法,其特征在于,所述前置处理包括:将所述待检测图像输入至所述MTCNN中的P-net进行处理,所述卷积网络包括:所述MTCNN中的R-net和/或O-net;或所述前置处理包括:将所述待检测图像通过所述MTCNN中的P-net以及R-net进行处理,所述卷积网络包括:所述MTCNN中的O-net。4.如权利要求3所述的方法,其特征在于,所述设定卷积核为1×1卷积核。5.如权利要求1所述的方法,其特征在于,所述MTCNN中每个卷积网络均对应至少一个评价指标,各卷积网络对应的评价指标相同;每个卷积网络对应的同一评价指标的权重不完全相同;每个评价指标均对应损失函数;所述方法还包括:根据所述MTCNN中每个卷积网络的各评价指标对应的损失函数以及每个卷积网络的各评价指标对应的权重,对所述MTCNN中的各卷积网络进行训练,所述MTCNN包含的各卷积网络包括:P-net、R-net、O-net。6.一种人脸检测的装置,其特征在于,所述装置用于...

【专利技术属性】
技术研发人员:吴香莲彭莉
申请(专利权)人:新智数字科技有限公司
类型:发明
国别省市:河北,13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1