使用人工神经网络进行面部识别制造技术

技术编号：21176596 阅读：56 留言：0更新日期：2019-05-22 12:09

通过卷积神经网络的操作，可自动进行人脸识别。卷积神经网络包含有数个层组。其中，第一、第二和第三层组各包含一个卷积层、一个最大池化层和一个参数修正线性单元激活函数层。第四层组包含一个卷积层和一个参数修正线性单元激活函数层。

Face Recognition Using Artificial Neural Network

Face recognition can be carried out automatically through the operation of convolution neural network. Convolutional neural networks consist of several layers. The first, second and third layers contain a convolution layer, a maximum pooling layer and a parameter correction linear unit activation function layer. The fourth layer consists of a convolution layer and a parameter correction linear unit activation function layer.

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】使用人工神经网络进行面部识别
此文所述的实施例，一般都涉及信息处理，尤其涉及机器视觉和机器学习系统，并且这些实施例还将具体的方法与实际运用联系在一起。实际运用包括人脸识别。背景人脸识别系统正面临着越来越多的应用。其应用范围十分广泛，并且多种多样，从执法、安全或访问控制，到照片和视频的组织安排、网上约会服务以及无数其他应用。人脸识别不同于人脸检测，人脸检测的目标是从图像或视频帧中简单地检测人脸的存在，而人脸识别的目标则是从大量被识别的个体中通过图像或视频帧来识别唯一的个体。在这方面已经运用了许多不同的计算方法，如最邻近分类器、支持向量机、人工神经网络(ANN)以及其他。所有的各种计算方法中，卷积人工神经网络表现得特别突出和优秀。卷积人工神经网络(以下简称为“卷积神经网络(CNN)”)包括有一种可训练架构。通过某些应用，这种架构可学习到不变特征。卷积神经网络通常包含有相互交替的卷积层、非线性层和特征池化层。每一层都由元素或“神经元”组成。这些元素或神经元都含有可学习的权重和偏置。尤其是当被用于图像识别时，卷积神经网络就会使用多层小神经元集合去处理输入图像的各部分。...

【技术保护点】
1.一个自动人脸识别系统，所述系统包括：含有至少一个处理器核心、一个数据存储区以及输入/输出设备的执行硬件，所述执行硬件被设置为实现一个卷积神经网络；所述卷积神经网络包括：一个第一层组被设置为用来接收包含人脸的图像，并作为其输入；所述图像有多个输入通道和一个输入像素量；所述第一层组包括一个第一卷积层、一个第一最大池化层和一个第一参数修正线性单元激活函数，并且第一层组被设置用来产生一种输出，所述输出包含一个第一预定义通道量和包括和一个像素量，所述第一预定义通道量比输入通道数量多至少80倍，所述像素量低于输入像素量至少4.2倍；一个第二层组被设置为接收第一层组的输出，并作为其输入；所述第二层组包括...

【技术特征摘要】
【国外来华专利技术】1.一个自动人脸识别系统，所述系统包括：含有至少一个处理器核心、一个数据存储区以及输入/输出设备的执行硬件，所述执行硬件被设置为实现一个卷积神经网络；所述卷积神经网络包括：一个第一层组被设置为用来接收包含人脸的图像，并作为其输入；所述图像有多个输入通道和一个输入像素量；所述第一层组包括一个第一卷积层、一个第一最大池化层和一个第一参数修正线性单元激活函数，并且第一层组被设置用来产生一种输出，所述输出包含一个第一预定义通道量和包括和一个像素量，所述第一预定义通道量比输入通道数量多至少80倍，所述像素量低于输入像素量至少4.2倍；一个第二层组被设置为接收第一层组的输出，并作为其输入；所述第二层组包括一个第二卷积层、一个第二最大池化层和一个第二参数修正线性单元激活函数；所述第二层组被设置用来产生一种输出，所述输出包含一个第二预定义通道量和包括和一个像素量，所述第二预定义通道量比第一预定义通道量多至少3倍，所述像素量低于第一层组输出的像素量至少4.2倍；一个第三层组被设置为接收第二层组的输出，并作为其输入，所述第三层组包括一个第三卷积层、一个第三最大池化层和一个第三参数修正线性单元激活函数，所述第三层组被设置用来产生一种输出，所述输出包含一个第三预定义通道量和包括和一个像素量，所述第三预定义通道量比第二预定义通道量多至少2倍，所述像素量低于第二层组输出的像素量至少3.5倍；以及一个第四层组被设置为接收第三层组的输出，并作为其输入，所述第四层组包括一个第四卷积层和一个第四参数修正线性单元激活函数，所述第四层组被设置用来产生一种输出，这种输出包含一个第四预定义通道量和包括和一个像素量，所述第四预定义通道量比第三预定义通道量多至少2倍，所述像素量比第三层组输出的像素量少1.1倍。2.根据权利要求1所述系统，所述卷积神经网络进一步包括：一个第五层组，所述第五层组包括一个第一全连接层，所述第一全连接层产生一个包含代表图像的特征矢量的输出，并且所述系统进一步包括一个可搜索数据库，所述可搜索数据库包含有特征矢量，以及多个分别代表其他人脸图像的其他特征矢量。3.根据权利要求2所述的系统，进一步包括：一个搜索索引编辑器，所述搜索索引编辑器被设置为在可搜索数据库中特征矢量的创建一个搜索索引。4.根据权利要求2所述的系统，进一步包括：一个搜索引擎，所述搜索引擎被设置为在可搜索数据库中针对目标特征矢量的创建一个查询；以及一个比较器，所述比较器被设置为在目标特征矢量与至少一个作为查询结果返回的参考特征矢量之间产生一个相似性度量值，并且将这个相似性度量值与相似性标准进行对照比较，如果达到了相似性标准，则表明人脸已识别。5.根据权利要求2所述的系统，所述第五层组包括一个第五参数修正线性单元激活函数，一个dropout操作，一个第二全连接层和一个softmax层。6.根据权利要求2所述的系统，所述卷积神经网络在训练集构建设置中和人脸识别设置中是可设置的，所述训练集构建设置包括训练部分，而人脸识别设置中不包括训练部分。7.根据权利要求6所述的系统，所述卷积神经网络的训练集构建设置被用于为可搜索数据库生成参考特征矢量。8.根据权利要求1所述的系统，其中：第一卷积层被设置为产生一个256个通道的输出；第二卷积层被设置为产生一个768个通道的输出；第三卷积层被设置为产生一个1536个通道的输出；以及第四卷积层被设置为产生一个3072个通道的输出。9.根据权利要求1所述的系统，所述第一层组的输入包括经过修剪的人脸图像。10.根据权利要求1所述的系统，其中：第一卷积层被设置为使用一个输入步长为1的4x4的滤波器，以生成一个带256个通道的77x77像素的输出；第一最大池化层被设置为使用一个步长为2的2x2的滤波器，以生成带256个通道的39x39的输出；第二卷积层被设置为使用一个步长为1的3x3滤波器，以生成带768个通道的37x37像素的输出；第二最大池化层被设置为使用一个步长为2的2x2滤波器，以生成带768个通道的19x19像素的输出；第三卷积层被设置为使用一个步长为1的3x3滤波器，以生成带1536个通道的17x17像素的输出；第三最大池化层被设置为使用一个步长为2的2x2滤波器，以生成带3072个通道的9x9像素的输出；以及第四卷积层被设置为使用一个步长为1的2x2滤波器，以生成带3072个通道的8x8像素的输出。11.根据权利要求1所述的系统，进一步包括：一个人脸检测器，所述检测器被设置为分析捕捉到的图像，检查图像是否存在人脸的视觉特征表示，然后产生一个输出，并且将所述输出作为含有人脸的图像送到卷积神经网络，作为卷积神经网络的输入。12.一个自动人脸识别的机器实现方法，所述方法包括：通过计算平台接收包含人脸的图像，所述图像有多个通道和一个输入像素量；通过卷积神经网络的一个第一层组处理图像，卷积神经网络的第一层组包括一个卷积层、一个最大池化层和一个参数修正线性单元激活函数层，在计算平台上被执行，以产生一个第...

【专利技术属性】
技术研发人员：A·I·库哈伦科，A·A·乌尔丁，S·A·奥瓦连科，
申请(专利权)人：NTECH实验室有限责任公司，
类型：发明
国别省市：俄罗斯,RU

全部详细技术资料下载我是这个专利的主人