采用嵌入式系统中的小规模卷积神经网络模块的人脸检测技术方案

技术编号：16874491 阅读：39 留言：0更新日期：2017-12-23 12:15

本申请实施例提供了基于使用小规模硬件卷积神经网络(CNN)模块的人脸检测系统的多个示例，其中该模块被配置到多任务级联CNN模块中。在一些实施例中，基于子图像的CNN系统可被配置为等同于不需划分而处理整个输入图像的大规模CNN，从而该基于子图像的CNN系统的输出可与大规模CNN的输出完全相同。基于此，本申请公开的一些实施例将该基于子图像的CNN系统和技术应用到级联CNN或多任务级联CNN(MTCNN)的一级或多级中，从而输入到该级联CNN或者该MTCNN的指定级中的更大输入图像可以被划分成一组具有更小尺寸的子图像。因此，该级联CNN或者该MTCNN的每一级都可以采用相同的小规模硬件CNN模块，该小规模硬件CNN模块受最大输入图像尺寸限制。

Face detection using small scale convolution neural network module in embedded system

The application example provides multiple examples of face detection system based on the small scale hardware convolution neural network (CNN) module, which is configured to multitask concatenated CNN module. In some embodiments, the sub image based CNN system can be configured to equate to the large-scale CNN that processes the whole input image without division, so that the output of the CNN system based on sub images can be exactly the same as the output of large-scale CNN. Based on this, some embodiments of the disclosed the sub image CNN system and application based on cascade CNN or multi task CNN cascade (MTCNN) one or more stages, thus more input to the input image of the cascade CNN or the MTCNN is specified in the class can be divided into a group with the smaller size of the sub image. Therefore, every level of the cascade CNN or MTCNN can adopt the same small scale hardware CNN module, which is limited by the largest input image size. The CNN module is small.

全部详细技术资料下载

【技术实现步骤摘要】
采用嵌入式系统中的小规模卷积神经网络模块的人脸检测优先权要求及相关专利申请本申请与正在审查中的美国专利申请15/441,194(申请名称：基于有限资源小规模CNN模块的卷积神经网络(CNN)系统(CONVOLUTIONALNEURALNETWORK(CNN)SYSTEMBASEDONRESOLUTION-LIMITEDSMALL-SCALECNNMODULES)；专利技术人：王星、吴谦伟、梁杰；申请日：2017年2月23日)相关。上述申请以引用形式被并入本申请，并作为本申请的一部分。本专利申请要求美国临时专利申请62/428,497(申请名称：基于有限资源小规模CNN模块的卷积神经网络(CNN)(CONVOLUTIONALNEURALNETWORKS(CNN)BASEDONRESOLUTION-LIMITEDSMALL-SCALECNNMODULES)；专利技术人：王星、吴谦伟、梁杰；申请日：2016年11月30日)的优先权。
本公开一般涉及机器学习和人工智能领域，更具体而言，涉及使用小规模硬件卷积神经网络(CNN)模块对视频图像执行人脸检测的系统、装置和技术。
技术介绍
深度学习(DL)是机器学习和人工神经网络的一个基于一组算法的分支，该算法通过使用具有很多个处理层的人工神经网络来试图建模数据中的高层次抽象。典型的DL架构可包括许多层的神经元和数百万个参数。可以在配备有GPU的高速计算机上用海量数据训练这些参数，并由在深层网络也能适用的新的训练算法来指导，诸如修正线性单元(ReLU)、漏失(或丢弃)、数据集增强，以及随机梯度下降(SGD)。在现有的DL架...
采用嵌入式系统中的小规模卷积神经网络模块的人脸检测

【技术保护点】
一种人脸检测系统,所述人脸检测系统基于采用至少一个小规模硬件卷积神经网络模块来处理视频图像，其特征在于，所述系统包括：运动检测模块，用于检测视频图像内与移动物体对应的候选图像区域；第一处理模块，所述第一处理模块通过硬件CNN模块实现功能，其中所述第一处理模块利用所述硬件CNN模块，采用具有第一图像尺寸的滑动窗口方法处理已检测候选图像区域，并在所述已检测候选图像区域内生成第一组候选人脸窗口，其中所述第一图像尺寸介于所述硬件CNN模块的最小输入尺寸和最大输入尺寸之间；第二处理模块，所述第二处理模块通过所述硬件CNN模块实现功能并且连接到所述第一处理模块，其中所述第二处理模块利用所述硬件CNN模块，并采用第二图像尺寸处理所述候选图像区域内的第一组子区域，其中所述第一组子区域对应于所述第一组候选人脸窗口，并在所述已检测候选图像区域内生成第二组候选人脸窗口，其中所述第二图像尺寸介于所述硬件CNN模块的最小和最大输入尺寸之间；以及第三处理模块，所述第三处理模块通过所述硬件CNN模块实现功能并且连接到所述第二处理模块，其中所述第三处理模块利用所述硬件CNN模块，采用第三图像尺寸处理所述候选图像区域内...

【技术特征摘要】
2016.11.30 US 62/428,497;2017.07.21 US 15/657,1091.一种人脸检测系统,所述人脸检测系统基于采用至少一个小规模硬件卷积神经网络模块来处理视频图像，其特征在于，所述系统包括：运动检测模块，用于检测视频图像内与移动物体对应的候选图像区域；第一处理模块，所述第一处理模块通过硬件CNN模块实现功能，其中所述第一处理模块利用所述硬件CNN模块，采用具有第一图像尺寸的滑动窗口方法处理已检测候选图像区域，并在所述已检测候选图像区域内生成第一组候选人脸窗口，其中所述第一图像尺寸介于所述硬件CNN模块的最小输入尺寸和最大输入尺寸之间；第二处理模块，所述第二处理模块通过所述硬件CNN模块实现功能并且连接到所述第一处理模块，其中所述第二处理模块利用所述硬件CNN模块，并采用第二图像尺寸处理所述候选图像区域内的第一组子区域，其中所述第一组子区域对应于所述第一组候选人脸窗口，并在所述已检测候选图像区域内生成第二组候选人脸窗口，其中所述第二图像尺寸介于所述硬件CNN模块的最小和最大输入尺寸之间；以及第三处理模块，所述第三处理模块通过所述硬件CNN模块实现功能并且连接到所述第二处理模块，其中所述第三处理模块利用所述硬件CNN模块，采用第三图像尺寸处理所述候选图像区域内的第二组子区域，其中所述第二组子区域对应于所述第二组候选人脸窗口，并在所述已检测候选图像区域内生成第三组候选人脸窗口，其中所述第三图像尺寸大于所述硬件CNN模块的最大输入尺寸。2.根据权利要求1所述的人脸检测系统，其特征在于，基于所述硬件CNN模块的最小输入尺寸确定所述第一图像尺寸。3.根据权利要求1所述的人脸检测系统，其特征在于，所述第一图像尺寸基本等于所述硬件CNN模块的最小输入尺寸。4.根据权利要求1所述的人脸检测系统，其特征在于，所述运动检测模块用于利用硬件芯片组或片上系统的背景消除模块，检测所述候选图像区域。5.根据权利要求1所述的人脸检测系统，其特征在于，还包括位于所述运动检测模块和所述第一处理模块之间的金字塔生成模块，所述金字塔生成模块用于生成所述已检测候选图像区域的金字塔式的多分辨率表示。6.根据权利要求5所述的人脸检测系统，其特征在于，所述第一处理模块利用所述第一图像尺寸处理所述已检测候选图像区域的方式为：针对所述已检测候选图像区域的多分辨率表示中的每个图像，采用具有第一图像尺寸的滑动窗口为所述图像生成一组图像块；从每组图像块中生成第一组候选人脸窗口，其中所述每组图像块对应于所述已检测候选图像区域的每个多分辨率表示的所述滑动窗口的位置。7.根据权利要求1所述的人脸检测系统，其特征在于，第一组候选人脸窗口中的每一个窗口与置信度指数和一组边界框坐标关联，所述一组边界框坐标定义了所述候选人脸窗口在所述已检测候选图像区域内的位置。8.根据权利要求1所述的人脸检测系统，其特征在于，所述第二处理模块具有第二复杂度；所述第一处理模块具有第一复杂度；所述第二复杂度高于所述第一复杂度。9.根据权利要求1所述的人脸检测系统，其特征在于，所述第二图像尺寸大于所述第一图像尺寸。10.根据权利要求1所述的人脸检测系统，其特征在于，所述第二处理模块采用第二图像尺寸，处理所述候选图像区域内对应于所述第一组候选人脸窗口的第一组子区域的方式为：将所述候选图像区域内对应于所述第一组候选人脸窗口的第一组子区域中的每个子区域的尺寸重新设定为具有所述第二图像尺寸的第二图像块；从具有第二图像尺寸的第二组图像块中生成第二组候选人脸窗口。11.根据权利要求1所述的人脸检测系统，其特征在于，所述第三处理模块具有第三复杂度，所述第三复杂度高于所述第一和第二处理模块的第一复杂度和第二复杂度。12.根据权利要求1所述的人脸检测系统，其特征在于，所述第三处理模块用于将所述已检测候选图像区域内对应于第二组候选人脸窗口的第二组子区域中的每个子区域的尺寸重新设定为具有第三图像尺寸的第三图像块。13.根据权利要求12所述的人脸检测系统，其特征在于，所述第三处理模块通过处理重新设定尺寸的、具有第三图像尺寸的第三组图像块，处理所述第二组候选人脸窗口。14.根据权利要求13所述的人脸检测系统，其特征在于，所述第三处理模块处理每个重新设定尺寸的、具有第三...

【专利技术属性】
技术研发人员：王星，梅迪·塞伊菲，陈明华，吴谦伟，梁杰，
申请(专利权)人：奥瞳系统科技有限公司，
类型：发明
国别省市：加拿大,CA

全部详细技术资料下载我是这个专利的主人