基于深度学习的嘴巴张闭状态检测方法技术

技术编号:14273623 阅读:256 留言:0更新日期:2016-12-23 18:17
本发明专利技术公开了一种基于深度学习的嘴巴张闭状态检测方法,其主要包括数据预处理部分、特征提取部分、特征分类部分和误差计算部分。本发明专利技术最大的特点是充分利用深度卷积神经网络提取高层次特征的能力,提取出可以应对实际应用场景中经常存在的无规律噪声、较大光照变化以及通过遮挡嘴部关键部位进行恶意攻击等情况的鲁棒特征,并且利用全连接层来对提取到的特征分类,并通过计算误差并采用随机梯度下降法调整参数从而减小误差的方法来使检测方法自动习得分辨嘴巴张闭状态的能力。此外,本发明专利技术能够保证所需的计算资源和存储空间都不会因待检测图像分辨率的变化而产生大幅度波动。本发明专利技术操作方便,简单易用,精度更高、更加安全可靠。

【技术实现步骤摘要】

本专利技术属于图像处理、模式识别和软件工程等
,尤其涉及一种基于深度学习的嘴巴张闭状态检测方法,并且对现实中常见的存在光照变化干扰和人脸关键部位部分遮挡的场景具有很强的适应性。
技术介绍
人脸是一个人最重要的外貌特征,人脸识别技术在身份认证与安全防护等当前热门应用领域具有广泛的应用,具有非常广阔的前景。然而人脸极易用照片、视频等方式进行复制,因此对合法用户人脸的假冒是人脸识别与认证系统安全的重要威胁。因此现有的人脸识别系统中一个必不可少的环节就是活体检测部分,用于判断提交的生物特征是否来自有生命的个体。当前高精度的活体检测系统往往采取交互式的检测手段,例如,要求用户按照指示张、闭嘴巴。目前主流的检测算法的实施步骤先是从输入的图片中提取人工设计的特征,再对提取到的特征做分类从而判断输入是否来自活体。为了保证检测的准确率,人脸识别系统需要对现实生活场景中存在的各种干扰都具有较强的鲁棒性,然而在现有阶段由于检测算法的不成熟,活体检测系统对具有较大光照变化、姿态变化、部分遮挡以及随机噪声的场景的鲁棒性仍然需要进一步提高才能满足实际的应用。由于传统的活体检测方法不能满足实际应用中对高精度实时活体检测的需求,为此本专利技术提出了一种可以应用于交互式活体检测的高精度嘴巴张闭状态检测方法。
技术实现思路
本专利技术的目的是准确地对人嘴部图片的张闭状态进行检测,进一步增强现有算法对光照变化和部分遮挡场景的鲁棒性。为实现人嘴部图片的张闭状态进行高精度检测,本专利技术提供如下解决方案:通过神经网络的卷积层实现鲁棒特征提取并通过全连接层来实现特征分类,通过随机梯度下降法来根据误差对卷积层和全连接层的参数进行调整,使得对嘴巴张闭状态检测的准确度更高,而且不依赖人工设计的特征提取器。目前的高精度活体检测方法采用的是交互式活体方法,传统的方法需要经验丰富的专业人士根据具体的活体检测任务来设计特定的特征提取方法。虽然在过去的相当长时间里,传统方法在干扰较小的环境中的活体检测取得了较好的效果,但是面对实际应用中存在大量光照变化、姿态变化以及各种无规律噪声的环境,始终不能达到令人满意的泛化性能。考虑到实际存在的噪声是极其丰富的,本专利技术提出了使用深度卷积神经网络层来提取传统方法难以取得的具有很强鲁棒性的高层次的特征。本专利技术基于深度学习的嘴巴张闭状态检测方法包括以下步骤:步骤S1,对输入的图像进行预处理;步骤S2,对于预处理后的图像提取特征;步骤S3,利用神经网络对于提取到的特征进行分类,通过对于分类结果进行归一化得到某一图像属于张嘴和闭嘴的预测结果;步骤S4,计算神经网络输出结果的误差并将其反传,以调整神经网络的参数;步骤S5,对输入的待检测图像进行测试,得到检测结果。可选地,所述步骤S1包括以下步骤:步骤S11,将输入的图像归一化;步骤S12,将归一化后的图像转换为灰度图像。可选地,所述步骤S2中,采用神经系统中的卷积层和最大池化层来进行特征的提取。可选地,所述卷积层的数量为四个,最大池化层的数量为三个。可选地,所述步骤S2中,卷积计算按照下式进行: y j ( r ) = | tanh ( b j ( r ) + Σ i = 1 w i j ( r ) × x i ( r ) ) | ]]>其中,xi代表第i层神经元的输入,yj代表第j层神经元的输出,上标r代表该层神经元的序数,wij代表从第i层到第j层的权重矩阵,bj是第j层神经元的偏置项,tanh代表双曲正切函数。可选地,所述步骤S2中,池化层按照下式进行操作: y j ( r ) = m a x ( 0 , b j ( r ) + Σ i = 1 w i j ( r ) × x i ( r ) ) ) ]]>其中,max代表取大值。可选地,所述步骤S3通过神经网络中的全连接层以及归一化操作来进行特征分类。可选地,所述步骤S4中,误差表示为: J = - 1 m Σ i = 1 m y i log x i + ( 1 - y i ) l o g ( 1 - x 本文档来自技高网...
基于深度学习的嘴巴张闭状态检测方法

【技术保护点】
一种基于深度学习的嘴巴张闭状态检测方法,其特征在于,所述方法包括:步骤S1,对输入的图像进行预处理;步骤S2,对于预处理后的图像提取特征;步骤S3,利用神经网络对于提取到的特征进行分类,通过对于分类结果进行归一化得到某一图像属于张嘴和闭嘴的预测结果;步骤S4,计算神经网络输出结果的误差并将其反传,以调整神经网络的参数;步骤S5,对输入的待检测图像进行测试,得到检测结果。

【技术特征摘要】
1.一种基于深度学习的嘴巴张闭状态检测方法,其特征在于,所述方法包括:步骤S1,对输入的图像进行预处理;步骤S2,对于预处理后的图像提取特征;步骤S3,利用神经网络对于提取到的特征进行分类,通过对于分类结果进行归一化得到某一图像属于张嘴和闭嘴的预测结果;步骤S4,计算神经网络输出结果的误差并将其反传,以调整神经网络的参数;步骤S5,对输入的待检测图像进行测试,得到检测结果。2.根据权利要求1所述的方法,其特征在于,所述步骤S1包括以下步骤:步骤S11,将输入的图像归一化;步骤S12,将归一化后的图像转换为灰度图像。3.根据权利要求1所述的方法,其特征在于,所述步骤S2中,采用神经系统中的卷积层和最大池化层来进行特征的提取。4.根据权利要求3所述的方法,其特征在于,所述卷积层的数量为四个,最大池化层的数量为三个。5.根据权利要求3所述的方法,其特征在于,所述步骤S2中,卷积计算按照下式进行: y j ( r ) = | tanh ( b j ( r ) + Σ i = 1 w i j ( r ) × x i ( r ) ) | ]]>其中,xi代表第i层神经元的输入,yj代表第j层神经元的输出,上标r代表该层神经元的序数,wij代表从第i层到第j层的权重矩阵,bj是第j层神经元的偏置项,tanh代表双曲正切函数。6.根据权利要求5所述的方法,其特征在于,所述步骤S2中,池化层按照下式进行操作: y j ...

【专利技术属性】
技术研发人员:孙哲南赫然李海青曹杰
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1