【技术实现步骤摘要】
本专利技术属于图像处理、模式识别和软件工程等
,尤其涉及一种基于深度学习的嘴巴张闭状态检测方法,并且对现实中常见的存在光照变化干扰和人脸关键部位部分遮挡的场景具有很强的适应性。
技术介绍
人脸是一个人最重要的外貌特征,人脸识别技术在身份认证与安全防护等当前热门应用领域具有广泛的应用,具有非常广阔的前景。然而人脸极易用照片、视频等方式进行复制,因此对合法用户人脸的假冒是人脸识别与认证系统安全的重要威胁。因此现有的人脸识别系统中一个必不可少的环节就是活体检测部分,用于判断提交的生物特征是否来自有生命的个体。当前高精度的活体检测系统往往采取交互式的检测手段,例如,要求用户按照指示张、闭嘴巴。目前主流的检测算法的实施步骤先是从输入的图片中提取人工设计的特征,再对提取到的特征做分类从而判断输入是否来自活体。为了保证检测的准确率,人脸识别系统需要对现实生活场景中存在的各种干扰都具有较强的鲁棒性,然而在现有阶段由于检测算法的不成熟,活体检测系统对具有较大光照变化、姿态变化、部分遮挡以及随机噪声的场景的鲁棒性仍然需要进一步提高才能满足实际的应用。由于传统的活体检测方法不能满足实际应用中对高精度实时活体检测的需求,为此本专利技术提出了一种可以应用于交互式活体检测的高精度嘴巴张闭状态检测方法。
技术实现思路
本专利技术的目的是准确地对人嘴部图片的张闭状态进行检测,进一步增强现有算法对光照变化和部分遮挡场景的鲁棒性。为实现人嘴部图片的张闭状态进行高精度检测,本专利技术提供如下解决方案:通过神经网络的卷积层实现鲁棒特征提取并通过全连接层来实现特征分类,通过随机梯度下降法来根据 ...
【技术保护点】
一种基于深度学习的嘴巴张闭状态检测方法,其特征在于,所述方法包括:步骤S1,对输入的图像进行预处理;步骤S2,对于预处理后的图像提取特征;步骤S3,利用神经网络对于提取到的特征进行分类,通过对于分类结果进行归一化得到某一图像属于张嘴和闭嘴的预测结果;步骤S4,计算神经网络输出结果的误差并将其反传,以调整神经网络的参数;步骤S5,对输入的待检测图像进行测试,得到检测结果。
【技术特征摘要】
1.一种基于深度学习的嘴巴张闭状态检测方法,其特征在于,所述方法包括:步骤S1,对输入的图像进行预处理;步骤S2,对于预处理后的图像提取特征;步骤S3,利用神经网络对于提取到的特征进行分类,通过对于分类结果进行归一化得到某一图像属于张嘴和闭嘴的预测结果;步骤S4,计算神经网络输出结果的误差并将其反传,以调整神经网络的参数;步骤S5,对输入的待检测图像进行测试,得到检测结果。2.根据权利要求1所述的方法,其特征在于,所述步骤S1包括以下步骤:步骤S11,将输入的图像归一化;步骤S12,将归一化后的图像转换为灰度图像。3.根据权利要求1所述的方法,其特征在于,所述步骤S2中,采用神经系统中的卷积层和最大池化层来进行特征的提取。4.根据权利要求3所述的方法,其特征在于,所述卷积层的数量为四个,最大池化层的数量为三个。5.根据权利要求3所述的方法,其特征在于,所述步骤S2中,卷积计算按照下式进行: y j ( r ) = | tanh ( b j ( r ) + Σ i = 1 w i j ( r ) × x i ( r ) ) | ]]>其中,xi代表第i层神经元的输入,yj代表第j层神经元的输出,上标r代表该层神经元的序数,wij代表从第i层到第j层的权重矩阵,bj是第j层神经元的偏置项,tanh代表双曲正切函数。6.根据权利要求5所述的方法,其特征在于,所述步骤S2中,池化层按照下式进行操作: y j ...
【专利技术属性】
技术研发人员:孙哲南,赫然,李海青,曹杰,
申请(专利权)人:中国科学院自动化研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。