一种基于卷积神经网络的眼睛和嘴部状态识别方法技术

技术编号：14769848 阅读：282 留言：0更新日期：2017-03-08 13:53

本发明专利技术涉及一种基于卷积神经网络的眼睛和嘴部状态识别方法，通过该方法设计的SR‑Net网络对大量眼睛和嘴部不同状态的样本进行学习。面部状态识别可以视为眼睛和嘴部的状态识别。本发明专利技术能够更加准确的对眼睛和嘴部的状态进行识别分类。由于卷积神经网络避免了人工特征的抽取，对眼睛及嘴部状态的识别具有很高鲁棒性。并且该方法对佩戴墨镜的情况识别率得到提升，将眼睛态识别的平均准确率提高98.41％以上；对无眼镜下的眼睛状态平均识别率为98.92％，嘴部状态平均识别率为99.33％。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种基于卷积神经网络的眼睛和嘴部状态识别方法，该方法能够适应光照变化以及眼镜遮挡的情况，属于图像识别
，可应用于判定驾驶员的疲劳状态。
技术介绍
眼睛和嘴部状态识别可认为等同于人脸面部状态的识别，是图像识别领域的重要内容，对信息安全、自动驾驶等技术有着直接的影响。根据美国国家统计和分析中心的报告，疲劳驾驶是引发交通事故的重要原因之一，因此，驾驶员疲劳检测技术的研究对于预防交通事故有着重要的意义。近年来，随着计算机硬件水平的提高，基于视觉的疲劳检测方法的不断发展。基于视觉的驾驶员疲劳检测系统应用中，眨眼频率以及打哈欠状态是疲劳检测的重要指标。因此，眼睛和嘴部的状态检测是疲劳检测中的关键问题，由于光照变化以及佩戴墨镜等情况，增加了眼睛状态识别的难度，其状态识别的准确率对系统的性能及实际应用有重要影响。传统检测眼睛状态的方法有很多种，第一类方法采用模板匹配方法判断眼睛状态，由于虹膜在眼睑中位置不固定，易产生误检。采用多模板匹配，检测效率低实时性差。第二类方法采用眼睛虹膜区域灰度投影曲线判断眼睛状态，对光照要求较高，适用的场景少。第三类方法使用基于LBP特征与SVM分类器结合的眼睛开闭检测，对驾驶员佩戴墨镜以及姿态变化有一定的局限性，鲁棒性差。第四类方法采用基于多特征融合的眼睛状态识别，该方法需要多个分类器进行决策融合，实时性较差。传统分类器的方法，需要人为选取合适的特征，将提取的特征输入到判别分类器中，特征的选取的合适与否，成为制约分类器效果的关键因素。卷积神经网络对特征有更好的表达力、避免了人工特征选取过程，在卷积神经网络提出之前，由于缺...
一种基于卷积神经网络的眼睛和嘴部状态识别方法

【技术保护点】
一种基于卷积神经网络的眼睛和嘴部状态识别方法，所述方法包括下列步骤：(1)采用红外光源、窄带滤光片配合工业镜头搭建用于采集待测图像的红外采集系统；(2)用步骤1中所搭建的系统采集部分待测的面部图像；(3)采用基于haar特征和AdaBoost算法的人脸检测算法或其他人脸检测算法检测出人脸区域；(4)由随机森林和线性回归结合的方法检测出步骤3得到的结果上包括眼睛、嘴部、鼻梁、眉骨和外侧主轮廓的人脸特征点的提取；(5)在步骤4确定人脸特征点的基础上结合正则化方法利用LBF特征检测出人脸的眼睛和嘴部区域；(6)构建SR‑Net的核心结构卷积层；(7)构建SR‑Net的降采样层，以减少计算量，提高特征的鲁棒性，提高模型的准确率；(8)采用修正线性单元构建SR‑Net的全连接层，克服非线性激活函数常见的梯度消失的问题；(9)以一定的概率p，通常设为0.5，让隐藏层的部分神经元输出值设置为0设计SR‑Net的Dropout，减少过拟合现象，进而提高网络的泛化能力；(10)构建训练样本集并选取相应的网络结构和迭代次数训练SR‑Net的网络模型；(11)输入待测数据集，应用SR‑Net模型完成眼睛和嘴部状态识别并输出结果。...

【技术特征摘要】
1.一种基于卷积神经网络的眼睛和嘴部状态识别方法，所述方法包括下列步骤：(1)采用红外光源、窄带滤光片配合工业镜头搭建用于采集待测图像的红外采集系统；(2)用步骤1中所搭建的系统采集部分待测的面部图像；(3)采用基于haar特征和AdaBoost算法的人脸检测算法或其他人脸检测算法检测出人脸区域；(4)由随机森林和线性回归结合的方法检测出步骤3得到的结果上包括眼睛、嘴部、鼻梁、眉骨和外侧主轮廓的人脸特征点的提取；(5)在步骤4确定人脸特征点的基础上结合正则化方法利用LBF特征检测出人脸的眼睛和嘴部区域；(6)构建SR-Net的核心结构卷积层；(7)构建SR-Net的降采样层，以减少计算量，提高特征的鲁棒性，提高模型的准确率；(8)采用修正线性单元构建SR-Net的全连接层，克服非线性激活函数常见的梯度消失的问题；(9)以一定的概率p，通常设为0.5，让隐藏层的部分神经元输出值设置为0设计SR-Net的Dropout，减少过拟合现象，进而提高网络的泛化能力；(10)构建训练样本集并选取相应的网络结构和迭代次数训练SR-Net的网络模型；(11)输入待测数据集，应用SR-Net模型完成眼睛和嘴部状态识别并输出结果。2.如权利要求1所述的方法，其特征在于，步骤(2)中，选用主动红外光源(850nm)进行补光照明，同时采用850nm的窄带滤光片进行配合使用，搭建的红外图像采集系统如图2。3.如权利要求1所述的方法，步骤(3)中，本方法对人脸检测算法不敏感，可采用其他替代算法。4.如权利要求1所述的方法，其特征在于，步骤(4)中，将人脸区域内的人脸所有关键点的局部特征组合为LBF，LocalBinaryFeature特征，利用LBF特征进行全局回归，通过级联获得形状增量，进行形变预测；利用LBF特征高度稀疏的特点，使得特征的提取与回归速度加快快，满足实时性要求，通过回归分析进行分析预测判断，建立从输入信息到输出信息之间的映射关系，完成检测出的人脸区域内的包括眼睛、嘴部、鼻梁、眉骨和外侧主...

【专利技术属性】
技术研发人员：耿磊，梁晓昱，肖志涛，张芳，吴骏，苏静静，
申请(专利权)人：天津工业大学，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人