一种基于多层特征融合的卷积神经网络打哈欠行为识别方法及装置制造方法及图纸

技术编号：22295878 阅读：59 留言：0更新日期：2019-10-15 04:58

本发明专利技术公开了一种基于多层特征融合的卷积神经网络打哈欠行为识别方法，包含如下步骤：步骤1，采集驾驶员在驾驶状态下的面部视频帧图像作为样本；步骤2，采用人脸检测算法对所述面部视频帧图像进行人脸区域定位，提取出人脸图像，步骤3，对样本进行分类，步骤4，训练基于ShuffleNetV2网络修改的多层特征融合的卷积神经网络，直到在测试集上精度达到最优；步骤5，打哈欠张嘴识别检测。本发明专利技术通过基于ShuffleNeV2网络结构设计的多层特征融合的卷积神经网络来端到端的打哈欠张嘴识别，解决了打哈欠识别算法逻辑复杂且精度不高的问题。

A Method and Device for Recognition of Yawning Behavior Based on Convolutional Neural Network with Multi-layer Feature Fusion

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多层特征融合的卷积神经网络打哈欠行为识别方法及装置
本专利技术涉及智能交通研究领域，尤其是涉及图像识别和疲劳驾驶领域，具体涉及一种基于多层特征融合的卷积神经网络打哈欠行为识别方法及装置。
技术介绍
随着人民生活水平的提高和汽车行业的发展，乘车出行或者驾车出行已经成为一种优先选择的交通方式。车辆出行频次的增加，也一定程度上增加了交通事故发生的概率。据不完全统计，大部分交通事故的发生是由于驾驶员疲劳，注意力不集中导致的。因此有效的检测疲劳驾驶行为及时预防，有利于减少交通事故的发生。疲劳驾驶检测技术可以大致分为基于驾驶人行为的分析和基于视觉的分析。近年来随着人工智能技术的进步，基于视觉的疲劳驾驶检测技术受到越来越多的关注。打哈欠作为疲劳的一个关键性特征，打哈欠识别的准确度高低会给疲劳检测带来极大的影响。现有的大多方法均是先定位到嘴部区域，然后通过分析嘴部区域的特征来进行打哈欠识别。该种方法存在两个主要的问题：第一，从算法效率上来说，要先定位脸部区域，然后再定位嘴部区域算法复杂度高。第二，打哈欠是一个面部表情，单纯的依赖于嘴部区域特征容易和说话、惊恐等表情混淆，影响算法的准确度。马素刚,赵琛,孙韩林等人的“一种基于卷积神经网络的哈欠检测算法”《计算机科学》中提出把驾驶员面部图片直接送入到一个卷积神经网络中进行打哈欠识别，但是只是提取了卷积神经网络的高层特征进行识别，丢失了低层的边缘特征和中层的具体特征，打哈欠识别的精度受到了影响。本专利技术结合了卷积神经网络的多层特征进行打哈欠张嘴行为识别，同时结合一个序列的分析结果，综合判断是否打哈欠，最终提高了打哈欠识...

【技术保护点】
1.一种基于多层特征融合的卷积神经网络打哈欠行为识别方法，其特征在于，包含如下步骤：步骤1，采集驾驶员在驾驶状态下的面部视频帧图像作为样本；步骤2，采用人脸检测算法对所述面部视频帧图像进行人脸区域定位，根据人脸检测算法给出的人脸坐标（X，Y，W，H），提取出人脸图像，其中（X，Y）表示人脸图像左上角的点，W，H分别对应人脸图像的宽和高；步骤3，挑选出非打哈欠状态下驾驶员的人脸图像，归集为类别0，挑选出打哈欠状态下驾驶员的面部图像，归集为类别1，所述非打哈欠状态包括面无表情、讲话、微笑等；步骤4，训练基于ShuffleNetV2网络修改的多层特征融合的卷积神经网络，直到在测试集上精度达到最优；步骤5，将驾驶员在驾驶状态下的实时面部视频帧图像经过步骤2处理后获取人脸区域，每隔1‑4s输入训练好的卷积神经网络，输出单张图像是否张嘴识别结果。

【技术特征摘要】
1.一种基于多层特征融合的卷积神经网络打哈欠行为识别方法，其特征在于，包含如下步骤：步骤1，采集驾驶员在驾驶状态下的面部视频帧图像作为样本；步骤2，采用人脸检测算法对所述面部视频帧图像进行人脸区域定位，根据人脸检测算法给出的人脸坐标（X，Y，W，H），提取出人脸图像，其中（X，Y）表示人脸图像左上角的点，W，H分别对应人脸图像的宽和高；步骤3，挑选出非打哈欠状态下驾驶员的人脸图像，归集为类别0，挑选出打哈欠状态下驾驶员的面部图像，归集为类别1，所述非打哈欠状态包括面无表情、讲话、微笑等；步骤4，训练基于ShuffleNetV2网络修改的多层特征融合的卷积神经网络，直到在测试集上精度达到最优；步骤5，将驾驶员在驾驶状态下的实时面部视频帧图像经过步骤2处理后获取人脸区域，每隔1-4s输入训练好的卷积神经网络，输出单张图像是否张嘴识别结果。2.根据权利要求1所述的一种基于多层特征融合的卷积神经网络打哈欠行为识别方法，其特征在于，还包括步骤6，打哈欠行为分析：对步骤5检测到张嘴时，对其前后2~3s内的视频帧图像进行检测，从而得出张嘴的连续时间长度，通过连续时间长度设定阈值，进而得到是否存在打哈欠行为。3.根据权利要求1所述的一种基于多层特征融合的卷积神经网络打哈欠行为识别方法，其特征在于，步骤2中所述人脸检测算法采用高效快速的人脸检测算法MTCNN。4.根据权利要求1-3任一项所述的一种基于多层特征融合的卷积神经网络打哈欠行为识别方法，其特征在于，步骤4中所述基于ShuffleNetV2网络修改的多层特征融合的卷积神经网络，具体修改如下：（1）ShuffleNetV2的整个网络结构可以分成4个阶段：stage1、stage2、stage3、stage4，在stage_2_1/concat...

【专利技术属性】
技术研发人员：姜磊，周金明，李军，
申请(专利权)人：南京行者易智能交通科技有限公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人