【技术实现步骤摘要】
一种用于智能视频分析的驾驶员行为识别方法
[0001]本专利技术涉及机器学习与模式识别
,具体涉及一种用于智能视频分析的驾驶员行为识别方法。
技术介绍
[0002]随着经济的快速发展和人们生活水平的不断提高,汽车已成为最常用的交通出行工具。根据公安部最新统计,截至2022年3月底,全国汽车保有量达3.07亿辆,汽车驾驶员达4.5亿人。随着汽车保有量的增多,交通事故的发生更加频繁。根据《全球道路安全报告》,超过90%的交通事故源于驾驶员不当驾驶行为,包括吸烟、打电话、玩手机等,因此对驾驶员行为识别技术进行研究,既具有理论研究意义,也具有实际应用价值。
[0003]驾驶员行为识别属于一种智能视频分析技术,有助于高级驾驶辅助系统(ADAS)控制策略的优化,已成为ADAS安全驾驶最具挑战性的任务。
[0004]从原始图像/视频中提取具有辨识力和鲁棒性的特征表示,已成为驾驶员行为识别的重要任务之一。近年来,深度学习方法已被广泛应用于驾驶员行为识别技术中,已成为驾驶员行为识别技术研究的主流。卷积神经网络(CNN)作 ...
【技术保护点】
【技术特征摘要】
1.一种用于智能视频分析的驾驶员行为识别方法,其特征在于,包括以下步骤:步骤1,通过内置车顶监控摄像头拍摄驾驶员图像,建立驾驶员行为识别数据集,随机选取224
×
224像素的RGB图像块作为驾驶员行为识别的训练样本,涵盖正常驾驶、打电话、玩手机、抽烟、喝水、双手脱离方向盘6种不同的驾驶行为,分别用0到5代表样本对应的驾驶行为标签;步骤2,以Resnet50深度残差网络作为基础卷积神经网络模型,融入多级注意力块和空间金字塔特征融合层来构建多级注意力深度残差学习模型;步骤3,将步骤1代表不同驾驶行为的训练样本送入步骤2设计的多级注意力深度残差学习模型中进行训练,应用交叉熵损失函数监督网络的训练,通过随机梯度下降法进行多次迭代不断地优化网络模型参数,从而获取用于驾驶员行为识别的优选模型,利用该模型进行驾驶员行为识别,输出识别标签。2.根据权利要求1所述的用于智能视频分析的驾驶员行为识别方法,其特征在于,所述步骤2中,多级注意力深度残差学习模型包括8级子网络,具体包括:第1级子网络以分辨率为224
×
224
×
3的原始RGB图像作为输入,先后经过卷积层、批标准化层、ReLU激活函数、最大池化层,输出形状为56
×
56
×
64的特征图;第2级子网络以分辨率为56
×
56
×
64的特征作为输入,先后经过1个残差块A、2个残差块B、1个注意力块,输出形状为56
×
56
×
256的特征图;第3级子网络以分辨率为56
×
56
×
256的特征作为输入,先后经过1个残差块A、3个残差块B、1个注意力块,输出形状为28
×
28
×
512的特征图;第4级子网络以分辨率为28
×
28
×
512的特征作为输入,先后经过1个残差块A、5个残差块B、1个注意力块,输出形状为14
×
14
×
1024的特征图;第5级子网络以分辨率为14
×
14
×
1024的特征作为输入,先后经过1个残差块A、2个残差块B、1个注意力块,输出形状为7
×7×
2048的特征图;第6级子网络分别以第1级到第4级子网络输出的特征作为输入,经过空间金字塔特征融合层,输出形状为21
×
3840的特征图;第7级子网络以分辨率为21
×
3840的特征作为输入,经过全局平均池化层,输出3840维的特征向量;第8级子网络以分辨率为3840维的特征作为输入,先后经过2个全连接层、Softmax标准化层,输出6维的特征向量,用于表示不同驾驶行为类别的概率;所述2个全连接层分别含有1000个神经元和6个神经元。3.根据权利要求2所述的用于智能视频分析的驾驶员行为识别方法,其特征在于,所述残差块A的输入特征先后经过1
×
1卷积降维、ReLU激活函数、3
×
3卷积、ReLU激活函数、1
×
1卷积升维来学习残差函数...
【专利技术属性】
技术研发人员:侯丽,刘琦,何宁业,陈珍海,汪伟,曹俊呈,
申请(专利权)人:黄山学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。