System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于多视角的驾驶行为检测方法技术_技高网

一种基于多视角的驾驶行为检测方法技术

技术编号:41328838 阅读:6 留言:0更新日期:2024-05-13 15:07
本发明专利技术涉及驾驶行为检测的技术领域,具体为一种基于多视角的驾驶行为检测方法,包括以下步骤,通过视频采集设备对驾驶者进行多视角图像数据采集;根据采集的图像数据,构建多视角驾驶行为数据集;根据构建的多视角驾驶行为数据集,建立神经网络识别模型行为识别网络模型;基于行为识别网络模型,实现驾驶行为的多视角识别。该模型通过改进多视角卷积神经网络,优化特征提取模块以减少参数量,同时融入视觉注意力机制以智能融合不同视角的特征,显著增强了对驾驶行为的识别精度。与此同时,经过对比实验,本发明专利技术确定了最有效的视角组合,实现了在自动驾驶过渡期间对分心驾驶行为的实时、高效监控,并为提升道路安全性做出了显著贡献。

【技术实现步骤摘要】

本专利技术涉及驾驶行为检测的,具体为一种基于多视角的驾驶行为检测方法


技术介绍

1、随着全球汽车行业的快速发展,汽车人均持有率越来越高。而随着汽车数量的急剧增多,其引发的交通事故所导致的危害也是愈发严重。因此减少交通事故的伤亡和经济负担已成为社会迫切关注的问题。

2、而在道路交通事故的原因中,人为因素占了相当大的比例,驾驶员的行为直接影响到车辆的安全运行。在这种背景下,自动驾驶技术的出现预示着可以显著降低因人为错误引发的交通事故,近年来,自动驾驶领域已实现突破性进展,现代车辆设计已将自适应巡航控制和车道保持辅助等自动化功能无缝融入。

3、然而,要达到5级全自动驾驶——即车辆完全无需人工干预即可运行——仍面临诸多挑战。从应对复杂的交通环境到克服基础设施差异、提升软件的可靠性等问题,多方面的障碍制约了完全自动驾驶在近期的广泛应用,在这个以人类驾驶为主的过渡时期,构建能识别并纠正驾驶员异常行为的检测系统至关重要。目前,高级驾驶辅助系统(adas)正是为了满足这一需求而开发。adas通过整合多种传感器和通信技术,并借助车载计算机的实时分析和响应,提供安全驾驶的辅助功能,显著提升了行车安全。其中,关键的一环是监测驾驶员行为,评估其驾驶状况,并在必要时给予警告和辅助,以确保安全驾驶。

4、驾驶员行为的识别方法多种多样,主要分为三大类:车辆操作数据分析、驾驶员图像数据分析以及驾驶员生理数据监测。在这些方法中,基于图像数据的驾驶行为识别因其常规性和易于实施的特点而更受青睐。

5、在这一领域,研究者们已经提出了诸多卓越的技术,它们或在提升识别精度方面达到了高标准,或在模型结构的紧凑高效性上具有显著优势,使得这些技术便于在实际环境中部署。

6、然而,尽管现有的方法在特定的应用场景下已经取得了一定的成功,但它们多数依赖于单一视角的图像输入,这限制了从单个动作中获得的特征信息的深度与广度。本专利技术正是在此基础上作出了创新,它吸收并应用了三维物体识别技术中成熟的多视角特征学习方法,将其巧妙地转化应用于驾驶行为的识别。


技术实现思路

1、鉴于上述存在检测视角单一的问题,提出了本专利技术。

2、因此,本专利技术提供了一种基于多视角的驾驶行为检测方法,通过建立多视角神经网络识别模型,显著提高了驾驶行为识别的准确性和可靠性。

3、为解决上述技术问题,本专利技术提供如下技术方案:一种基于多视角的驾驶行为检测方法,包括以下步骤,

4、通过视频采集设备对驾驶者进行多视角图像数据采集;

5、根据采集的图像数据,构建多视角驾驶行为数据集;

6、根据构建的多视角驾驶行为数据集,建立神经网络识别模型行为识别网络模型;

7、基于行为识别网络模型,实现驾驶行为的多视角识别。

8、作为本专利技术所述一种基于多视角的驾驶行为检测方法的一种优选方案,其中:所述构建多视角驾驶行为数据集包括以下步骤,

9、所述构建多视角驾驶行为数据集是基于视频采集设备采集的图像数据进行构建的,包括,对采集的图像数据进行抽帧操作;利用脚本技术对抽帧后的图像数据进行自动化标签处理;对经过自动化标签处理后的图像数据进行数据预处理以及基于数据预处理结果构建数据集;

10、所述对采集的图像数据进行抽帧操作是以3帧/s的频率对图像数据进行处理,将图像数据转换为jpg格式的图像数据,并基于处理结果将不符合数据集特征要求的图像数据进行删除;

11、所述自动化标签处理是利用脚本技术对抽帧后的图像数据进行重新编排,并将图像数据按照“采集批次—行为编号—志愿者编号—时间编号—视角编号”进行标注,并记为“x-na-np-t-e”,x、na、np、t、e分别对应采集批、行为编号、志愿者编号、时间编号以及视角编号,所述重新编排是将标记后的图像数据以pilimage的格式进行重排;

12、所述数据预处理包括,数据标准化、数据归一化以及数据集的扩充;

13、所述基于数据预处理结果构建数据集是构建图像数据总数为72568张的数据集,包括,60228张图像的训练集一集12340张图像的测试集。

14、作为本专利技术所述一种基于多视角的驾驶行为检测方法的一种优选方案,其中:所述数据预处理是通过数据标准化、数据归一化以及数据集的扩充的方法对经过自动化标签处理后的图像数据进行数据预处理;

15、所述数据标准化是利用数据转换技术将图像数据进行数据格式转换,所述数据转换技术是将经过自动化标签后的以pilimage格式的图像数据转换为张量格式的图像数据;

16、所述数据归一化是对图像数据进行数据大小的限定,将图像数据统一缩减为224*224大小尺寸的图像数据;

17、所述数据集的扩充是通过随机裁剪以及色彩随机调整的技术完成数据集的扩充,所述随机裁剪以及色彩随机调整是针对已有的图像数据进行尺寸大小的随机裁剪以及色彩的随机调整,进而完成数据集的扩充。

18、作为本专利技术所述一种基于多视角的驾驶行为检测方法的一种优选方案,其中:所述神经网络识别模型是利用构建的多视角驾驶行为数据集进行构建的,包括特征提取模块和特征融合模块;

19、所述特征提取模块包括,深度可分离卷积单元、梯度提升单元、特征通道提升单元以及计算成本降低单元;

20、所述深度可分离卷积单元包括逐通道卷积以及逐点卷积,所述逐通道卷积是利用通道数为1的卷积核确保输出特征图的通道数与输入特征图的通道数保持一致的操作;所述逐点卷积利用通道数为1×1的卷积核确保输出特征图的通道数与输入特征图的通道数保持一致的操作;

21、所述深度可分离卷积单元是利用逐通道卷积以及逐点卷积在减少参数量的基础上,对特征提取能力进行优化,所述对特征提取能力进行优化是针对传统卷积,利用参数量减少的技术,实现特征提取能力的优化,具体优化如下:

22、当利用传统卷积构建特征提取模块时,参数量的多少取决于卷积核的数量以及大小,具体取决过程如下:

23、当卷积核的大小为k×k×m,卷积核数量为n时,传统卷积总的参数量为k×k×m×n;

24、当利用深度可分离卷积单元构建特征提取模块时,参数量的多少取决于逐通道卷积核大小和数量以及逐点卷积核大小和数量,具体取决过程如下:

25、当通道卷积核大小为k×k×1,数量为m,逐点卷积核大小为1×1×m,数量为n时,深度可分离卷积总的参数量为k×k×m+m×n;

26、所述实现特征提取能力的优化是通过比较传统卷积总的参数量以及深度可分离卷积总的参数量进行实现的,具体实现公式如下:

27、

28、其中,n表示输出特征图的通道数,k表示卷积核的大小尺寸,

29、当输出特征图的通道数以及卷积核的大小尺寸大于1时,则表示深度可分离卷积能够通过减少参数量的方式,完成特征提取能力的优化。

30、作为本专利技术所述一种基于本文档来自技高网...

【技术保护点】

1.一种基于多视角的驾驶行为检测方法,其特征在于:包括以下步骤,

2.如权利要求1所述的一种基于多视角的驾驶行为检测方法,其特征在于:所述构建多视角驾驶行为数据集包括以下步骤,

3.如权利要求2所述的一种基于多视角的驾驶行为检测方法,其特征在于:所述数据预处理是通过数据标准化、数据归一化以及数据集的扩充的方法对经过自动化标签处理后的图像数据进行数据预处理;

4.如权利要求3所述的一种基于多视角的驾驶行为检测方法,其特征在于:所述神经网络识别模型是利用构建的多视角驾驶行为数据集进行构建的,包括特征提取模块和特征融合模块;

5.如权利要求4所述的一种基于多视角的驾驶行为检测方法,其特征在于:所述梯度提升单元是利用低维到高维的扩展层对图像数据进行升维操作,并利用深度可分离卷积单元对升维操作后的图像数据进行特征提取,最后利用高维到低维的压缩层对特征提取后的图像数据进行降维处理,则完成图像数据的梯度提升;

6.如权利要求1或5所述的一种基于多视角的驾驶行为检测方法,其特征在于:所述计算成本降低单元是利用h-swish激活函数来替换神经网络中的swish函数,进而完成降低计算成本,并提高神经网络精度,具体替换如下:

7.如权利要求6所述的一种基于多视角的驾驶行为检测方法,其特征在于:所述特征融合模块是利用视觉注意力机制对不同视角所提取的特征记性特征融合,包括,

8.如权利要求7所述的一种基于多视角的驾驶行为检测方法,其特征在于:所述利用空间注意力机制对所有图片的特征图进行空间特征提取是利用全局最大池化和全局平均化完成所有图片的特征图进行空间特征提取,具体如下:

9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。

...

【技术特征摘要】

1.一种基于多视角的驾驶行为检测方法,其特征在于:包括以下步骤,

2.如权利要求1所述的一种基于多视角的驾驶行为检测方法,其特征在于:所述构建多视角驾驶行为数据集包括以下步骤,

3.如权利要求2所述的一种基于多视角的驾驶行为检测方法,其特征在于:所述数据预处理是通过数据标准化、数据归一化以及数据集的扩充的方法对经过自动化标签处理后的图像数据进行数据预处理;

4.如权利要求3所述的一种基于多视角的驾驶行为检测方法,其特征在于:所述神经网络识别模型是利用构建的多视角驾驶行为数据集进行构建的,包括特征提取模块和特征融合模块;

5.如权利要求4所述的一种基于多视角的驾驶行为检测方法,其特征在于:所述梯度提升单元是利用低维到高维的扩展层对图像数据进行升维操作,并利用深度可分离卷积单元对升维操作后的图像数据进行特征提取,最后利用高维到低维的压缩层对特征提取后的图像数据进行降维处理,则完成图像数据的梯度提升;

6.如权利要求1或...

【专利技术属性】
技术研发人员:沈澍刘秉松朱浩韩文帅
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1