一种用于驾驶风格识别模型的训练样本预处理方法技术

技术编号:38223280 阅读:22 留言:0更新日期:2023-07-25 17:55
本发明专利技术公开了一种用于驾驶风格识别模型的训练样本预处理方法,属于驾驶风格识别技术领域。本发明专利技术的方法采用驾驶员在出行过程中所产生的驾驶事件直接作为驾驶风格识别模型的训练样本;首先将驾驶员驾驶风格类别标签直接作为驾驶事件类别标签,然后采用标签降噪方法检测并去除本身与标签不匹配的样本。解决了现有技术中训练出的驾驶风格识别模型性能差、识别不准确的技术问题。别不准确的技术问题。别不准确的技术问题。

【技术实现步骤摘要】
一种用于驾驶风格识别模型的训练样本预处理方法


[0001]本专利技术属于驾驶风格识别
,具体涉及一种用于驾驶风格识别模型的训练样本预处理方法。

技术介绍

[0002]驾驶风格识别在交通安全、节能减排以及驾驶个性化等领域具有重要意义。近年来,大数据与人工智能技术的飞速发展,使得基于机器学习的驾驶风格识别成为了研究热点。当前,基于机器学习的驾驶风格识别主要存在两条技术路线:基于聚类算法的驾驶风格识别;基于分类算法的驾驶风格识别。聚类算法将输入样本自动划分为多个类别,该方法脱离了样本类别标签的指导,导致识别结果争议性较大、说服力不足。因此,对模型的训练样本进行预处理是十分必要的,如:中国专利CN106485263B、CN111401483B和CN114444619B。
[0003]在工程实践中,基于分类算法的驾驶风格识别往往会面临以下技术难题:(1)受试驾驶员数量不足:在常规数据采集实验中,由于被试车资源有限,所能招募到的驾驶员数量往往较少,这将导致模型的训练样本不足。在这种情况下,难以训练获得性能较好的驾驶风格识别模型。(2)受试驾驶本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于驾驶风格识别模型的训练样本预处理方法,其特征在于,具体步骤如下:步骤1,采集预设时间内S名驾驶员的操控数据、车辆运动状态数据、驾驶场景特征数据和驾驶员驾驶风格类别标签;将采集的所有驾驶员的操控数据、车辆运动状态数据以及驾驶场景特征数据组成训练驾驶风格识别模型的时间序列原始数据;步骤2,从时间序列原始数据中获取多个驾驶事件数据片段;从驾驶事件数据片段中提取驾驶事件特征参数;由每个驾驶事件数据片段的驾驶事件特征参数构成该驾驶事件数据片段对应的多维特征向量;集合相同类型的多个驾驶事件数据片段的多维特征向量,获得驾驶事件特征向量集;对驾驶事件特征向量集中的每个多维特征向量进行驾驶员驾驶风格类别标签标注,获得第一特征向量集;其中,第一特征向量集中的每个特征向量为带有驾驶员驾驶风格类别标签的样本;步骤3,检查第一特征向量集中带有不同驾驶员驾驶风格类别标签的样本类别比例,若多数类样本数量与少数类样本总数量之比大于等于均衡阈值,则样本类别不均衡,进入步骤4;若多数类样本数量与少数类样本总数量之比小于均衡阈值,则样本类别均衡,进入步骤5;步骤4,采用考虑标签噪声的合成少数过采样方法对步骤3输出的第一特征向量集中的少数类样本进行过采样处理,获得第二特征向量集,进入步骤5;步骤5,确认输入特征向量集,若有步骤4输出的第二特征向量集,则将第二特征向量集作为输入特征向量集;若无步骤4输出的第二特征向量集,则将步骤2输出的第一特征向量集作为输入特征向量集;对输入特征向量集进行类别标签降噪处理,去除与原有类别标签不匹配的样本,获得第三特征向量集;判断第三特征向量集的样本类别比例是否均衡,若样本类别比例不均衡,进入步骤6;若样本类别比例均衡,进入步骤7;步骤6,对第三特征向量集中的少数类样本进行合成少数过采样,获得第四特征向量集,进入步骤7;步骤7,若有步骤6输出的第四特征向量集,则用其训练驾驶风格识别模型;若无步骤6输出的第四特征向量集,则用步骤5输出的第三特征向量集训练驾驶风格识别模型。2.根据权利要求1所述的用于驾驶风格识别模型的训练样本预处理方法,其特征在于,步骤1所述时间序列原始数据中,驾驶员的操控数据包括油门踏板开度、制动踏板开度和方向盘转角;车辆运动状态数据包括自车车速和自车纵向加速度;驾驶场景特征数据包括自车两侧车道线的曲率半径、自车到左侧车道线的距离与车道宽度的比值和自车与同车道前车的纵向距离;驾驶员驾驶风格类别标签包括运动型、普通型和谨慎型。3.根据权利要求1所述的用于驾驶风格识别模型的训练样本预处理方法,其特征在于,设置车况传感器和视觉传感器,车况传感器用于获取驾驶员操控数据与车辆运动状态数据,视觉传感器用于获取驾驶场景特征数据。4.根据权利要求1所述的用于驾驶风格识别模型的训练样本预处理方法,其特征在于,驾驶事件数据片段类型包括加速、制动、转向、跟驰和换道。5.根据权利要求1所述的用于驾驶风格识别模型的训练样本预处理方法,其特征在于,步骤2中从步骤1输出的时间序列原始数据中截取多个数据片段的方法为:从时间序列原始数据中截取任一数据片段,从该数据片段中获取车道线曲率半径、自车车速、自车与同车道前车的纵向距离、自车到左侧车道线的距离与车道宽度的比值和方
向盘转角;如果该数据片段中的车道线曲率半径、自车车速、自车与同车道前车的纵向距离、自车到左侧车道线的距离与车道宽度的比值和方向盘转角满足对应的驾驶...

【专利技术属性】
技术研发人员:刘艳芳李炳贤赵俊玮刘学武徐向阳董鹏王书翰
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1