一种基于离线强化学习的汽车防抱死制动系统和方法技术方案

技术编号：41073587 阅读：2 留言：0更新日期：2024-04-24 11:30

本发明专利技术揭示了一种基于离线强化学习的汽车防抱死制动系统，系统设有用于采集与汽车运动和环境相关的数据采集模块，所述数据采集模块连接并输出所采集的信号至归一化预处理模块，所述归一化预处理模块连接并输出预处理后的数据至动力学模型学习模块；所述动力学模型学习模块与控制策略学习模块信息交互，所述控制策略学习模块将获取汽车防抱死制动系统的控制方法输送至汽车制动系统执行。本发明专利技术能够克服传统系统存在的固定策略和标定问题，以提高汽车的安全性能并减少成本，通过引入了离线强化学习方法，允许系统自动学习和优化制动策略，以提高汽车制动性能，缩短制动距离，提高安全性能，并减少了对系统标定和测试的需求。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及汽车制动系统领域，尤其特别是一种基于离线强化学习的汽车防抱死制动系统。

技术介绍

1、本领域通常涉及汽车制动系统，其中防抱死系统是关键组成部分，旨在确保汽车在制动时不会失去稳定性。传统的防抱死系统依赖于固定的制动策略，这些策略可能无法适应不同路况和驾驶情境。

2、例如公开号为cn110262491b，公开日为2021-12-14，专利名称为《一种基于混合学习方式的车辆制动意图预测的方法及系统》的公开文献，公开了车辆制动意图的预测技术，能够提前进行制动控制、进行制动能量的管理，从而提高车辆的制动性能、提高能量回收效率。本专利技术方法为：首先采集数据并对采集的数据进行平滑处理、归一化处理；然后基于无监督学习方式模糊c均值算法将制动意图聚为四类：轻微制动、普通制动、强制动、紧急制动；再基于特征选择算法relieff进行特征参数的选择；最后基于监督学习算法adaboost离线训练制动意图预测模型，用于在线预测。所述系统主要包括：压力传感器、电机控制器、电池控制器、变速箱控制器、can总线、外围电路、电子控制单元ecu，离线训练得到的预测模型位于ecu内，用于在线预测。

3、传统系统通常需要定期的标定和测试，以确保其性能，不仅增加了成本，还限制了系统的实用性。因此，寻找一种更智能、自适应的制动系统是本领域的挑战之一。

技术实现思路

1、本专利技术所要解决的技术问题是实现一种基于离线强化学习的汽车防抱死制动系统，旨在提高汽车的制动性能，缩短制动距离，并减少对系统标定和测试的需求。

2、为了实现上述目的，本专利技术采用的技术方案为：一种基于离线强化学习的汽车防抱死制动系统，系统设有用于采集与汽车运动和环境相关的数据采集模块，所述数据采集模块连接并输出所采集的信号至归一化预处理模块，所述归一化预处理模块连接并输出预处理后的数据至动力学模型学习模块；所述动力学模型学习模块与控制策略学习模块信息交互，所述控制策略学习模块将获取汽车防抱死制动系统的控制方法输送至汽车制动系统执行。

3、所述数据采集模块包括车速采集模块、横摆角速度采集模块、侧偏角采集模块、横向加速度采集模块、纵向加速度采集模块、四个轮速采集模块、方向盘转角采集模块、主缸压力采集模块、以及四个制动阀门的状态采集模块。

4、所述归一化预处理模块用于对数据采集模块所采集的信号进行归一化预处理，将数据缩放到平均值为0，标准差为1的标准正态分布中。

5、所述动力学模型学习模块用于汽车运动状态进行建模，通过采用gru神经网络学习汽车的动力学模型，利用所学习的动力学模型对汽车运动状态进行建模。

6、所述控制策略学习模块用于汽车防抱死制动系统的控制，通过采用bdqn强化学习算法，将状态空间数据、动作空间数据通过奖励函数设计和策略优化学习来实现汽车防抱死制动系统的控制；

7、所述状态空间数据包括车速、横摆角速度、侧偏角、横向加速度、纵向加速度、四个轮速、方向盘转角，所述动作空间为四个制动阀门的状态；

8、所述控制策略学习模块网络结构：

9、输入层：输入层接收状态空间中的各个参数作为输入，共10维；

10、隐藏层：2个隐藏层用于学习状态和动作之间的复杂关系，每层神经元数量为256；

11、输出层：输出层负责输出每个可能动作的q值，用于导决策过程。

12、基于所述基于离线强化学习的汽车防抱死制动系统的制动方法，包括以下步骤

13、步骤1、数据采集；

14、步骤2、数据预处理；

15、步骤3、建模汽车的动力学模型；

16、步骤4、根据建模使汽车在不同的驾驶情境下保持安全性能，同时尽可能减小制动距离。

17、所述步骤1数据采集包括以下数据：

18、车速vx为车辆的纵向速度；

19、横摆角速度r提供有关车辆横向运动的信息；

20、侧偏角β提供车辆的侧向姿态信息；

21、横向加速度ay提供关于车辆侧向运动的加速度信息；

22、纵向加速度ax测量车辆的纵向加速度；

23、四个轮速用wi表示，其中i表示车轮编号；

24、方向盘转角为δ；

25、主缸压力为制动系统的主缸压力p，反映制动力的施加情况；

26、以及四个制动阀门的状态用ui表示，其中i为阀门编号，每个阀门有三种状态：保压、增压和减压，每个阀门的三种状态是动力学模型学习模块的输入，也是控制策略学习模块输出。

27、所述步骤2数据预处理是针对采集的数据进行归一化处理，标准化处理公式：

28、

29、xnormalized表示标准化后的数据，x表示原始数据μ表示数据的均值，σ表示数据的标准差，通过标准化处理公式将每个传感器的数据缩放到平均值为0、标准差为1的标准正态分布中。

30、所述步骤3采用gru神经网络建模，gru用于输入当前汽车状态和阀门状态，输出下一时刻的汽车状态；

31、所述gru神经网络包括gru层、稠密层、损失函数、优化器、学习率衰减策略；

32、gru层包含150个神经元，用于处理输入数据的时序信息，从而捕获车辆动力学模型的时间依赖性；

33、所述稠密层紧随gru层之后，是包含150个神经元的全连接稠密层，用于将gru层的输出映射到所需的输出空间；

34、所述损失函数：采用均方误差损失函数，用于衡量模型的输出与目标值之间的差异。

35、所述优化器：使用nesterov-adam优化器，用于在训练过程中收敛到最佳模型参数；

36、所述学习率衰减策略：用于在连续10个训练周期中没有取得进展，学习率将减小10％。

37、所述步骤4中，通过参数信息获取状态空间和动作空间；

38、所述状态空间：包括车速、横摆角速度、侧偏角、横向加速度、纵向加速度，轮速等；

39、所述动作空间：由多维离散的阀门状态构成，每个阀门都有三种状态：保压、增压和减压；

40、基于状态空间和动作空间的奖励函数，包括：

41、滑移率：通过奖励函数，滑移率被维持在一定范围内；

42、最大减速度：奖励函数还鼓励获得最大减速度；

43、侧偏角约束：对侧偏角进行约束，以确保车辆在各种路面情况下都能保持稳定性。

44、本专利技术能够克服传统系统存在的固定策略和标定问题，以提高汽车的安全性能并减少成本，通过引入了离线强化学习方法，允许系统自动学习和优化制动策略，以提高汽车制动性能，缩短制动距离，提高安全性能，并减少了对系统标定和测试的需求。

本文档来自技高网...

【技术保护点】

1.一种基于离线强化学习的汽车防抱死制动系统，其特征在于：系统设有用于采集与汽车运动和环境相关的数据采集模块，所述数据采集模块连接并输出所采集的信号至归一化预处理模块，所述归一化预处理模块连接并输出预处理后的数据至动力学模型学习模块；所述动力学模型学习模块与控制策略学习模块信息交互，所述控制策略学习模块将获取汽车防抱死制动系统的控制方法输送至汽车制动系统执行。

2.根据权利要求1所述基于离线强化学习的汽车防抱死制动系统，其特征在于：所述数据采集模块包括车速采集模块、横摆角速度采集模块、侧偏角采集模块、横向加速度采集模块、纵向加速度采集模块、四个轮速采集模块、方向盘转角采集模块、主缸压力采集模块、以及四个制动阀门的状态采集模块。

3.根据权利要求1所述基于离线强化学习的汽车防抱死制动系统，其特征在于：所述归一化预处理模块用于对数据采集模块所采集的信号进行归一化预处理，将数据缩放到平均值为0，标准差为1的标准正态分布中。

4.根据权利要求1所述基于离线强化学习的汽车防抱死制动系统，其特征在于：所述动力学模型学习模块用于汽车运动状态进行建模，通过采用

5.根据权利要求1所述基于离线强化学习的汽车防抱死制动系统，其特征在于：所述控制策略学习模块用于汽车防抱死制动系统的控制，通过采用BDQN强化学习算法，将状态空间数据、动作空间数据通过奖励函数设计和策略优化学习来实现汽车防抱死制动系统的控制；

6.基于权利要求1-5中任一所述基于离线强化学习的汽车防抱死制动系统的制动方法，其特征在于，包括以下步骤

7.根据权利要求6所述的制动方法，其特征在于：所述步骤1数据采集包括以下数据：

8.根据权利要求6所述的制动方法，其特征在于：所述步骤2数据预处理是针对采集的数据进行归一化处理，标准化处理公式：

9.根据权利要求6所述的制动方法，其特征在于：所述步骤3采用GRU神经网络建模，GRU用于输入当前汽车状态和阀门状态，输出下一时刻的汽车状态；

10.根据权利要求6所述的制动方法，其特征在于：所述步骤4中，通过参数信息获取状态空间和动作空间；

...

【技术特征摘要】

4.根据权利要求1所述基于离线强化学习的汽车防抱死制动系统，其特征在于：所述动力学模型学习模块用于汽车运...

【专利技术属性】
技术研发人员：李贵喜，纪其进，
申请(专利权)人：上海砺群科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人