基于强化学习的制动压力控制方法、装置、设备及介质制造方法及图纸

技术编号：41455086 阅读：30 留言：0更新日期：2024-05-28 20:42

本发明专利技术实施例公开了一种基于强化学习的制动压力控制方法、装置、设备及介质，包括：获取目标车辆的当前传感信息；将当前传感信息输入至目标决策网络模型进行制动系统电子部件的动作决策，其中，目标决策网络模型是根据奖励函数进行强化学习获得的，奖励函数是基于车辆的制动压力构建的；基于目标决策网络模型输出的目标动作，对制动系统电子部件的当前动作进行调整，以控制目标车辆的制动压力。本发明专利技术实施例的技术方案，将车辆的传感信息输入目标决策模型，通过目标决策网络模型进行制动系统电子部件的动作决策，得到最优的的动作组合，基于动作组合实现对目标车辆制动压力的精准控制。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及制动压力控制，尤其涉及一种基于强化学习的制动压力控制方法、装置及电子设备。

技术介绍

1、线控制动系统是自动驾驶车辆在自动紧急制动工况下的核心部件，决定汽车在行驶过程中的安全，也是汽车驾驶员在车辆失控情况下重要的主动安全器件，会自动在各个车轮上应用制动器，并允许驾驶员保持对车辆的控制。

2、目前，量产车辆的线控制动系统多数是基于现有的车身电子稳定控制系统(electronic stability control，esc)产品上做开发，esc部件串联连接了车辆制动踏板和四轮制动轮缸，主要组成有：电机、柱塞泵、电磁阀、蓄能器。线控制动的核心就是通过esc阀体内部电机和阀体的组合逻辑，实现对制动轮缸的控制。

3、当前，市面上esc阀体控制主要是基于规则控制逻辑实现的，所谓规则控制，即按照各个阀体的开关组合逻辑以及电机的转动，对四个车轮的轮缸实现增压、保压、泄压三种压力控制方式。该类型控制方式稳定，但受制于电磁阀的硬件条件，当前阀体有效开度较低(国产一般为30％-55％)，在执行时阀芯比较容易出现全开或全闭...

【技术保护点】

1.一种基于强化学习的制动压力控制方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，在将所述当前传感信息输入至目标决策网络模型进行制动系统电子部件的动作决策之前，还包括：

3.根据权利要求2所述的方法，其特征在于，所述目标奖励函数包括压力偏差函数，所述基于所述当前制动压力、所述样本制动压力和所述奖励函数，调整所述待训练决策网络模型的网络参数，包括：

4.根据权利要求2所述的方法，其特征在于，所述目标奖励函数包括压力控制稳定性函数，所述基于所述当前制动压力、所述样本制动压力和所述奖励函数，调整所述待训练决策网络模型的

【技术特征摘要】

1.一种基于强化学习的制动压力控制方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，在将所述当前传感信息输入至目标决策网络模型进行制动系统电子部件的动作决策之前，还包括：

4.根据权利要求2所述的方法，其特征在于，所述目标奖励函数包括压力控制稳定性函数，所述基于所述当前制动压力、所述样本制动压力和所述奖励函数，调整所述待训练决策网络模型的网络参数，包括：

5.根据权利要求1所述的方法，其特征在于，所述制动系统的电子部件包括电磁阀和...

【专利技术属性】
技术研发人员：郭宇杰，周俊杰，王文斌，安博，施浩然，
申请(专利权)人：南栖仙策南京高新技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人