融合路侧感知的智能驾驶决策控制系统技术方案

技术编号:39749412 阅读:25 留言:0更新日期:2023-12-17 23:47
本发明专利技术公开了一种融合路侧感知的智能驾驶决策控制系统

【技术实现步骤摘要】
融合路侧感知的智能驾驶决策控制系统


[0001]本专利技术属于智能驾驶的
,具体涉及一种融合路侧感知的智能驾驶决策控制系统


技术介绍

[0002]决策控制是智能驾驶系统主要组成,大致分为基于规则和基于学习的两类方法

人为设置规则不仅需要花费大量的人力物力,并难以覆盖所有通行场景,而基于学习的决策控制能够自主学习进步,但存在解释性差

安全保障性低等缺点,与此同时,相比于路侧感知,单车感知存在视野盲点

成本高

算法鲁棒性要求高等缺点

[0003]在现有的智能驾驶决策控制模型中,存在一种基于强化学习与深度学习编码器实现的方式,使用前视图作为模型输入,经过计算后输出转角控制值,然后直接部署于实车中进行学习训练,在经过短时学习
(15

20
分钟
)
后,只用驾驶员的接管的时间作为训练反馈,就可以让一辆车学会在一个小路上保持车道驾驶

[0004]但是,这种方式适应性较差,只能在预定路段或者外观类似的路段完成任务,控制量只有转角值,缺乏纵向速度控制,感知传感器只使用了摄像头,对环境感知不够全面,只能完成较为简单的车道保持任务,不能完成更复杂的任务


技术实现思路

[0005]为了克服现有技术存在的缺陷与不足,本专利技术的目的在于提供一种融合路侧感知的智能驾驶决策控制系统,用于在智能驾驶的决策控制中,提升对环境的感知能力,能够同时实现对车辆的横向与纵向的决策控制,即输出车辆的转角

油门

刹车的控制量,兼顾安全性和决策效率,对不同道路的适应性更强

[0006]为了达到上述目的,本专利技术采用以下技术方案:
[0007]一种融合路侧感知的智能驾驶决策控制系统,包括依次连接的采集单元

决策单元

控制单元;
[0008]采集单元用于收集车辆自身信息

路侧感知信息

车辆自身的前视图像并进行预处理;
[0009]决策单元用于根据预处理后的车辆自身信息

路侧感知信息

车辆自身的前视图像对车辆的动作进行决策;
[0010]决策单元以路侧感知信息和前视图像作为输入,最终输出横向的动作决策和纵向的动作决策;
[0011]控制单元用于根据横向的动作决策

纵向的动作决策,操作车辆自身执行相应的转向角度

油门

刹车量

[0012]优选地,采集单元包括车载
OBU
装置

图像获取模块

自车信息模块

图像预处理模块;
[0013]车载
OBU
装置用于接收路侧感知信息;
[0014]图像获取模块用于采集车辆自身的前视图像;
[0015]自车信息模块用于采集并存储车辆自身的位置

几何尺寸

结构参数

运动参数等信息;
[0016]每个前视图像和对应时刻的车辆自身信息组成了一个车辆自身的当前状态;
[0017]预处理模块与图像获取模块连接,预处理模块用于将前视图像依次进行滤波去噪

压缩像素

归一化处理

[0018]进一步地,前视图像具体类型为
RGB
色域图像;
[0019]图像获取模块为设于车辆前视视角的相机

[0020]进一步地,决策单元包括深度强化学习横向模块

知识推理纵向模块;
[0021]深度强化学习横向模块的输入分别与图像预处理模块

自车信息模块连接;
[0022]深度强化学习横向模块用于对车辆的横向动作进行决策;
[0023]深度强化学习横向模块的结构基于
Actor

Critic
框架的
TD3
算法,采用优先经验回放

重要性采样
、Ornstein

Uhlenbeck
噪声对
TD3
算法进行改进;
[0024]知识推理纵向模块分别与自车信息模块

车载
OBU
装置连接;
[0025]知识推理纵向模块为有限状态机,有限状态机用于根据路侧感知信息与车辆自身信息进行计算得到车辆自身的纵向动作的决策

[0026]进一步地,深度强化学习横向模块包括动作器

评价器;
[0027]动作器为
Actor

Critic
框架中的策略网络
Actor

[0028]动作器的输入分别与自车信息模块

图像预处理模块连接,动作器的输出与控制单元连接;
[0029]动作器使用多个卷积层结合多个全连接层的结构,激活函数采用
Relu
,并对卷积网络使用最大池化层进行池化处理;
[0030]动作器的输入为自车信息

经过预处理的前视图像,输出为横向动作的控制量决策;
[0031]评价器为
Actor

Critic
框架中的评价网络
Critic
,评价器分别与策略网络

自车信息模块

图像预处理模块连接;
[0032]评价器的输入为动作器的输出

自车信息

经过预处理的前视图像,评价器的输出为对于动作器输出的评价值,评价器用于结合决策奖励对动作器进行更新

[0033]进一步地,横向动作的控制量为车辆自身的转角值;
[0034]动作器使用一维高斯滤波器平滑动作器输出的转角值

[0035]进一步地,深度强化学习横向模块还包括在线策略网络

在线评价网络

经验池模块;
[0036]在线策略网络的结构与动作器相同,在线评价网络的结构与评价器相同;
[0037]在线策略网络

在线评价网络

经验池均用于对动作器和评价器的训练;
[0038]在线评价网络分别与在线策略网络

评价器连接,在线评价网络向在线策略网络反馈评价值;
[0039]经验池模块分别与在线策略网络

动作器

在线评价网络

评价器连接;经验池模块内存储有马尔科夫决策经验序列,马尔科夫决策经本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种融合路侧感知的智能驾驶决策控制系统,其特征在于,包括依次连接的采集单元

决策单元

控制单元;所述采集单元用于收集车辆自身信息

路侧感知信息

车辆自身的前视图像并进行预处理;所述决策单元用于根据预处理后的车辆自身信息

路侧感知信息

车辆自身的前视图像对车辆的动作进行决策;决策单元以路侧感知信息和前视图像作为输入,最终输出横向的动作决策和纵向的动作决策;所述控制单元用于根据横向的动作决策

纵向的动作决策,操作车辆自身执行相应的转向角度

油门

刹车量
。2.
根据权利要求1所述的融合路侧感知的智能驾驶决策控制系统,其特征在于,采集单元包括车载
OBU
装置

图像获取模块

自车信息模块

图像预处理模块;所述车载
OBU
装置用于接收路侧感知信息;所述图像获取模块用于采集车辆自身的前视图像;所述自车信息模块用于采集并存储车辆自身的位置

几何尺寸

结构参数

运动参数等信息;每个前视图像和对应时刻的车辆自身信息组成了一个车辆自身的当前状态;所述预处理模块与图像获取模块连接,预处理模块用于将前视图像依次进行滤波去噪

压缩像素

归一化处理
。3.
根据权利要求2所述的融合路侧感知的智能驾驶决策控制系统,其特征在于,所述前视图像具体类型为
RGB
色域图像;所述图像获取模块为设于车辆前视视角的相机
。4.
根据权利要求3所述的融合路侧感知的智能驾驶决策控制系统,其特征在于,决策单元包括深度强化学习横向模块

知识推理纵向模块;所述深度强化学习横向模块的输入分别与图像预处理模块

自车信息模块连接;深度强化学习横向模块用于对车辆的横向动作进行决策;深度强化学习横向模块的结构基于
Actor

Critic
框架的
TD3
算法,采用优先经验回放

重要性采样
、Ornstein

Uhlenbeck
噪声对
TD3
算法进行改进;知识推理纵向模块分别与自车信息模块

车载
OBU
装置连接;知识推理纵向模块为有限状态机,所述有限状态机用于根据路侧感知信息与车辆自身信息进行计算得到车辆自身的纵向动作的决策
。5.
根据权利要求4所述的融合路侧感知的智能驾驶决策控制系统,其特征在于,深度强化学习横向模块包括动作器

评价器;动作器为
Actor

Critic
框架中的策略网络
Actor
;动作器的输入分别与自车信息模块

图像预处理模块连接,动作器的输出与控制单元连接;动作器使用多个卷积层结合多个全连接层的结构,激活函数采用
Relu
,并对卷积网络使用最大池化层进行池化处理;动作器的输入为自车信息

经过预处理的前视图像,输出为横...

【专利技术属性】
技术研发人员:潘祖燊卢仲康李巍华陈伟侠王航
申请(专利权)人:广州华工机动车检测技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1