一种选择汽车驾驶模式的方法、系统和存储介质技术方案

技术编号:38998723 阅读:6 留言:0更新日期:2023-10-07 10:30
本发明专利技术涉及自动驾驶技术领域,公开了一种选择汽车驾驶模式的方法、系统和存储介质,所述方法包括:车载系统接收用户期望收支、起始和终止节点,并将所述起始和终止节点传输至云端服务器,所述云端服务器根据所述起始和终止节点获得包含M个节点和M个路段最优路径,并将所述最优路径传输给车载系统,车载系统包含的模型确定所述M个节点的驾驶模式和M个路段汽车与路边单元的交互方式。本发明专利技术将汽车驾驶模式的决策权交予车载系统,降低了人为选择的盲目性,提高用户体验;还引入期望收支,在训练时缩小实际支出与期望收支之间的差值,进一步提高用户体验;还引入分层强化学习方法,将问题细化,提高算法的收敛速度,再进一步提高用户体验。体验。体验。

【技术实现步骤摘要】
一种选择汽车驾驶模式的方法、系统和存储介质


[0001]本专利技术涉及自动驾驶
,特别是涉及一种基于满意度的选择汽车驾驶模式的方法、系统和存储介质。

技术介绍

[0002]随着计算机处理能力的不断提高和人工智能技术的发展,自动驾驶技术得到了极大的发展。人们在车辆上安装各种传感器和计算机系统,可以让车辆能够自主地感知、理解和决策路况,目前,一些汽车制造商已经推出了自动驾驶的电动汽车产品,例如特斯拉的自动驾驶的电动汽车和百度的自动驾驶项目Apollo等,随着自动化驾驶水平的日益提升,未来,无论是在私家车出行,还是网约车,车主在出行中除了手动驾驶以外有必要再加入提供自动驾驶的选项,在保证安全的情况下,增加自动驾驶选项必然导致道路上选择自动驾驶的车辆日益增多,众多自动驾驶车辆在同一时间段同一路段汇聚,对资源的需求是非常大的,如果智能路侧设备的计算资源或者计算能力不足,那么就无法及时处理车辆下达的任务,导致用户体验不佳,但是,现有技术只是单方面考虑了车辆自动驾驶与智能路侧设备的任务卸载,或者单方面考虑车辆将自身富余算力分享给缺乏算力的RSU,并没有将两者结合起来,导致计算资源需求地域失衡,用户满意度不高。
[0003]现有技术公开一种共享自动驾驶汽车系统,该系统包括车辆端、云端、传感器、数据采集系统和自动驾驶系统,车辆端和云端之间通过数据上传和模型下载相连,车辆端包括驾驶员身份识别模块,驾驶员身份识别模块连接有驾驶模式选择,驾驶模式选择连接有手动驾驶模式和自动驾驶模式,手动驾驶模式和自动驾驶模式分别连接有数据采集系统和自动驾驶系统,云端包括场景重建、机器学习和自动驾驶模型,场景重建连接到机器学习,机器学习连接到自动驾驶模型,现有技术公开的这种共享自动驾驶汽车系统,每次使用之前,都必须先确认驾驶员身份,再选择驾驶模式,并且选择之前并没有什么参照,很多时候有些路段不适合自动驾驶,但因驾驶员缺乏驾驶系统给出的目标路段情况反馈而错误选择自动驾驶,这样会造成驾驶员的体验不佳,

技术实现思路

本专利技术的目的是提供一种可提高用户满意度的选择汽车驾驶模式的方法、系统和存储介质。
[0004]为了实现上述目的,本专利技术提供了一种选择汽车驾驶模式的方法,包括以下步骤:步骤S1:车载系统接收期望收入、期望支出、起始节点和终止节点,并将所述起始节点和所述终止节点传输至云端服务器;步骤S2:所述云端服务器包含路径规划模型,所述路径规划模型根据所述起始节点和所述终止节点获得所述起始节点和所述终止节点之间的最优路径,所述最优路径包含M个节点和M个路段,所述云端服务器将所述最优路径传输至所述车载系统;步骤S3:所述车载系统将所述包含M个节点和M个路段最优路径、期望输入和期望
支出输入至节点驾驶模式选择模型,获得所述M个节点的驾驶模式;步骤S4:将所述M个节点的驾驶模式输入至汽车与路边单元算力共享模型,获得所述M个节点对应的下一个路段的汽车与路边单元的交互方式,完成本次驾驶模式选择。
[0005]进一步地,步骤S4中所述汽车与路边单元的交互方式包括:若所述车载系统在节点选择手动驾驶模式,则汽车与路边单元的交互决策因子β ∈{0,1},所述交互决策因子β由驾驶员确定,若β=0,则所述汽车与路边单元的交互方式为:汽车拒绝接收路边单元传输任务,若β=1,则所述汽车与路边单元的交互方式为:汽车接收路边单元传输任务,并获得收入;若所述车载系统在节点选择自动驾驶模式,则汽车与路边单元的交互决策因子β ∈ [0,1],所述汽车与路边单元的交互方式为:汽车通过支付辅助运算费用,将任务量的(β*100)%卸载到路边单元进行辅助运算。
[0006]进一步地,步骤S2中所述的路径规划模型由Astar算法训练而获得,Astar算法根据所述起止点和所述终止点,获得所述起始点和所述终止点之间的最优路径。
[0007]进一步地,所述Astar算法根据所述起止点和所述终止点,获得所述起始点和所述终止点之间的最优路径的过程包括:步骤S2.1: Astar算法初始化并确定所述起始节点,并将所述起始节点存入开放列表;步骤S2.2:确定距离所述起始节点路程和拥堵系数最小的节点,将所述最小节点存入开放列表;步骤S2.3:扩展所述距离所述起始节点路程最小的节点的相邻节点,并计算所述相邻节点的拥堵系数和路程距离,选择拥堵系数和路程距离最小的节点,将所述最小节点存入开放列表;步骤S2.4:重复步骤S2.1至步骤S2.3,直到寻找到最小节点为终止节点,在所述开放列表可获得一条从所述起始节点到达所述终止节点代价最小的最优路径。
[0008]进一步地,步骤S3中所述的节点驾驶模式选择模型和步骤S4中所述的汽车与路边单元算力共享模型由分层强化学习算法确定,所述分层强化学习算法包含上、下两层,所述分层强化学习的上层训练所述节点驾驶模式选择模型,所述节点驾驶模式选择模型决定节点的驾驶模式;所述分层强化学习的下层训练所述汽车与路边单元算力共享模型,所述汽车与路边单元算力共享模型决定所述节点对应的下一个路段汽车与路边单元的交互方式;所述车载系统在所述每一个路段设有奖励函数,所述汽车与路边单元的交互方式确定所述奖励函数,所述奖励函数会优化所述节点驾驶模式选择模型。
[0009]进一步地,所述奖励函数包括:若所述车载系统在上一个节点选择手动驾驶模式,则所述车载系统在对应的下一个路段设置的奖励函数为:若所述车载系统在上一个节点选择自动驾驶模式,则所述车载系统在对应的下一个路段设置的奖励函数为:
所述最优路径包含M个路段,式中m表示M个路段中任意一个路段,A表示自动驾驶模式,H表示手动驾驶模式,表示自动驾驶满意度系数,表示当前路段长度,E表示驾驶员输入的期望收支,表示实际收支与驾驶员设定的期望收支的差值系数,L表示总路段长度,表示任务在时隙内完成驾驶员的总收支,表示当前路段总时隙个数,表示当前路段第n个时隙。
[0010]进一步地,所述节点驾驶模式选择模型通过如下方式确定:构建节点驾驶模式选择模型;定义状态,所述节点驾驶模式选择模型为高层状态,所述高层状态的主要状态包括:其中E表示用户设定的期望收支、表示车辆x当前路口编号,当前流量支出,表示车辆当前电量;表示当前时隙的任务量,h表示状态类别为高层状态;定义动作,所述高层状态对应高层动作,所述高层动作用于确定当前节点对应的下一个路段的驾驶模式,所述高层动作由下式确定:[0, 1]为1则在路段为自动驾驶,为0则在路段为手动驾驶,所述高层动作决定低层动作;定义奖励,所述高层动作的奖励为低层动作的奖励叠加,所述高层动作的奖励用于优化所诉节点驾驶模式选择模型,所述高层动作的奖励通过下式确定:其中为当前路段的时隙总数,为低层动作在时隙的奖励;重复上述过程,获得训练好的节点驾驶模式选择模型。
[0011]进一步地,所述汽车与路边单元算力共享模型通过如下方式确定:构建汽车与路边单元算力共享模型;定义状态,所述汽车与路边单元算力共享模型为低层状态,所述低层状态的主要状态包括:其中,表示车辆当前位置,表示车辆当前电量,表示车辆当前本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种选择汽车驾驶模式的方法,其特征在于,包括以下步骤:步骤S1:车载系统接收期望收入、期望支出、起始节点和终止节点,并将所述起始节点和所述终止节点传输至云端服务器;步骤S2:所述云端服务器包含路径规划模型,所述路径规划模型根据所述起始节点和所述终止节点获得所述起始节点和所述终止节点之间的最优路径,所述最优路径包含M个节点和M个路段,所述云端服务器将所述最优路径传输至所述车载系统;步骤S3:所述车载系统将所述包含M个节点和M个路段最优路径、期望输入和期望支出输入至节点驾驶模式选择模型,获得所述M个节点的驾驶模式;步骤S4:将所述M个节点的驾驶模式输入至汽车与路边单元算力共享模型,获得所述M个节点对应的下一个路段的汽车与路边单元的交互方式,完成本次驾驶模式选择。2.根据权利要求1所述的一种选择汽车驾驶模式的方法,其特征在于,步骤S4中所述汽车与路边单元的交互方式包括:若所述车载系统在节点选择手动驾驶模式,则汽车与路边单元的交互决策因子β ∈{0,1},所述交互决策因子β由驾驶员确定,若β=0,则所述汽车与路边单元的交互方式为:汽车拒绝接收路边单元传输任务,若β=1,则所述汽车与路边单元的交互方式为:汽车接收路边单元传输任务,并获得收入;若所述车载系统在节点选择自动驾驶模式,则汽车与路边单元的交互决策因子β ∈ [0,1],所述汽车与路边单元的交互方式为:汽车通过支付辅助运算费用,将任务量的(β*100)%卸载到路边单元进行辅助运算。3.根据权利要求1所述的一种选择汽车驾驶模式的方法,其特征在于,步骤S2中所述的路径规划模型由Astar算法训练而获得,Astar算法根据所述起止点和所述终止点,获得所述起始点和所述终止点之间的最优路径。4.根据权利要求3所述的一种选择汽车驾驶模式的方法,其特征在于,所述Astar算法根据所述起止点和所述终止点,获得所述起始点和所述终止点之间的最优路径的过程包括:步骤S2.1: Astar算法初始化并确定所述起始节点,并将所述起始节点存入开放列表;步骤S2.2:确定距离所述起始节点路程和拥堵系数最小的节点,将所述最小节点存入开放列表;步骤S2.3:扩展所述距离所述起始节点路程最小的节点的相邻节点,并计算所述相邻节点的拥堵系数和路程距离,选择拥堵系数和路程距离最小的节点,将所述最小节点存入开放列表;步骤S2.4:重复步骤S2.1至步骤S2.3,直到寻找到最小节点为终止节点,在所述开放列表可获得一条从所述起始节点到达所述终止节点代价最小的最优路径。5.根据权利要求1所述的一种选择汽车驾驶模式的方法,其特征在于,步骤S3中所述的节点驾驶模式选择模型和步骤S4中所述的汽车与路边单元算力共享模型由分层强化学习算法确定,所述分层强化学习算法包含上、下两层,所述分层强化学习的上层训练所述节点驾驶模式选择模型,所述节点驾驶模式选择模型决定节点的驾驶模式;所述分层强化学习的下层训练所述汽车与路边单元算力共享模型,所述汽车与路边单
元算力共享模型决定所述节点对应的下一个路段汽车与路边单元的交互方式;所述车载系统在所述每一个路段设有奖励函数,所述汽车与路边单元的交互方式确定所述奖励函数,所述奖励函数会优化所述节点驾驶模式选择模型。6.根据权利要求5所述的一种选择汽车驾驶模式的方法,其特征在于,所述奖励函数包括:若所述车载系统在上一个节点选择手动驾驶模式,则所述车载系统在对应的下一个路段设置的奖励函数为:若所述车载系统在上一个节点选择自动驾驶模式,则所述车载系统在对应的下一个路段设置的奖励函数为:所述最优路径包含M个路段,式中m表示M个路段中任意一...

【专利技术属性】
技术研发人员:杨超陈基煌冯铭亮袁郁陈新彭泰钧
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1