基于强化学习的新能源车充电站选择及自适应导航方法技术

技术编号：33403709 阅读：18 留言：0更新日期：2022-05-11 23:26

本发明专利技术提供一种基于强化学习的新能源车充电站选择及自适应导航方法，包括步骤：获取道路信息以及充电站点信息；根据目前车辆剩余电量筛选出所有可到达充电站点；基于可到达充电站点，根据车辆行驶时间、充电时间、充电舒适度以及行驶能量消耗确定最优的充电站点及导航路线；根据导航路线前往最优的充电站点，并在途中根据交通情况采用强化学习自适应更新导航路线。本发明专利技术综合考虑实时路况信息、充电站点等待时间以及充电舒适度等影响因子来筛选出最优充电站点，并且提出基于强化学习的新能源汽车自适应路径导航机制，可以高效利用有限充电站点、显著缓解交通压力、大幅缩减用户整体充电时间，优化了现有新能源汽车的充电引导调度方案。导调度方案。导调度方案。

全部详细技术资料下载

【技术实现步骤摘要】
基于强化学习的新能源车充电站选择及自适应导航方法

[0001]本专利技术属于新能源汽车充电
，特别涉及一种基于强化学习的新能源车充电站选择及自适应导航方法。

技术介绍

[0002]在倡导绿色节能的大环境下汽车产业正在向智能化、新能源化、轻量化、共享化方向蓬勃发展。因此研究一种高效可行的充电站点选择与自适应路径导航方法，以高效利用有限充电站点、缓解交通压力、满足新能源汽车庞大充电需求、提升充电舒适度具有十分重要的意义。
[0003]目前，国内外对新能源汽车充电导航的主要研究方向在于对传统路径规划算法的优化，以提高算法的可行性。但是此类方法单纯以行驶路径最短为优化目标，评判标准过于单一，忽略了真实环境下的动态车流变化、交通灯等待时间、充电时间以及充电站点可用性等关键因素。因此基于此类方法的导航方案无法有效避免交通拥堵,难以提高充电效率。

技术实现思路

[0004]本专利技术的目的在于提出一种基于强化学习的新能源车充电站选择及自适应导航方法，能够改善电动汽车充电体验，提高充电站利用率及充电效率，节约能源。
[0005]解决本专利技术目的的技术解决方案为：一种基于强化学习的新能源车充电站选择及自适应导航方法，根据车辆行驶时间、充电时间、充电舒适度以及行驶能量消耗选择备选充电站点，并结合备选充电站点的最优路径选出最终充电方案，其具体步骤为：
[0006]步骤1，获取道路信息以及附近的充电站点信息；
[0007]步骤2，根据目前车辆剩余电量筛选出所有可到达充电站点；
...

【技术保护点】

【技术特征摘要】
1.一种基于强化学习的新能源车充电站选择及自适应导航方法，其特征在于，包括步骤：步骤1，获取道路信息以及充电站点信息；步骤2，根据目前车辆剩余电量筛选出所有可到达充电站点；步骤3，基于可到达充电站点，根据车辆行驶时间、充电时间、充电舒适度以及行驶能量消耗确定最优的充电站点及导航路线；步骤4，根据导航路线前往最优的充电站点，并在途中根据交通情况采用强化学习自适应更新导航路线。2.根据权利要求1所述的一种基于强化学习的新能源车充电站选择及自适应导航方法，其特征在于，所述步骤3具体包括：步骤3.1，根据车辆行驶时间和行驶能量消耗采用强化学习方法选择当前时间点至各可到达充电站点的最优行驶路线；步骤3.2，根据当前可到达充电站点的最优行驶路线、充电时间、充电舒适度以及行驶能量消耗确定最优充电站点。3.根据权利要求2所述的一种基于强化学习的新能源车充电站选择及自适应导航方法，其特征在于，所述步骤3.1具体包括：步骤3.1.1，根据现有路况信息构建城市道路图结构模型，并定义奖励函数；步骤3.1.2，依据状态转换值构建状态转换概率函数；步骤3.1.3，基于贝尔曼方程构建适应于路径规划的强化学习更新策略方程；步骤3.1.4，根据当时道路交通信息和随机初始化状态，重复步骤3.1.2和3.1.3迭代更新Q值，得到该时段的Q值表；步骤3.1.5，根据Q值表中数值最高的路线移动，得到当前最优路径。4.根据权利要求3所述的一种基于强化学习的新能源车充电站选择及自适应导航方法，其特征在于，所述步骤3.1.1具体包括：将城市道路抽象为图G(E)，E表示路段集，城市路段由{e1,
…
e
i
,
…
e
j
}组成，e
i
∈E,j表示城市环境中的道路总数，定义状态转移函数g
s
(s,a)表示在当前状态s下采取a行动时将会转移到下一状态,其奖励函数g
r
(s,a)表示为：其中e
s
代表充电站点所在路段，当在s状态下采用a行动可以得到e
s
状态则奖励值为100否则为零。5.根据权利要求3所述的一种基于强化学习的新能源车充电站选择及自适应导航方法，其特征在于，所述步骤3.1.2中状态转换概率函数为：其中Q(s,a)表示在状态s下采取a行动时所得到的可行性数值，称为Q值；A(s)表示在状态s下所有可以采取状态的集合，N(A(s))表示s下状态下可采取行动的总数，ε是一个随时间推移而逐渐减小的参数，ε∈(0,1)，P(a|s)表示在状态s下采取a行动的概率；
所述步骤3.1.3中强化学习更新策略方程为：其中表示学习率，γ是一个与行驶时间和能量消耗有关的参数，a'为在经过g
s
(s,a)之后的状态所采取的行动。6.根据权利要求2所述的一种基于强化学习的新能源车充电站选择及自适应导航方法，其特征在于，所述步骤3.2具体包括：步骤3.2.1，根据等待红灯时间以及车辆移动时间推断出车辆行驶时间；步骤3.2.2，分情况推断出恒流恒压两步充电策略下的充电时间；步骤3.2.3，根据充电等待时间与充电站点位置计算出充电舒适度；步骤3.2.4，根据电机传动效率和汽车平均行驶速度计算出行驶能量消耗；步骤3.2.5，根据所述车辆行驶时间、充电时间、充电舒适度、以及能量消耗计算出各充电站点的可行性并选出最优充电站点。7.根据权利要求6所述的一种基于强化学习的新能源车充电站选择及自适应导航方法，其特征在于，所述步骤3.2.1中车辆行驶时间为：其中L(e
i
)代表e
i
段的长度，v
k
(e
i
)代表e
i
段的平均速度，η(e
i
)∈{0,1}代表e
i
路段是否有交通灯，p(e
i
)表示汽车在e
i

【专利技术属性】
技术研发人员：李广宇，曹恒硕，郭伟立，肖建文，刘兴泽，
申请(专利权)人：南京理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人