【技术实现步骤摘要】
一种基于Q
‑
Learning强化学习的状态空间缩减方法
[0001]本专利技术涉及电动汽车的能量管理
,具体涉及一种基于
Q
‑
Learning
强化学习的状态空间缩减方法
。
技术介绍
[0002]基于强化学习的控制策略是人工智能技术在电动汽车领域的一种创新性应用,如:基于
Q
‑
Learning
控制策略,其自我学习
、
系我增强的控制特点,规避了控制策略的控制缺陷,可有效解决未知动态工况下的最优控制问题
。
[0003]但是该类策略对控制器的算力有着较高的要求,目前仅限于理论研究阶段,难以实际应用于实车控制
。
[0004]原因在于:基于
Q
‑
Learning
的控制策略要求当先动作能够精确捕捉当前状态,因此需要对状态空间进行精细化设计,以插电式混合动力汽车为例,需要至少3个变量为状态,如将每个状态划分为离散的
100
份,则状态矩阵的大小为
100
×
100
×
100=1000000
,如此庞大的状态矩阵将导致现有控制器的算力失效;基于深度强化学习的控制策略由于嵌入了多层神经网络,需要加装价格昂贵的
GPU
进行运算,但是,由于
GPU
价格昂贵和国外底层封锁等原因,基于该类算法的控制策略难以实现产业化应用
。
...
【技术保护点】
【技术特征摘要】
1.
一种基于
Q
‑
Learning
强化学习的状态空间缩减方法,其特征在于,该方法包括以下步骤:
P1
:状态参数的选取,选取电池荷电状态
SOC、
归一化路程
LD
以及当前行驶距离
DIS
为状态参数;
P2
:以步骤
P1
选择的三种状态参数为
X
轴
、Y
轴
、Z
轴,构造一个三维空间,并对该空间进行区间划分,将
X
轴的归一化路程
0~1
划分为
n
等份,
n
小于
100
;将
Z
轴的电池荷电状态 0~1
划分为
m
等份,
m
小于
100
;将
Y
轴的当前行驶距离划分为
i
等份,
i
小于
100
;沿
X
轴
、Y
轴
、Z
轴的等分点分别平行于坐标轴的直线将三维空间划分成由小的立方块构...
【专利技术属性】
技术研发人员:秦培皓,郭洪强,李志磊,孟庆猛,陈纪军,
申请(专利权)人:聊城大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。