一种环境变化下列车自适应学习的自动驾驶控制方法技术

技术编号:38606011 阅读:17 留言:0更新日期:2023-08-26 23:37
本发明专利技术提供了一种环境变化下列车自适应学习的自动驾驶控制方法,其特征在于:所述自动驾驶控制方法包括:从成熟线路的多条线路采集自动驾驶数据,然后设置多个基础学习器和一个综合学习器,将多条线路的自动驾驶数据分别用于多个基础学习器的训练,然后使多个基础学习器依次与综合学习器进行交互训练,将最终得到的综合学习器的模型参数赋予至新建线路学习器的深度学习模型中,然后采用新建线路的小样本自动驾驶数据对新建线路学习器进行训练得到可用新建线路学习器,采用可用新建线路学习器对列车进行自动驾驶控制。采用本发明专利技术所述的方法,能快速、高效地在新建线路上利用机器学习的方法高精度地控制列车的运行。学习的方法高精度地控制列车的运行。学习的方法高精度地控制列车的运行。

【技术实现步骤摘要】
一种环境变化下列车自适应学习的自动驾驶控制方法


[0001]本专利技术涉及交通运输
,特别是一种环境变化下列车自适应学习的自动驾驶控制方法。

技术介绍

[0002]随着数据驱动和机器学习的发展,机器学习方法成为列车操控的常用手段。该方法可挖掘人工驾驶数据,实现列车的智能驾驶操控。对成熟线路的轨道交通运行线路而言,列车在不同的调度时刻表下运行过程中,已积累了大量的运行数据。对这些数据进行采集并处理后,是较易用机器学习来实现列车智能驾驶控制的,采用这种方法所得到的列车智能驾驶控制精度高,乘坐舒适且节能。
[0003]但是,对于新建(新开通)的轨道线路而言,由于列车运行的轨道线路的环境发生了变化,列车自动驾驶的调度时刻表也有所调整,成熟线路的自动驾驶数据不能直接用于新开通线路的机器学习,而新建线路列车运行时间不长,可采集的驾驶数据量少,即带标签的数据量较少,采用机器学习训练过后的模型,其自动驾驶控制精度不高。现有技术中,通常需要单独搭建系统,并经过长时间的列车运行,待积累了大量的运行数据后,才能采用机器学习的方法进行列车的自动驾驶。这将导致采用机器学习实现自动驾驶等待时间长,且对原有成熟线路的列车自动驾驶数据利用不充分,无法实现成熟线路的列车运行数据与新建线路列车运行数据的共享,造成了成熟线路列车运营数据价值的严重浪费。

技术实现思路

[0004]针对
技术介绍
的问题,本专利技术提供一种环境变化下列车自适应学习的自动驾驶控制方法,以解决在新建线路上如何采用机器学习的方式,快速高效、高精度地实现列车自动驾驶的问题。
[0005]为实现本专利技术的目的,本专利技术提供了一种环境变化下列车自适应学习的自动驾驶控制方法,其特征在于:所述列车设置有用于控制列车运行的自动驾驶模块;列车运行的调度时刻表类型包括高峰调度时刻表、平峰调度时刻表和低峰调度时刻表;所述自动驾驶控制方法包括:
[0006]设新建线路为新开通的列车线路上两个相邻站点间的线路,设新建线路上运行的列车型号为X型;
[0007]一)从成熟线路采集多个X型列车的自动驾驶数据,采用k

means算法按调度时刻表类型对多个X型列车的自动驾驶数据进行聚类计算,得到高峰、平峰和低峰三个数据集;单个数据集包括多条线路,每个线路包括多个自动驾驶数据;
[0008]所述成熟线路为稳定运行的列车线路上两个相邻站点间的线路,所述成熟线路与新建线路的长度偏不大于
±
5%;
[0009]二)对高峰数据集、平峰数据集和低峰数据集均按方法一进行处理,分别得到对应的高峰成熟线路综合学习器、平峰成熟线路综合学习器和低峰成熟线路综合学习器;
[0010]三)设置初始的高峰新建线路学习器、平峰新建线路学习器和低峰新建线路学习器,按方法二利用高峰成熟线路综合学习器、平峰成熟线路综合学习器和低峰成熟线路综合学习器分别对高峰新建线路学习器、平峰新建线路学习器和低峰新建线路学习器进行更新,得到高峰可用新建线路学习器、平峰可用新建线路学习器和低峰可用新建线路学习器;
[0011]所述高峰新建线路学习器、平峰新建线路学习器和低峰新建线路学习器分别设置有一个深度神经网络模型;
[0012]四)将高峰可用新建线路学习器、平峰可用新建线路学习器和低峰可用新建线路学习器均装载到X型列车的自动驾驶模块上;X型列车的高峰调度时刻表、平峰调度时刻表和低峰调度时刻表三个调度时刻表分别与高峰可用新建线路学习器、平峰可用新建线路学习器和低峰可用新建线路学习器三个可用新建线路学习器一一对应;X型列车根据当前所采用的调度时刻表选取对应的可用新建线路学习器用于列车的自动驾驶控制;
[0013]所述方法一包括:
[0014]将高峰数据集、平峰数据集和低峰数据集三者的其中任意一个数据集记为Q数据集;
[0015]设Q数据集包括n条线路;设置n个基础学习器和一个综合学习器,n个基础学习器均与综合学习器连接,n个基础学习器与n条线路一一对应;所述基础学习器内和综合学习器内均设置有深度神经网络模型,将基础学习器内的深度神经网络模型记为基础模型,将综合学习器内的深度神经网络模型记为综合模型;
[0016]综合学习器依次与n个基础学习器进行数据交互,每次数据交互过程包括以下步骤:
[0017]A)综合学习器将当前综合模型的模型参数θ
Q
传输给第i个基础学习器,i为1到n的整数;综合学习器随机生成综合模型初始的模型参数θ
Q

[0018]B)第i个基础学习器利用公式一对对应的基础模型的模型参数进行N次迭代更新,同时得到N次迭代更新后的损失函数梯度值,将第N次迭代更新后得到的损失函数梯度值记为反馈损失函数梯度值;
[0019]C)第i个基础学习器将反馈损失函数梯度值传输给综合学习器;
[0020]D)综合学习器利用收到的反馈损失函数梯度值采用公式二对模型参数θ
Q
进行更新;
[0021]当综合学习器完成与n个基础学习器的数据交互后,得到的综合学习器即为Q数据集对应的成熟线路综合学习器;
[0022]所述公式一为:
[0023][0024]其中,j为1至N的整数,N为设定值;α为基础模型的步长参数,为设定值;f
Φ
表示基础学习器,Φ表示基础学习器的模型参数,L
i
(f
Φ
)表示第i个基础学习器的损失函数,表示第i个基础学习器的损失函数梯度在迭代j

1次后的参数处的取值;
[0025]当j=1时,即为第i个基础学习器收到的从综合学习器传输的模型参数θ
Q
;当j
=N时,通过N次迭代更新后得到的损失函数梯度值即为
[0026]所述公式二为:
[0027][0028]其中,β为综合模型的步长参数,为设定值;
[0029]所述方法二包括:
[0030]1)将高峰成熟线路综合学习器的模型参数赋予至高峰新建线路学习器的深度神经网络模型;将平峰成熟线路综合学习器的模型参数赋予至平峰新建线路学习器的深度神经网络模型;将低峰成熟线路综合学习器的模型参数赋予至低峰新建线路学习器的深度神经网络模型;
[0031]2)从新建线路分别采集X型列车在高峰调度时刻表、平峰调度时刻表和低峰调度时刻表三个调度时刻表下的列车驾驶小样本数据;将在高峰调度时刻表下从新建线路采集的列车驾驶小样本数据记为新建线路高峰小样本数据;将在平峰调度时刻表下从新建线路采集的列车驾驶小样本数据记为新建线路平峰小样本数据;将在低峰调度时刻表下从新建线路采集的列车驾驶小样本数据记为新建线路低峰小样本数据;
[0032]3)利用新建线路高峰小样本数据对高峰新建线路学习器的深度神经网络模型进行训练得到高峰可用新建线路学习器;利用新建线路平峰小样本数据对平峰新建线路学习器的深度神经网络模型进行训练得到平峰可用新建线路学习器;利用新建线路低峰小样本数据对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种环境变化下列车自适应学习的自动驾驶控制方法,其特征在于:所述列车设置有用于控制列车运行的自动驾驶模块;列车运行的调度时刻表类型包括高峰调度时刻表、平峰调度时刻表和低峰调度时刻表;所述自动驾驶控制方法包括:设新建线路为新开通的列车线路上两个相邻站点间的线路,设新建线路上运行的列车型号为X型;一)从成熟线路采集多个X型列车的自动驾驶数据,采用k

means算法按调度时刻表类型对多个X型列车的自动驾驶数据进行聚类计算,得到高峰、平峰和低峰三个数据集;单个数据集包括多条线路,每个线路包括多个自动驾驶数据;所述成熟线路为稳定运行的列车线路上两个相邻站点间的线路,所述成熟线路与新建线路的长度偏不大于
±
5%;二)对高峰数据集、平峰数据集和低峰数据集均按方法一进行处理,分别得到对应的高峰成熟线路综合学习器、平峰成熟线路综合学习器和低峰成熟线路综合学习器;三)设置初始的高峰新建线路学习器、平峰新建线路学习器和低峰新建线路学习器,按方法二利用高峰成熟线路综合学习器、平峰成熟线路综合学习器和低峰成熟线路综合学习器分别对高峰新建线路学习器、平峰新建线路学习器和低峰新建线路学习器进行更新,得到高峰可用新建线路学习器、平峰可用新建线路学习器和低峰可用新建线路学习器;所述高峰新建线路学习器、平峰新建线路学习器和低峰新建线路学习器分别设置有一个深度神经网络模型;四)将高峰可用新建线路学习器、平峰可用新建线路学习器和低峰可用新建线路学习器均装载到X型列车的自动驾驶模块上;X型列车的高峰调度时刻表、平峰调度时刻表和低峰调度时刻表三个调度时刻表分别与高峰可用新建线路学习器、平峰可用新建线路学习器和低峰可用新建线路学习器三个可用新建线路学习器一一对应;X型列车根据当前所采用的调度时刻表选取对应的可用新建线路学习器用于列车的自动驾驶控制;所述方法一包括:将高峰数据集、平峰数据集和低峰数据集三者的其中任意一个数据集记为Q数据集;设Q数据集包括n条线路;设置n个基础学习器和一个综合学习器,n个基础学习器均与综合学习器连接,n个基础学习器与n条线路一一对应;所述基础学习器内和综合学习器内均设置有深度神经网络模型,将基础学习器内的深度神经网络模型记为基础模型,将综合学习器内的深度神经网络模型记为综合模型;综合学习器依次与n个基础学习器进行数据交互,每次数据交互过程包括以下步骤:A)综合学习器将当前综合模型的模型参数θ
Q
传输给第i个基础学习器,i为1到n的整数;综合学习器随机生成综合模型初始的模型参数θ
Q
;B)第i个基础学习器利用公式一对对应的基础模型的模型参数进行N次迭代更新,同时得到N次迭代更新后的损失函数梯度值,将第N次迭代更新后得到的损失函数梯度值记为反馈损失函数梯度值...

【专利技术属性】
技术研发人员:徐凯李柯静黄德青王青元贺德强吴仕勋杨建喜蓝章礼谭伟
申请(专利权)人:重庆交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1