【技术实现步骤摘要】
基于强化学习的强泛化能力加速器轨道校正方法和系统
[0001]本专利技术涉及加速器束流控制技术邻域,尤其涉及基于强化学习的强泛化能力加速器轨道校正方法和系统。
技术介绍
[0002]加速器中的束流受准直精度以及安装误差等因素的影响,在束流通过加速器时会出现轨道偏离中心位置的情况,因此束流轨道校正在加速器调试运行的过程中起到至关重要的作用。
[0003]束流校正的基本方法是通过观察束流位置监测器(BPM)的在水平方向和垂直方向的读数,调节矫正铁的电流使得束流位置监测器的读数尽可能接近于0。现有的方法以人类经验以及基于在线加速器的强化学习方法为主。加速器束流时间较为昂贵,尤其是对于存在螺线管的区域基于人类经验的方法耗时费力、过程复杂且难以掌握其中的规律,基于强化学习的在线加速器校正方案需要收集线上加速器运行数据,需要花费较多的束流时间,成本较高。
[0004]然而由于模拟加速器和真实加速器中存在磁场、电场、安装误差以及准直误差等不可估计的差异,模拟环境下训练的强化学习模型难以直接应用在真实加速器上进行使用。 />
技术实现思路
...
【技术保护点】
【技术特征摘要】
1.基于强化学习的强泛化能力加速器轨道校正方法,其特征在于,包括:根据真实加速器的数据建立模拟加速器;在模拟加速器中测量BPM值,并根据BPM值构造特征矩阵;将特征矩阵输入强化学习模型,强化学习模型输出电流变化值,根据电流变化值与真实加速器中磁铁电流值矫正真实加速器的电流值。2.根据权利要求1所述的基于强化学习的强泛化能力加速器轨道校正方法,其特征在于,所述根据真实加速器的数据建立模拟加速器包括:选取加速器模拟软件作为基础环境,根据真实加速器上的束流位置监测器来设置模拟加速器的束流位置检测器;根据真实加速器中四级铁的数值设置模拟加速器中对应位置的四级铁电流的数值;将模拟加速器的配置文件中校正铁电流的位置更换为可替换变量。3.根据权利要求1所述的基于强化学习的强泛化能力加速器轨道校正方法,其特征在于,所述BPM值具体为:B
i
为所有BPM在i时刻的读数,假设共计有N组BPM,每组BPM均分为X方向和Y方向,则B
i
=[b
x1i
,b
y1i
,b
x2i
,b
y2i
,
…
b
xni
,b
yni
…
,b
xNi
,b
yNi
],其中b
xni
表示在i时刻第n组BPM在X方向上的读数,b
yni
表示在i时刻第n组BPM在Y方向上的读数。4.根据权利要求3所述的基于强化学习的强泛化能力加速器轨道校正方法,其特征在于,所述将特征矩阵输入强化学习模型,强化学习模型输出电流变化值,根据电流变化值与真实加速器中磁铁电流值矫正真实加速器的电流值,具体包括:定义ΔB
i
=B
i
‑
B
i 1
,则模拟加速器运行过程中的观测值为:M
i
为在第i时刻矫正铁的电流值,假设共计有K组矫正铁,则M
i
=[m
x1i
,m
y1i
,m
x2i
,m
y2i
,
…
m
xki
,m
yki
…
,m
xKi
,m
yKi
],m
xki
为在i时刻第k组矫正铁X方向的电流值,m
yki
为在i时刻第k组矫正铁Y方向的电流值,定义在i
‑
1时刻矫正铁电流为M
i 1
,由强化学习模型预测的电流增量为ΔM
i 1
,则i时刻矫正铁的电流M
i
=M
i 1
+ΔM
i 1
。5.根据权利要求4所述的基于强化学习的强泛化能力加速器轨道校正方法,其特征在于,所述在模拟加速器中测量BPM值包括:在模拟加速器软件添加随机原件误差,来模拟束流的质心在真实加速器中的偏差;将束流位置监测器读数拆分为x方向和y方向,拆分后的结果为B
ix
={b
x1i
,b
x2i
,
…
,b
xNi
},B
iy
={b
y1i
,b
y2i
,
…
,b
yN...
【专利技术属性】
技术研发人员:陈小龙,齐新,陈伟龙,王志军,何源,
申请(专利权)人:中国科学院近代物理研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。