等离子体位形控制代理策略模型构建方法、装置及介质制造方法及图纸

技术编号:46585710 阅读:2 留言:0更新日期:2025-10-10 21:22
本发明专利技术公开了一种等离子体位形控制代理策略模型构建方法、装置及介质,通过构建托卡马克仿真环境,识别出PID控制器控制下失控场景的环境配置参数,得到配置的训练环境;采用强化学习代理模型进行学习,生成电流命令;基于托卡马克仿真环境中计算各时刻的控制点状态;将各时刻的控制点状态,电流命令与PID控制器得到的动作命令输入到奖励函数中,计算环境奖励;根据环境奖励、各时刻的控制点状态以及电流命令进行强化学习训练,更新命令策略;当强化学习代理模型符合收敛条件时,输出代理策略模型。本申请方案提供一种在非线性和复杂动态环境中应对瞬态较大扰动的能力的策略模型,保障托卡马克装置的稳定性和安全性。

【技术实现步骤摘要】

本专利技术涉及聚变等离子体控制,具体涉及一种等离子体位形控制代理策略模型构建方法、装置及介质


技术介绍

1、托卡马克装置是用于研究和实现核聚变反应的重要设备,其工作原理是通过强磁场约束高温等离子体,使其在高温高压状态下进行核聚变反应。托卡马克装置中等离子体位形的控制对于实现稳定的等离子体状态和有效的核聚变反应至关重要,它决定了托卡马克放电过程是否能够稳定运行。

2、现有方案中等离子体位形的控制通常采用pid(proportional-integral-derivative,比例积分微分)控制器。pid控制器通过测量当前位形参数与目标位形参数之间的差值,生成相应的电流控制命令,从而使位形参数趋近目标值。但是传统pid控制器在非线性和复杂动态环境中,应对瞬态较大扰动的能力不足,托卡马克装置的稳定性和安全性较差。


技术实现思路

1、为了解决上述问题,本专利技术提出一种等离子体位形控制代理策略模型构建方法、装置及介质,能够提供一种在非线性和复杂动态环境中应对瞬态较大扰动的能力的策略模型,保障托卡马克装置本文档来自技高网...

【技术保护点】

1.一种等离子体位形控制代理策略模型构建方法,其特征在于,所述方法包括:

2.根据权利要求1所述的等离子体位形控制代理策略模型构建方法,其特征在于,所述构建托卡马克仿真环境,识别出PID控制器控制下失控场景的环境配置参数,具体包括:

3.根据权利要求1所述的等离子体位形控制代理策略模型构建方法,其特征在于,所述托卡马克仿真环境包括配置参数的电源响应模型、扰动场景模型以及等离子响应模型。

4.根据权利要求1所述的等离子体位形控制代理策略模型构建方法,其特征在于,所述奖励函数包括;

5.根据权利要求4所述的等离子体位形控制代理策略模型构建方法,...

【技术特征摘要】

1.一种等离子体位形控制代理策略模型构建方法,其特征在于,所述方法包括:

2.根据权利要求1所述的等离子体位形控制代理策略模型构建方法,其特征在于,所述构建托卡马克仿真环境,识别出pid控制器控制下失控场景的环境配置参数,具体包括:

3.根据权利要求1所述的等离子体位形控制代理策略模型构建方法,其特征在于,所述托卡马克仿真环境包括配置参数的电源响应模型、扰动场景模型以及等离子响应模型。

4.根据权利要求1所述的等离子体位形控制代理策略模型构建方法,其特征在于,所述奖励函数包括;

5.根据权利要求4所述的等离子体位形控制代理策略模型构建方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的等离子体位形控制代理策略模型构建方法,其特征在于,所述根据所述环境奖励、各时刻的控制点状态以及所...

【专利技术属性】
技术研发人员:汪悦航张晏慈黄耀袁旗平朱建秋黄仲旻
申请(专利权)人:中国科学院合肥物质科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1