【技术实现步骤摘要】
一种核反应堆功率和轴向功率分布强化学习解耦控制方法
[0001]本专利技术属于核反应堆控制
,具体涉及一种核反应堆功率和轴向功率分布强化学习解耦控制方法。
技术介绍
[0002]压水堆是当今世界现役核电站中的主流堆型。在运的压水堆基本都采用传统的基于化学补偿的运行控制模式(A模式或G模式),在负荷跟踪过程中需要操作员频繁地进行堆芯硼浓度的调整,反应性调节速度很慢,废液产量大,影响核电厂的经济性、安全性和生态效益;并且,在寿期末高燃耗、硼浓度很低时,反应堆功率提升能力很弱,硼废液产量急剧增加,可能导致核电厂的废液处理系统无法承担而丧失负荷跟踪能力。
[0003]目前,核电在电力市场中份额较小,出于经济性和安全性考虑,核电机组可以不参与电网调峰。但是,核电发展速度很快,而且分布不均衡,未来随着核电装机容量在电网总发电量中的比重不断提高,尤其是一些局部电网,核电机组需要参与电网调峰来提高电网的抗冲击能力并保证供电品质,而采用调硼模式运行的压水堆由于负荷跟踪能力和经济性较差,其运行模式和控制策略有待改进。同时,随着世界 ...
【技术保护点】
【技术特征摘要】
1.一种核反应堆功率和轴向功率分布强化学习解耦控制方法,其特征在于,包括以下步骤:S1、设置大型压水堆堆芯功率和轴向功率分布的机械补偿控制系统,机械补偿控制系统包含冷却剂平均温度控制子系统和轴向功率偏移控制子系统,冷却剂平均温度控制子系统和轴向功率偏移控制子系统分别调节独立动作的M棒组和AO棒;M棒组用于调节反应堆功率,并使冷却剂平均温度保持在程序平均温度的控制带内;AO棒用于控制堆芯轴向功率分布;S2、冷却剂平均温度控制子系统将堆芯冷却剂平均温度测量值和给定值的偏差信号及汽轮机功率和核功率偏差的微分信号叠加,再经棒速程序单元计算M棒组的移动方向和速度;轴向功率偏移控制子系统根据堆芯轴向功率偏差测量值与设定堆芯轴向功率偏差控制带之间的偏差信号,计算AO棒的移动方向和速度;S3、构建强化学习智能体RL
‑
Agent1和RL
‑
Agent2,根据步骤S2得到的M棒组的移动方向和速度,以及AO棒的移动方向和速度判断M棒组和/或AO棒是否动作,通过两个强化学习智能体RL
‑
Agent1和RL
‑
Agent2分别对AO棒和M棒组棒速进行前馈补偿,实现堆芯功率和轴向功率分布之间的解耦控制;S4、将用于强化学习智能体RL
‑
Agent1和RL
‑
Agent2训练的M棒组和AO棒棒速设置为强化学习的状态观测量,并根据反应堆功率变化量和轴向功率偏移变化量设计解耦精度的激励函数;S5、设置不同的训练步数和采样时间,对步骤S3中的两个强化学习智能体进行训练,根据步骤S4得到的激励函数给出的激励值更新两个强化学习智能体的评价网络参数;将训练得到的强化学习智能体集成于反应堆机械补偿控制系统中,实现堆芯功率和轴向功率分布的解耦控制。2.根据权利要求1所述的核反应堆功率和轴向功率分布强化学习解耦控制方法,其特征在于,步骤S1中,M棒组以叠步方式运行,相邻两组控制棒之间的重叠高度相同;AO棒在堆芯上半区的运行调节带内移动。3.根据权利要求2所述的核反应堆功率和轴向功率分布强化学习解耦控制方法,其特征在于,M棒组包含六组控制棒,分别为MA、MB、MC、MD、M1和M2棒,MA、MB、MC和MD棒为灰棒,M1和M2棒为黑棒,AO棒为黑棒。4.根据权利要求1所述的核反应堆功率和轴向功率分布强化学习解耦控制方法,其特征在于,步骤S2中,如果堆芯T
ref
‑
T
avg
与汽轮机功率和核功率的偏差微分之和为正且超出死区上限,冷却剂平均温度控制子系统发送M棒组提棒信号;如果堆芯T
ref
‑
T
avg
与汽轮机功率和核功率的偏差微分之和为负且低于死区下限,冷却剂平均温度控制子系统发送M棒组插棒信号,T
ref
为冷却剂平均温度给定值,T
avg
为冷却剂平均温度测量值。5.根据权利要求1所述的核反应堆功率和轴向功率分布强化学习解耦控制方法,其特征在于,步骤S2中,如果堆芯轴向功率偏差ΔI从正方向超出目标控制带,轴向功率偏移控制子系统发送AO棒插棒信号;如果堆芯轴向功率偏差ΔI从负方向超出目标控制带,轴向功率偏移控制子系统发送AO棒提棒信号。6.根据权利要求1所述的核反应堆功率和轴向功率分布强化学习解耦控制方法,其特征在于,步骤S3中,强化学习智能体RL
‑
...
【专利技术属性】
技术研发人员:王鹏飞,龚辉俊,梁文龙,万甲双,吴世发,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。