温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明公开了一种基于梯度强化策略优化的电力调度操作票审核模型动态微调方法、系统、设备及存储介质,所述方法包括以下步骤:将电力调度规则库转换为可微分损失函数融入GRPO训练框架;提取文本语义与电网拓扑图特征,利用改进后的GRPO训练框架,基于...该专利属于国网河北省电力有限公司信息通信分公司所有,仅供学习研究参考,未经过国网河北省电力有限公司信息通信分公司授权不得商用。
温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明公开了一种基于梯度强化策略优化的电力调度操作票审核模型动态微调方法、系统、设备及存储介质,所述方法包括以下步骤:将电力调度规则库转换为可微分损失函数融入GRPO训练框架;提取文本语义与电网拓扑图特征,利用改进后的GRPO训练框架,基于...