【技术实现步骤摘要】
本专利技术涉及文本大模型领域,尤其涉及一种基于用户反馈强化学习的电力专业大模型优化方法。
技术介绍
1、电力系统信息化时代,知识和信息的爆炸式增长让用户面临从电力数据中提取有价值信息的巨大挑战。因此,如何通过自然语言快速、准确地从大量数据中获取答案,成为了一个迫切需要解决的问题。
2、而且电力系统具有动态性和不确定性,现有的电力大模型不能够及时感知系统状态变化并调整决策策略,而且现有电力大模型通常是黑盒模型,难以解释其决策过程和结果,缺乏可解释性可能会降低用户对模型的信任和接受度。
技术实现思路
1、为了解决上述问题,本专利技术的目的在于提供一种基于用户反馈强化学习的电力专业大模型优化方法,能够充分利用多源数据、领域专家知识和用户反馈,提高模型的准确性、可解释性和个性化服务水平,从而更好地应用于电力系统领域并取得更好的效果。
2、为实现上述目的,本专利技术采用以下技术方案:
3、一种基于用户反馈强化学习的电力专业大模型优化方法,包括以下步骤:
【技术保护点】
1.一种基于用户反馈强化学习的电力专业大模型优化方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于用户反馈强化学习的电力专业大模型优化方法,其特征在于,所述预处理具体为:对多源异构电力数据进行数据清洗,并使用 Z-score 标准化处理,将数据转换为具有相同尺度的值。
3.根据权利要求1所述的一种基于用户反馈强化学习的电力专业大模型优化方法,其特征在于,所述步骤S2具体为:
4.根据权利要求3所述的一种基于用户反馈强化学习的电力专业大模型优化方法,其特征在于,所述通过自监督学习的方式,不断优化模型参数,直到模型收敛,
...【技术特征摘要】
1.一种基于用户反馈强化学习的电力专业大模型优化方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于用户反馈强化学习的电力专业大模型优化方法,其特征在于,所述预处理具体为:对多源异构电力数据进行数据清洗,并使用 z-score 标准化处理,将数据转换为具有相同尺度的值。
3.根据权利要求1所述的一种基于用户反馈强化学习的电力专业大模型优化方法,其特征在于,所述步骤s2具体为:
4.根据权利要求3所述的一种基于用户反...
【专利技术属性】
技术研发人员:李强,庄莉,梁懿,王秋琳,宋立华,张晓东,王燕蓉,陈江海,邱镇,黄晓光,吴佩颖,丘志强,
申请(专利权)人:福建亿榕信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。