基于用户反馈强化学习的电力专业大模型优化方法技术

技术编号：41430384 阅读：51 留言：0更新日期：2024-05-28 20:27

本发明专利技术涉及一种基于用户反馈强化学习的电力专业大模型优化方法，包括以下步骤：步骤S1:获取多源异构电力数据，并预处理；步骤S2:基于预训练的通用大模型和中文词表扩充的大模型，作为基础模型进行微调，将预处理后的多源异构电力数据输入到模型中进行端到端的训练，以学习数据之间的关联和模式，得到初步电力专业大模型；步骤S3:引入领域专家知识数据集，通过迁移学习，将领域知识融入初步电力专业大模型中；步骤S4:设计可控的输入输出接口，并引入用户反馈作为奖励信号，根据电力专业大模型的输入输出接口，自主调节模型输出，优化模型性能。本发明专利技术能够充分利用多源数据、领域专家知识和用户反馈，提高模型的准确性、可解释性和个性化服务水平。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及文本大模型领域，尤其涉及一种基于用户反馈强化学习的电力专业大模型优化方法。

技术介绍

1、电力系统信息化时代，知识和信息的爆炸式增长让用户面临从电力数据中提取有价值信息的巨大挑战。因此，如何通过自然语言快速、准确地从大量数据中获取答案，成为了一个迫切需要解决的问题。

2、而且电力系统具有动态性和不确定性，现有的电力大模型不能够及时感知系统状态变化并调整决策策略，而且现有电力大模型通常是黑盒模型，难以解释其决策过程和结果，缺乏可解释性可能会降低用户对模型的信任和接受度。

技术实现思路

1、为了解决上述问题，本专利技术的目的在于提供一种基于用户反馈强化学习的电力专业大模型优化方法，能够充分利用多源数据、领域专家知识和用户反馈，提高模型的准确性、可解释性和个性化服务水平，从而更好地应用于电力系统领域并取得更好的效果。

2、为实现上述目的，本专利技术采用以下技术方案：

3、一种基于用户反馈强化学习的电力专业大模型优化方法，包括以下步骤：

>4、步骤s1:获取本文档来自技高网...

【技术保护点】

1.一种基于用户反馈强化学习的电力专业大模型优化方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于用户反馈强化学习的电力专业大模型优化方法，其特征在于，所述预处理具体为：对多源异构电力数据进行数据清洗，并使用 Z-score 标准化处理，将数据转换为具有相同尺度的值。

3.根据权利要求1所述的一种基于用户反馈强化学习的电力专业大模型优化方法，其特征在于，所述步骤S2具体为：

4.根据权利要求3所述的一种基于用户反馈强化学习的电力专业大模型优化方法，其特征在于，所述通过自监督学习的方式，不断优化模型参数，直到模型收敛，得到初步电力专业大模...

【技术特征摘要】

1.一种基于用户反馈强化学习的电力专业大模型优化方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于用户反馈强化学习的电力专业大模型优化方法，其特征在于，所述预处理具体为：对多源异构电力数据进行数据清洗，并使用 z-score 标准化处理，将数据转换为具有相同尺度的值。

3.根据权利要求1所述的一种基于用户反馈强化学习的电力专业大模型优化方法，其特征在于，所述步骤s2具体为：

4.根据权利要求3所述的一种基于用户反...

【专利技术属性】
技术研发人员：李强，庄莉，梁懿，王秋琳，宋立华，张晓东，王燕蓉，陈江海，邱镇，黄晓光，吴佩颖，丘志强，
申请(专利权)人：福建亿榕信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人