【技术实现步骤摘要】
本专利技术属于人工智能与电力系统交叉领域,具体涉及一种电力大模型智能体运行评估方法及系统。
技术介绍
1、随着大语言模型(large language models, llms)的快速发展,基于 llms 的语言智能体在众多领域得到广泛应用,如软件工程、网页浏览、计算机使用和科学发现等。然而,随着智能体复杂度的提升,其标准化运行与评估面临诸多挑战,亟需建立系统化的方法论以保障其可靠性、安全性与可扩展性。现有研究主要关注语言智能体在下游任务完成方面的有效性,对其在操作过程中遵循操作流程、约束、安全协议和程序保障措施的可靠性研究较少, 在任务分解、环境适应性和动态调整等方面尚未形成统一标准,导致性能波动和不可控风险。
2、虽然存在一些评估语言智能体使用外部工具和规划任务能力的基准测试,但在理解其遵循操作约束和程序的可靠性方面存在显著差距。同时,尽管有研究探索了 llms 在内容安全、遵循系统消息、复杂指令以及规则和约束方面的表现,但对语言智能体的行为安全性以及在采取行动时遵守约束和程序的能力关注不足。在高风险环境中,语言智能体的
...【技术保护点】
1.一种电力大模型智能体运行评估方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的电力大模型智能体运行评估方法,其特征在于,步骤S1中,所述数学建模包括以下步骤:
3.根据权利要求2所述的电力大模型智能体运行评估方法,其特征在于,所述数学建模具体为:
4.根据权利要求1所述的电力大模型智能体运行评估方法,其特征在于,步骤S2具体为:
5.根据权利要求4所述的电力大模型智能体运行评估方法,其特征在于,所述服务动作的约束验证使用以下算式表示:
6.根据权利要求1所述的电力大模型智能体运行评估方法,其特征在
...【技术特征摘要】
1.一种电力大模型智能体运行评估方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的电力大模型智能体运行评估方法,其特征在于,步骤s1中,所述数学建模包括以下步骤:
3.根据权利要求2所述的电力大模型智能体运行评估方法,其特征在于,所述数学建模具体为:
4.根据权利要求1所述的电力大模型智能体运行评估方法,其特征在于,步骤s2具体为:
5.根据权利要求4所述的电力大模型智能体运行评估方法,其特征在于,所述服务动作的约束验证使用以下算式表示:
6.根据权利要求1所述的电力大模型智能体...
【专利技术属性】
技术研发人员:陈毅波,黄鑫,周沿东,田峥,眭建新,孙毅臻,祝视,朱宏宇,杨芳僚,汤超,
申请(专利权)人:国网湖南省电力有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。