智能体评估方法、设备以及存储介质技术

技术编号:43310449 阅读:41 留言:0更新日期:2024-11-12 16:28
本申请公开了一种智能体评估方法、设备以及存储介质,该智能体评估方法包括:获取智能体执行目标任务得到的执行信息,执行信息包括执行过程信息和执行结果信息;根据预设过程信息对执行过程信息进行过程评估处理,得到第一评估结果;根据预设结果信息对执行结果信息进行结果评估处理,得到第二评估结果;基于第一评估结果和第二评估结果确定智能体的目标评估结果。上述方案,能够从智能体执行任务所得到的多个维度数据出发,对智能体进行多维度评估,得到准确的目标评估结果。

【技术实现步骤摘要】

本申请涉及人工智能,特别是涉及一种智能体评估方法、设备以及存储介质


技术介绍

1、随着人工智能技术的高速发展,尤其是深度学习和大数据分析技术的不断突破,大模型已经成为实现智能体的有效途径。这些智能体可被广泛应用于医疗、金融、教育等多个领域,旨在通过模拟和预测行业内的复杂互动和变化,为决策提供支持。

2、尽管大模型的计算能力和数据处理能力已经达到了历史高点,但如何对这些智能体的效能进行系统性地评估和验证,却鲜有标准和模式可循。

3、目前,缺乏详实的评估方法不仅限制了智能体的应用与完善,也制约了相关行业的进一步智能化进程。因此,现缺乏一种准确的智能体评估方法以便于有效地了解智能体的运行效果,继而调整和优化智能体的设计和运作。


技术实现思路

1、本申请至少提供一种智能体评估方法、装置、设备以及计算机可读存储介质。

2、本申请第一方面提供了一种智能体评估方法,包括:获取所述智能体执行目标任务得到的执行信息,所述执行信息包括执行过程信息和执行结果信息;根据预设过程信息对所述执行过程本文档来自技高网...

【技术保护点】

1.一种智能体评估方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述预设过程信息包括在所述智能体执行任务过程中预设的业务需求和语义需求,所述第一评估结果包括业务评估结果和语义评估结果,所述根据预设过程信息对所述执行过程信息进行过程评估处理,得到第一评估结果的步骤,包括:

3.根据权利要求2所述的方法,其特征在于,所述执行过程信息包括所述智能体执行所述目标任务的过程中拆分得到的子任务,所述根据所述业务需求对所述执行过程信息进行评估处理,得到所述业务评估结果的步骤,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述...

【技术特征摘要】

1.一种智能体评估方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述预设过程信息包括在所述智能体执行任务过程中预设的业务需求和语义需求,所述第一评估结果包括业务评估结果和语义评估结果,所述根据预设过程信息对所述执行过程信息进行过程评估处理,得到第一评估结果的步骤,包括:

3.根据权利要求2所述的方法,其特征在于,所述执行过程信息包括所述智能体执行所述目标任务的过程中拆分得到的子任务,所述根据所述业务需求对所述执行过程信息进行评估处理,得到所述业务评估结果的步骤,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述任务内容完整度、所述任务顺序合理度、所述任务相关度以及所述任务准确度中的至少一个确定所述业务评估结果的步骤,包括:

5.根据权利要求2所述的方法,其特征在于,所述根据所述语义需求对所述执行过程信息...

【专利技术属性】
技术研发人员:刘明江中毅刘备张晗刘伟棠陈立力周明伟邓志吉
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1