多机器人博弈仿真方法、仿真平台、电子设备及存储介质技术

技术编号:43912411 阅读:25 留言:0更新日期:2025-01-03 13:19
本发明专利技术提供一种多机器人博弈仿真方法、仿真平台、电子设备及存储介质,属于人工智能技术领域,方法包括运行至少一环境实例,各环境实例中设有至少一己方机器人以及至少一对手机器人;在当前训练轮中,确定各环境实例共享的训练策略以及与各对手机器人对应的对手策略,将训练策略对应的第一控制指令发送至己方机器人并将对手策略对应的第二控制指令发送至对手机器人,以便己方机器人和对手机器人在环境实例中执行博弈任务。本发明专利技术在各环境实例中为己方机器人配置对手机器人,提高对抗训练经验多样性,实现对环境实例的充分探索,且各环境实例中的对手机器人均根据对手策略与共享策略的己方机器人进行对抗博弈,有助于制定更加稳健和通用的策略。

【技术实现步骤摘要】

本专利技术涉及人工智能,尤其涉及一种多机器人博弈仿真方法、仿真平台、电子设备及存储介质


技术介绍

1、近年来,多智能体博弈成为人工智能领域的重要研究方向,为开展各类实验提供了可控和可复现的环境,通过模拟多个智能体在动态环境中的对抗与协作,研究人员可以更好地理解复杂系统的行为,并推动智能化决策系统的发展。

2、现有多智能体博弈仿真平台通常通过强化学习生成博弈策略,强化学习通常只考虑智能体与环境的交互,生成的策略具有一定的局限性。


技术实现思路

1、本专利技术提供一种多机器人博弈仿真方法、仿真平台、电子设备及存储介质,解决多智能体博弈仿真平台通过强化学习生成博弈策略,强化学习通常只考虑智能体与环境的交互,生成的策略具有一定的局限性的缺陷。

2、本专利技术提供一种多机器人博弈仿真方法,包括:

3、运行至少一环境实例,各所述环境实例中设有至少一己方机器人以及至少一对手机器人;

4、在当前训练轮中,确定各所述环境实例共享的训练策略以及与各所述对手机器人对应的对手策略,将本文档来自技高网...

【技术保护点】

1.一种多机器人博弈仿真方法,其特征在于,包括:

2.根据权利要求1所述的多机器人博弈仿真方法,其特征在于,还包括:

3.根据权利要求1所述的多机器人博弈仿真方法,其特征在于,所述确定各所述环境实例共享的训练策略以及与各所述对手机器人对应的对手策略,包括:

4.根据权利要求3所述的多机器人博弈仿真方法,其特征在于,所述当前对抗态势包括当前状态空间,对应的,所述根据所述当前对抗态势确定各所述环境实例中所述己方机器人的当前动作空间,包括:

5.根据权利要求2所述的多机器人博弈仿真方法,其特征在于,所述根据所述博弈胜率判断是否更新所述对手策略,基...

【技术特征摘要】

1.一种多机器人博弈仿真方法,其特征在于,包括:

2.根据权利要求1所述的多机器人博弈仿真方法,其特征在于,还包括:

3.根据权利要求1所述的多机器人博弈仿真方法,其特征在于,所述确定各所述环境实例共享的训练策略以及与各所述对手机器人对应的对手策略,包括:

4.根据权利要求3所述的多机器人博弈仿真方法,其特征在于,所述当前对抗态势包括当前状态空间,对应的,所述根据所述当前对抗态势确定各所述环境实例中所述己方机器人的当前动作空间,包括:

5.根据权利要求2所述的多机器人博弈仿真方法,其特征在于,所述根据所述博弈胜率判断是否更新所述对手策略,基于更新后的训练策略以及所述对手策略/更新后的对手策略进入下一训练轮直至达到预设训练停止条件,包括:

6.根据权利要求1-5任一项所述的多机器人博弈仿真方法,其特征在于,各所述环境实例中的所述对手策略不同...

【专利技术属性】
技术研发人员:何友刘瑜柯宇新李劭辉李徵姜智卓李耀文
申请(专利权)人:清华大学深圳国际研究生院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1