【技术实现步骤摘要】
本专利技术实施例涉及智能博弈对抗,尤其是一种博弈对局的仿真方法、装置、设备及介质。
技术介绍
1、当前,在智能博弈对抗领域,特别是涉及大规模多智能体系统的仿真研究中,存在着多种类型的博弈问题,如单智能体、多智能体、回合制与非回合制、完美信息与非完美信息博弈等,这些不同的博弈问题通常需要不同的仿真环境来进行建模和支持,然而,现有的仿真环境软件在api设计上存在较大的差异,缺乏通用性和互操作性,不同博弈模式之间需要采用不同的接入方案,导致在开发大规模智能博弈对抗仿真系统时,难以直接集成多种不同的仿真环境,限制了智能博弈对抗仿真系统的泛化能力和灵活性,提高了用户开发工作的复杂度。
技术实现思路
1、本专利技术实施例提供一种博弈对局的仿真方法,可以基于统一接口集合生成仿真环境适配器,以统一不同博弈类型的博弈环境的接口规范,并基于通用交互范式数据实现不同博弈类型的博弈对局交互,使得博弈仿真系统可以集成各种仿真环境,从而有效提高博弈仿真系统的泛化能力和灵活性,以及简化用户的开发工作。
2、
...【技术保护点】
1.一种博弈对局的仿真方法,其特征在于,包括:
2.根据权利要求1所述的博弈对局的仿真方法,其特征在于,所述按照所述通用交互范式数据控制至少一个所述智能体对象通过所述博弈环境实例进行博弈对局交互,包括:
3.根据权利要求2所述的博弈对局的仿真方法,其特征在于,所述博弈决策信息包括动作信息、存活信息、观测信息和奖励信息,所述按照所述通用交互范式数据获取至少一个所述智能体对象的博弈决策信息,包括:
4.根据权利要求2所述的博弈对局的仿真方法,其特征在于,所述根据所述博弈决策信息执行所述博弈环境实例在博弈对局中当前的仿真步骤,包括:
>5.根据权利...
【技术特征摘要】
1.一种博弈对局的仿真方法,其特征在于,包括:
2.根据权利要求1所述的博弈对局的仿真方法,其特征在于,所述按照所述通用交互范式数据控制至少一个所述智能体对象通过所述博弈环境实例进行博弈对局交互,包括:
3.根据权利要求2所述的博弈对局的仿真方法,其特征在于,所述博弈决策信息包括动作信息、存活信息、观测信息和奖励信息,所述按照所述通用交互范式数据获取至少一个所述智能体对象的博弈决策信息,包括:
4.根据权利要求2所述的博弈对局的仿真方法,其特征在于,所述根据所述博弈决策信息执行所述博弈环境实例在博弈对局中当前的仿真步骤,包括:
5.根据权利要求2所述的博弈对局的仿真方法,其特征在于,所述根据所述博弈决策信息执行所述博弈环境实例在博弈对局中当前的仿真步骤,以控制至少一个所述智能体对象进行博弈对局交互之后,所述方法还包括:
6.根据权利要求1所述的博弈对局的仿真方法,其特征在于,所述获...
【专利技术属性】
技术研发人员:高文,田永鸿,李论通,聂建政,彭佩玺,许芬,
申请(专利权)人:鹏城实验室,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。