当前位置: 首页 > 专利查询>河海大学专利>正文

一种基于深度强化学习的提升星际争霸AI操作的方法技术

技术编号:26971987 阅读:32 留言:0更新日期:2021-01-06 00:03
本发明专利技术公开一种基于深度强化学习的提升星际争霸AI操作的方法,包括如下步骤:根据游戏引擎获得游戏单位属性参数、游戏属性单位和操作命令与之前已有的操作命令联立输入神经网络以及根据贪婪策略选择价值函数的最大值来决定游戏单位的操作方式。本发明专利技术通过引入深度学习和强化学习不断训练网络中的参数和价值函数中的参数来使得AI的操作更加具备逻辑性和合理性,提高了AI进行对战时的获胜率。

【技术实现步骤摘要】
一种基于深度强化学习的提升星际争霸AI操作的方法
本专利技术属于深度学习
,具体涉及一种基于深度强化学习的提升星际争霸AI操作的方法。
技术介绍
深度强化学习是人工智能领域的一个新的研究热点。它以一种通用的形式将深度学习的感知能力与强化学习的决策能力相结合,并能够通过端对端的学习方式实现从原始输入到输出的直接控制。自提出以来,在许多需要感知高维度原始输入数据和决策控制的任务中,深度强化学习方法已经取得了实质性的突破。目前对于提升游戏操作的方法仍主要为决策树方法,决策树方法通过对具体游戏单位直接设定一系列的操作或者设定一些简单的反馈操作来提升游戏中的单位操作。决策树方法的思路比较简单,但是操作比较繁琐,设定的内容容易形成冗余。将深度强化学习引入提升游戏操作方法后,相对于决策树方法能够对更多的游戏单位进行有效的操作命令。
技术实现思路
专利技术目的:本专利技术的目的在于解决现有技术中存在的不足,提供一种基于深度强化学习的提升星际争霸AI操作的方法。技术方案:本专利技术的一种基于深度强化学习的提升星际争霸AI操作的方本文档来自技高网...

【技术保护点】
1.一种基于深度强化学习的提升星际争霸AI操作的方法,其特征在于:包括如下步骤:/nS1、根据游戏引擎获得游戏单位属性参数;/nS1.1、在python环境中通过SC2包中接口函数获取本次需要操作的游戏单位所需要的由游戏引擎提供的参数,参数包括血量、护盾、位置、之前目标和现在目标;/nS1.2、在python环境中通过SC2包中接口函数获取上一帧之前操作过的游戏单位以及操作命令,游戏单位包括基础兵种,操作命令包括选择目标进行攻击与进行位移;/nS1.3、将上述两个步骤所得参数联立,且与本次操作命令一起作为深度强化网络的输入;/nS2、游戏单位属性和操作命令与之前已有的操作命令联立输入神经网络,...

【技术特征摘要】
1.一种基于深度强化学习的提升星际争霸AI操作的方法,其特征在于:包括如下步骤:
S1、根据游戏引擎获得游戏单位属性参数;
S1.1、在python环境中通过SC2包中接口函数获取本次需要操作的游戏单位所需要的由游戏引擎提供的参数,参数包括血量、护盾、位置、之前目标和现在目标;
S1.2、在python环境中通过SC2包中接口函数获取上一帧之前操作过的游戏单位以及操作命令,游戏单位包括基础兵种,操作命令包括选择目标进行攻击与进行位移;
S1.3、将上述两个步骤所得参数联立,且与本次操作命令一起作为深度强化网络的输入;
S2、游戏单位属性和操作命令...

【专利技术属性】
技术研发人员:高荣信余宇峰
申请(专利权)人:河海大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1