一种对象控制方法、装置及计算机可读存储介质制造方法及图纸

技术编号:26642417 阅读:30 留言:0更新日期:2020-12-08 23:20
本申请实施例公开了一种对象控制方法、装置及计算机可读存储介质,通过获取每一职业类型的对象在单一对象下进行训练后的第一动作网络模型;根据对战组队中的组队对象信息确定对应的第二动作网络模型,并将每一组队对象信息的职业类型关联的第一动作网络模型的网络参数共享至对应的第二动作网络模型;根据每一组队对象信息的第一状态信息和第二动作网络模型,输出对应的第一动作信息;将不同组队对象信息的第一状态信息和对应的第一动作信息一并输入第二判别网络模型,生成每一组队对象信息的价值期望;根据价值期望进行模型更新,得到第二目标动作网络模型;基于第二目标动作网络模型对每一组队对象信息进行控制。以此,提升了对象控制效率。

【技术实现步骤摘要】
一种对象控制方法、装置及计算机可读存储介质
本申请涉及通信
,具体涉及一种对象控制方法、装置及计算机可读存储介质。
技术介绍
随着互联网技术的飞速发展,智能终端处理器的处理能力越来越强,衍生出很多游戏应用,例如回合制游戏应用,该回合制游戏即属于同一方的多个对象通过轮流发动技能,且战斗双方采用轮流攻击的对战方式。直至其中一方的所有战斗对象均战亡。现有技术中,回合制游戏关卡模式中的非玩家角色(Non-PlayerCharacter,NPC)大部分仍为建立决策树的方式来发动攻击,即决策树算法通过对相关特征的选取建立树结构,每个父节点下的子节点表示该节点所有的出招策略。在对现有技术的研究和实践过程中,本申请的专利技术人发现,现有技术中,对于决策树的方式而言,NPC的出招方式往往比较单一,且没有协作配合,与真实玩家的出招方式差异较大,对象控制的效果较差。
技术实现思路
本申请实施例提供一种对象控制方法、装置及计算机可读存储介质,可以提升对象控制的效率。为解决上述技术问题,本申请实施例提供以下技术方本文档来自技高网...

【技术保护点】
1.一种对象控制方法,其特征在于,包括:/n获取每一职业类型的对象在单一对象下进行训练后的第一动作网络模型;/n根据对战组队中的组队对象信息确定对应的第二动作网络模型,并将每一组队对象信息的职业类型关联的第一动作网络模型的网络参数共享至对应的第二动作网络模型,所述第二动作网络模型的输出与所述第一动作网络模型的输出层不同;/n将每一组队对象信息的第一状态信息输入至对应的网络参数共享后的第二动作网络模型,输出对应的第一动作信息,其中,每一第二动作网络模型关联对应的第二判别网络模型;/n将不同组队对象信息的第一状态信息和对应的第一动作信息一并输入第二判别网络模型,生成每一组队对象信息的价值期望;/n...

【技术特征摘要】
1.一种对象控制方法,其特征在于,包括:
获取每一职业类型的对象在单一对象下进行训练后的第一动作网络模型;
根据对战组队中的组队对象信息确定对应的第二动作网络模型,并将每一组队对象信息的职业类型关联的第一动作网络模型的网络参数共享至对应的第二动作网络模型,所述第二动作网络模型的输出与所述第一动作网络模型的输出层不同;
将每一组队对象信息的第一状态信息输入至对应的网络参数共享后的第二动作网络模型,输出对应的第一动作信息,其中,每一第二动作网络模型关联对应的第二判别网络模型;
将不同组队对象信息的第一状态信息和对应的第一动作信息一并输入第二判别网络模型,生成每一组队对象信息的价值期望;
根据每一组队对象信息的价值期望对相应的网络参数共享后的第二动作网络模型的网络参数进行更新,得到第二目标动作网络模型;
基于所述第二目标动作网络模型对每一组队对象信息进行控制。


2.根据权利要求1所述的对象控制方法,其特征在于,所述根据对战组队中的组队对象信息确定对应的第二动作网络模型,并将每一组队对象信息的职业类型关联的第一动作网络模型的网络参数共享至对应的第二动作网络模型的步骤,包括:
根据对战组队中的组队对象信息的数量确定对应数量的第二动作网络模型;
基于每一组队对象信息的职业类型获取对应训练后的第一动作网络模型的网络参数,并将所述网络参数共享至每一组队对象信息对应的第二动作网络模型中。


3.根据权利要求2所述的对象控制方法,其特征在于,所述将所述网络参数共享至每一组队对象信息对应的第二动作网络模型中的步骤,包括:
将所述网络参数按照职业类型加载至每一组队对象信息对应的第二动作网络模型中,所述第一动作网络模型和第二动作网络模型的输入结构相同。


4.根据权利要求1所述的对象控制方法,其特征在于,所述基于所述第二目标动作网络模型对每一组队对象信息进行控制的步骤之后,还包括:
训练出预设数量的不同的对战组队的第二目标动作网络模型;
通过每一对战组队的第二目标动作网络模型控制对应的组队对象信息与决策树模型控制的组队对象信息进行对战;
根据对战结果将预设数量的不同对战组队进行难易度分类。


5.根据权利要求1所述的对象控制方法,其特征在于,所述将每一组队对象信息的第一状态信息输入至对应的网络参数共享后的第二动作网络模型,输出对应的第一动作信息的步骤,包括:
将每一组队对象信息的第一状态信息输入对应的网络参数共享后的第二动作网络模型的全连接层,获取第一状态特征向量;
将第一状态特征向量输入对应的网络参数共享后的第二动作网络模型的动作输出层,得到预设数量的第一动作输出向量;
将预设数量的第一动作输出向量输入对应的网络参数共享后的第二动作网络模型的操作输出层,得到每一组队对象信息对应的第一策略信息;
根据每一组队对象信息对应的第一策略信息中概率值最大的目标元素确定每一组队对象信息对应的第一动作信息。


6.根据权利要求5所述的对象控制方法,其特征在于,所述将第一状态特征向量输入对应的网络参数共享后的第二动作网络模型的动作输出层,得到预设数量的第一动作输出向量的步骤,包括:
将所述第一状态特征向量输入对应的网络参数共享后的第二动作网络模型的动作输出层,获取预设数量的第一动作特征向量;
根据预设数量的第一动作特征向量和预设数量的操作掩模向量,获取预设数量的第一动作输出向量,其中,所述第一动作特征向量和所述操作掩模向量具有一一对应的关系,所述操作掩模向量为根据当前对战回合下可用技能生成的。


7.根据权利要求1所述的对象控制方法,其特征在于,所述将不同组队对象信息的第一状态信息和对应的第一动作信息一并输入第二判别网络模型,生成每一组队对象信息的价值期望的步骤,包括:
对每一组队对象信息的第一状态信息和其他组队对象的第一状态信息进行拼接处理,得到每一组队对象信息的全局状态信息;
将每一组队对象信息的第一动作信息和其他组队对象的第一动作信息进行拼接处理,得到每一组件对象信息的全局动作信息;
将每一组队对象信息的全局状态信息和全局动作信息一并输入对应的第二判别网络模型,获取每一组队对象信息的价值期望。


8.根据权利要求1所述的对象控制方法,其特征在于,所述根据每一组队对象信息的价值期望对相应的网络参数共享后的第二动作网络模型的网络参数进行更新,得到第二目标动作网络模型的步骤之后,还包括:
获取每一组队对象信息对应的第二状态信息,所述第二状态信息属于下一轮的对战回合对应的状态信息;
将所述第二状态信息输入至第二目标动作网络模型,得到每一组队...

【专利技术属性】
技术研发人员:常天元
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1