一种机器人的训练方法及装置、技能释放方法及装置制造方法及图纸

技术编号:24062068 阅读:32 留言:0更新日期:2020-05-08 23:04
本申请提供了一种机器人的训练方法及装置、技能释放方法及装置,所述训练方法包括:获取多个游戏技能的技能效果的属性特征;根据所述属性特征,将所述多个游戏技能进行聚类,得到多个技能类别;根据所述技能类别对应的关键属性特征,从所述技能类别中选取目标游戏技能;将所述目标游戏技能的至少一个技能效果作为对应的技能类别的技能效果,训练游戏中的机器人。本申请减少了训练过程中计算量,缩短了训练时间,提高了训练效率;并且,提高了机器人的对战交互效率。

A robot training method and device, skill release method and device

【技术实现步骤摘要】
一种机器人的训练方法及装置、技能释放方法及装置
本申请涉及机器学习
,具体而言,涉及一种机器人的训练方法及装置、技能释放方法及装置。
技术介绍
在一些游戏中,比如,大型多人在线角色扮演游戏(MassiveMultiplayerOnlineRole-PlayingGame,MMORPG)中,用户在进行游戏任务时,通常需要控制目标游戏角色与机器人进行对抗,以完成游戏任务。因此,需要预先训练游戏中的机器人。目前,基于游戏技能作为样本对游戏中机器人的深度强化学习(DeepReinforcementLearning,DRL)训练非常困难。在对抗过程中,游戏角色在一个战斗场景中只能携带特定技能进行使用,以降低游戏的操作难度。其中,游戏中通常包括多个不同的战斗场景和多个不同的游戏角色;其中,同一游戏角色在不同的战斗场景中携带技能是不同的,不同游戏角色在同一战斗场景中携带的技能也是不同的。这样,一个游戏角色在一种战斗场景下就对应多种技能组合情况,并且,每种技能组合情况都需要进行上万次的训练;而针对多个游戏角色和多个战斗场景,又成倍的增加了训练过程本文档来自技高网...

【技术保护点】
1.一种机器人的训练方法,其特征在于,所述训练方法包括:/n获取多个游戏技能的技能效果的属性特征;/n根据所述属性特征,将所述多个游戏技能进行聚类,得到多个技能类别;/n根据所述技能类别对应的关键属性特征,从所述技能类别包括的游戏技能中选取目标游戏技能;/n将所述目标游戏技能的至少一个技能效果作为对应的技能类别的技能效果,训练游戏中的机器人。/n

【技术特征摘要】
1.一种机器人的训练方法,其特征在于,所述训练方法包括:
获取多个游戏技能的技能效果的属性特征;
根据所述属性特征,将所述多个游戏技能进行聚类,得到多个技能类别;
根据所述技能类别对应的关键属性特征,从所述技能类别包括的游戏技能中选取目标游戏技能;
将所述目标游戏技能的至少一个技能效果作为对应的技能类别的技能效果,训练游戏中的机器人。


2.根据权利要求1所述的机器人的训练方法,其特征在于,所述关键属性特征包括所述技能类别中的游戏技能对应的属性特征中的至少一个。


3.根据权利要求1所述的机器人的训练方法,其特征在于,所述根据所述属性特征,将所述多个游戏技能进行聚类,得到多个技能类别,包括:
根据多个游戏技能的技能效果的属性特征,确定不同游戏技能之间的相似度;
根据不同游戏技能之间的相似度,将所述多个游戏技能进行聚类。


4.根据权利要求1所述的机器人的训练方法,其特征在于,所述根据所述技能类别对应的关键属性特征,从所述技能类别包括的游戏技能中选取目标游戏技能,包括:
获取所述技能类别中的游戏技能分别在所述关键属性特征下的特征值;
从所述技能类别包括的游戏技能中,选取对应的在所述关键属性特征下的特征值最大的游戏技能作为所述目标游戏技能。


5.根据权利要求4所述的机器人的训练方法,其特征在于,所述获取所述技能类别中的游戏技能分别在所述关键属性特征下的特征值,包括:
根据所述技能类别中的游戏技能对应的状态标识和冷却时间,从所述技能类别包括的游戏技能中选取候选游戏技能;
获取所述候选游戏能分别在所述关键属性特征下的特征值,作为所述技能类别中的游戏技能分别在所述关键属性特征下的特征值。


6.根据权利要求1所述的机器人的训练方法,其特征在于,所述将所述目标游戏技能的至少一个技能效果作为对应的技能类别的技能效果,训练游戏中的机器人,包括:
获取训练样本集合,所述训练样本集合中包括多个对战状态下的对战状态特征以及在每个对战状态下使用的技能类别;
将每个对战状态下的对战状态特征作为机器人的输入特征,将在每个对战状态下使用的技能类别作为机器人的输出特征,基于机器人在每个对战状态下使用的技能类别对应的技能效果,生成目标分值,并基于所述目标分值调整机器人的参数;
当所述目标分值满足预设条件时,得到训练好的包括特定参数的机器人。


7.根据权利要求1所述的机器人的训练方法,其特征在于,所述属性特征包括以下特征中的至少一种:
伤害特征、眩晕特征、强化特征、削弱特征。


8.一种技能释放方法,其特征在于,应用于机器人,所述机器人是基于权利要求1-7任一项所述的机器人的训练方法得到的,所述方法包括:
获取当前对战状态下的对战状态特征;
基于所述对战状态特征,确定对应于当前对战状态的目标技能类别;
根据所述目标技能类别对应的关键属性特征,从所述目标技能类别包括的游戏技能中选取目标游戏技能;
释放所述目标游戏技能。


9.一种机器人的训练方法,其特征在于,所述训练方法包括:
获取多个游戏技能的技能效果的属性特征;
根据所述属性特征,将所述多个游戏技能进行聚类,得到多个技能类别;
将所述技能类别下的每个游戏技能的至少一个技能效果作为所述技能类别的技能效果,训练游戏中的机器人。


10.根据权利要求9所述的机器人的训练方法,其特征在于,所述将所述技能类别下的每个游戏技能的至少一个技能效果作为所述技能类别的技能效果,训练游戏中的机器人,包括:
获取训练样本集合,所述训练样本集合中包括多个对战状态下的对战状态特征、在每个对战状态下使用的技能类别、以及在每个...

【专利技术属性】
技术研发人员:雷子涵吕唐杰范长杰胡志鹏
申请(专利权)人:网易杭州网络有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1