游戏中虚拟对象的行为能力控制方法、装置及存储介质制造方法及图纸

技术编号:20697911 阅读:40 留言:0更新日期:2019-03-30 11:54
本发明专利技术提供一种游戏中虚拟对象的行为能力控制方法、装置及存储介质,通过获取调节参数,其中调节参数包括动作延迟参数、高斯噪声参数和动作次优级别参数;获取与调节参数对应的控制数据;根据控制数据控制虚拟对象的行为能力。通过上述控制方法,实现对虚拟对象行为能力的灵活控制,增加了用户与虚拟对象交互的趣味性,避免基于经验硬编码的固化的虚拟对象较易或较难攻克的情况。

【技术实现步骤摘要】
游戏中虚拟对象的行为能力控制方法、装置及存储介质
本专利技术实施例涉及AI控制
,尤其涉及一种游戏中虚拟对象的行为能力控制方法、装置及存储介质。
技术介绍
强化学习是机器学习的一个子领域,介于有监督学习与无监督学习之间。其理论最初来源于心理学中的行为主义理论以及相关动物行为学研究的启发。主要是通过虚拟对象和其所处的环境之间的交互以及其从环境获得的收益来更新虚拟对象对环境的理解,从而产生更好的策略以提升虚拟对象从环境中获得的收益,经过不断训练,理论上虚拟对象可以逐渐产生出针对一个环境的最优策略。强化学习方法目前在游戏中训练虚拟对象方面有着亮眼表现,和传统的游戏内置机器人的实现方法(决策树等)不同,强化学习方法更具有通用性,而且其性能更强并且可玩性更高。之所以选择游戏作为常用场景,是因为游戏场景不仅仅是对现实环境的一个模拟,更有着丰富的信息和较低难度的试错代价。Google旗下的DeepMind公司的一篇在著名杂志Nature上发表的关于深度强化学习基础算法DQN的论文就是在Atari游戏环境下开展的。经过多次训练,虚拟对象最终在玩游戏水平上超越了人类。当然,从概念上来讲,这种属于本文档来自技高网...

【技术保护点】
1.一种游戏中虚拟对象的行为能力控制方法,其特征在于,包括:获取调节参数;所述调节参数包括以下至少一项:动作延迟参数、高斯噪声参数和动作次优级别参数;获取与所述调节参数对应的控制数据;根据所述控制数据控制所述虚拟对象的行为能力。

【技术特征摘要】
1.一种游戏中虚拟对象的行为能力控制方法,其特征在于,包括:获取调节参数;所述调节参数包括以下至少一项:动作延迟参数、高斯噪声参数和动作次优级别参数;获取与所述调节参数对应的控制数据;根据所述控制数据控制所述虚拟对象的行为能力。2.根据权利要求1所述的方法,其特征在于,所述获取调节参数,包括:获取不同场景模式中的调节参数;所述场景模式包括进攻模式和防守模式。3.根据权利要求1或2所述的方法,其特征在于,所述动作延迟参数包括动作延迟帧数或者忽略帧数;所述高斯噪声参数包括高斯噪声的均值和/或高斯噪声的方差。4.根据权利要求3所述的方法,其特征在于,所述调节参数包括所述动作延迟参数,则所述获取与所述调节参数对应的控制数据,包括:获取与所述动作延迟参数对应的对所述虚拟对象进行控制的延迟控制数据;所述控制数据包括所述延迟控制数据。5.根据权利要求3所述的方法,其特征在于,所述调节参数包括高斯噪声参数,则所述获取与所述调节参数对应的控制数据,包括:获取与所述高斯噪声参数对应的对所述虚拟对象进行控制的位置干扰数据;所述控制数据包括所述位置干扰数据。6.根据权利要求3所述的方法...

【专利技术属性】
技术研发人员:贾航天范长杰
申请(专利权)人:网易杭州网络有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1