一种游戏模型训练方法、装置、电子设备及介质制造方法及图纸

技术编号:24831298 阅读:26 留言:0更新日期:2020-07-10 18:48
本申请提供了一种游戏模型训练方法、装置、电子设备及介质,涉及游戏技术领域,该方法在实现时,先针对每个训练完成的角色模型,将预设的第一环境信息输入到该角色模型中,以确定该角色模型针对第一环境信息所输出的第一响应信息;而后,针对每个训练完成的角色模型,根据该角色模型的角色类型、第一环境信息和第一响应信息,生成该角色模型的第一训练样本;最后分别使用每个角色模型的第一训练样本对综合模型进行训练。本申请通过对已训练完成的角色模型来生成训练样本,并通过这些训练样本对综合模型进行综合训练,使得训练完成的综合模型可以替代各个角色模型来使用,进而降低了游戏文件中模型数据的存储量。

【技术实现步骤摘要】
一种游戏模型训练方法、装置、电子设备及介质
本申请涉及游戏
,尤其是涉及一种游戏模型训练方法、装置、电子设备及介质。
技术介绍
电子游戏中存在有各种各样的机器人,这些机器人可以作为对手与玩家进行对抗;可以作为玩家的队友,辅助玩家进行游戏;也可以是在玩家暂离的时候,接替玩家来对玩家所控制的角色下达操作指令,以接管该角色。目前,机器人的生成方式大概可以分为两种,分别是人工编程和机器学习。人工编程的方式指的是机器人的动作指令完全是由编程人员来设计的,编程人员可以在机器人的程序代码中写明在何种环境条件下执行何种动作。机器学习的方式指的是基于机器人的对抗数据(可以是机器人与机器人的对抗数据,也可以是机器人与玩家的对抗数据)对初始的机器人进行训练,训练后得到的机器人就可以针对各种环境条件确定出适合的动作了。一般情况下,对于玩法比较简单的游戏而言,通常会采用人工编程的方式来生成游戏中所使用的机器人,对于玩法比较复杂的游戏而言,通常会采用机器学习的方式来生成游戏中所使用的机器人。
技术实现思路
有鉴于此,本申请的目的在于提供一种游戏模型训练方法、装置及电子设备,以减小游戏文件中机器人数据占用的存储空间。在一些实现方式中,本申请实施例提供了一种游戏模型训练方法,包括:针对每个训练完成的角色模型,将预设的第一环境信息输入到该角色模型中,以确定该角色模型针对第一环境信息所输出的第一响应信息;针对每个训练完成的角色模型,根据该角色模型的角色类型、第一环境信息和第一响应信息,生成该角色模型的第一训练样本;分别使用每个角色模型的第一训练样本对综合模型进行训练。在一些实现方式中,本申请实施例提供了第一方面的第一种可能的实施方式,其中,按照如下方式训练角色模型:针对每个角色模型,将预设的第二环境信息输入到该角色模型中,以确定该角色模型针对第二环境信息所输出的第二响应信息;针对每个角色模型,根据该角色模型所对应的第二环境信息和第二响应信息生成第二训练样本;针对每个角色模型,使用该角色模型所对应的第二训练样本对该角色模型进行训练。在一些实现方式中,本申请实施例提供了第一方面的第二种可能的实施方式,其中,针对每个角色模型,使用该角色模型所对应的第二训练样本对该角色模型进行训练,包括:针对每个角色模型,分别计算该角色模型的每个第二训练样本所对应的拟合误差;针对每个角色模型,根据该角色模型的每个第二训练样本所对应的拟合误差,从第二训练样本中选择出目标第二训练样本;针对每个角色模型,根据该角色模型所对应的目标第二训练样本对该角色模型进行训练。在一些实现方式中,本申请实施例提供了第一方面的第三种可能的实施方式,其中,分别使用每个角色模型的第一训练样本对综合模型进行训练,包括:根据每个第一训练样本的角色类型和第一响应信息,对第一训练样本进行分组,以确定多组样本集合;每组样本集合中的第一训练样本的角色类型和第一响应信息均是相同的;针对每组样本集合,根据该组样本集合中的第一训练样本的数量,对该组样本集合中的第一训练样本的数量进行调整;分别使用所述调整后的每组样本集合中的第一训练样本对综合模型进行训练。在一些实现方式中,本申请实施例提供了第一方面的第四种可能的实施方式,其中,针对每组样本集合,根据该组样本集合中的第一训练样本的数量,对该组样本集合中的第一训练样本的数量进行调整,包括:针对每组样本集合,若该组样本集合中的第一训练样本的数量超过预设数量阈值,则对该组样本集合中的第一训练样本进行下采样处理,以调整该组样本集合中的第一训练样本的数量;针对每组样本集合,若该组样本集合中的第一训练样本的数量低于预设数量阈值,则对该组样本集合中的第一训练样本进行上采样处理,以调整该组样本集合中的第一训练样本的数量。在一些实现方式中,本申请实施例提供了第一方面的第五种可能的实施方式,其中,针对每组样本集合,若该组样本集合中的第一训练样本的数量超过预设数量阈值,则对该组样本集合中的第一训练样本进行下采样处理,以调整该组样本集合中的第一训练样本的数量,包括:针对每组样本集合,若该组样本集合中的第一训练样本的数量高于预设数量阈值,则根据该组样本集合中第一训练样本的第一环境信息的分布情况,确定需要删除的目标第一训练样本;针对每组样本集合,将该组样本集合中的目标第一训练样本进行删除,以调整该组样本集合中的第一训练样本的数量。在一些实现方式中,本申请实施例提供了第一方面的第六种可能的实施方式,其中,针对每组样本集合,若该组样本集合中的第一训练样本的数量低于预设数量阈值,则对该组样本集合中的第一训练样本进行上采样处理,以调整该组样本集合中的第一训练样本的数量,包括:针对每组样本集合,若该组样本集合中的第一训练样本的数量低于预设数量阈值,则根据该组样本集合中第一训练样本的第一环境信息的分布情况,生成该组样本集合的第三训练样本;所述该组样本集合的第三训练样本中的角色类型与第一训练样本的角色类型相同;所述该组样本集合的第三训练样本中的第一响应信息与第一训练样本的第一响应信息相同;针对每组样本集合,将该组样本集合所对应的第三训练样本添加到该组样本集合中,以调整该组样本集合中的第一训练样本的数量。在一些实现方式中,本申请实施例还提供一种游戏模型训练装置,包括:第一输入模块,用于针对每个训练完成的角色模型,将预设的第一环境信息输入到该角色模型中,以确定该角色模型针对第一环境信息所输出的第一响应信息;第一生成模块,用于针对每个训练完成的角色模型,根据该角色模型的角色类型、第一环境信息和第一响应信息,生成该角色模型的第一训练样本;第一训练模块,用于分别使用每个角色模型的第一训练样本对综合模型进行训练。在一些实现方式中,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述游戏模型训练方法中的步骤。在一些实现方式中,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述游戏模型训练方法中的步骤。本申请实施例提供的一种游戏模型训练方法,先针对每个训练完成的角色模型,将预设的第一环境信息输入到该角色模型中,以确定该角色模型针对第一环境信息所输出的第一响应信息;而后,针对每个训练完成的角色模型,根据该角色模型的角色类型、第一环境信息和第一响应信息,生成该角色模型的第一训练样本;最后分别使用每个角色模型的第一训练样本对综合模型进行训练。本申请通过已训练完成的角色模型来生成训练样本,并通过这些训练样本对综合模型进行综合训练,使得训练完成的综合模型可以替代各个角色模型来使用,进而降低了游戏文件中模型数据的存储量。为使本申请的上述目的、特征和优点能更本文档来自技高网...

【技术保护点】
1.一种游戏模型训练方法,其特征在于,包括:/n针对每个训练完成的角色模型,将预设的第一环境信息输入到该角色模型中,以确定该角色模型针对第一环境信息所输出的第一响应信息;/n针对每个训练完成的角色模型,根据该角色模型的角色类型、第一环境信息和第一响应信息,生成该角色模型的第一训练样本;/n分别使用每个角色模型的第一训练样本对综合模型进行训练。/n

【技术特征摘要】
1.一种游戏模型训练方法,其特征在于,包括:
针对每个训练完成的角色模型,将预设的第一环境信息输入到该角色模型中,以确定该角色模型针对第一环境信息所输出的第一响应信息;
针对每个训练完成的角色模型,根据该角色模型的角色类型、第一环境信息和第一响应信息,生成该角色模型的第一训练样本;
分别使用每个角色模型的第一训练样本对综合模型进行训练。


2.根据权利要求1所述的游戏模型训练方法,其特征在于,按照如下方式训练角色模型:
针对每个角色模型,将预设的第二环境信息输入到该角色模型中,以确定该角色模型针对第二环境信息所输出的第二响应信息;
针对每个角色模型,根据该角色模型所对应的第二环境信息和第二响应信息生成第二训练样本;
针对每个角色模型,使用该角色模型所对应的第二训练样本对该角色模型进行训练。


3.根据权利要求2所述的游戏模型训练方法,其特征在于,针对每个角色模型,使用该角色模型所对应的第二训练样本对该角色模型进行训练,包括:
针对每个角色模型,分别计算该角色模型的每个第二训练样本所对应的拟合误差;
针对每个角色模型,根据该角色模型的每个第二训练样本所对应的拟合误差,从第二训练样本中选择出目标第二训练样本;
针对每个角色模型,根据该角色模型所对应的目标第二训练样本对该角色模型进行训练。


4.根据权利要求1所述的游戏模型训练方法,其特征在于,分别使用每个角色模型的第一训练样本对综合模型进行训练,包括:
根据每个第一训练样本的角色类型和第一响应信息,对第一训练样本进行分组,以确定多组样本集合;每组样本集合中的第一训练样本的角色类型和第一响应信息均是相同的;
针对每组样本集合,根据该组样本集合中的第一训练样本的数量,对该组样本集合中的第一训练样本的数量进行调整;
分别使用所述调整后的每组样本集合中的第一训练样本对综合模型进行训练。


5.根据权利要求4所述的游戏模型训练方法,其特征在于,针对每组样本集合,根据该组样本集合中的第一训练样本的数量,对该组样本集合中的第一训练样本的数量进行调整,包括:
针对每组样本集合,若该组样本集合中的第一训练样本的数量超过预设数量阈值,则对该组样本集合中的第一训练样本进行下采样处理,以调整该组样本集合中的第一训练样本的数量;
针对每组样本集合,若该组样本集合中的第一训练样本的数量低于预设数量阈值,则对该组样本集合中的第一训练样本进行上采样...

【专利技术属性】
技术研发人员:陈柯陈赢峰范长杰胡志鹏
申请(专利权)人:网易杭州网络有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1