一种游戏模型训练方法、装置、电子设备及介质制造方法及图纸

技术编号：24831298 阅读：26 留言：0更新日期：2020-07-10 18:48

本申请提供了一种游戏模型训练方法、装置、电子设备及介质，涉及游戏技术领域，该方法在实现时，先针对每个训练完成的角色模型，将预设的第一环境信息输入到该角色模型中，以确定该角色模型针对第一环境信息所输出的第一响应信息；而后，针对每个训练完成的角色模型，根据该角色模型的角色类型、第一环境信息和第一响应信息，生成该角色模型的第一训练样本；最后分别使用每个角色模型的第一训练样本对综合模型进行训练。本申请通过对已训练完成的角色模型来生成训练样本，并通过这些训练样本对综合模型进行综合训练，使得训练完成的综合模型可以替代各个角色模型来使用，进而降低了游戏文件中模型数据的存储量。

全部详细技术资料下载

【技术实现步骤摘要】
一种游戏模型训练方法、装置、电子设备及介质
本申请涉及游戏
，尤其是涉及一种游戏模型训练方法、装置、电子设备及介质。
技术介绍
电子游戏中存在有各种各样的机器人，这些机器人可以作为对手与玩家进行对抗；可以作为玩家的队友，辅助玩家进行游戏；也可以是在玩家暂离的时候，接替玩家来对玩家所控制的角色下达操作指令，以接管该角色。目前，机器人的生成方式大概可以分为两种，分别是人工编程和机器学习。人工编程的方式指的是机器人的动作指令完全是由编程人员来设计的，编程人员可以在机器人的程序代码中写明在何种环境条件下执行何种动作。机器学习的方式指的是基于机器人的对抗数据(可以是机器人与机器人的对抗数据，也可以是机器人与玩家的对抗数据)对初始的机器人进行训练，训练后得到的机器人就可以针对各种环境条件确定出适合的动作了。一般情况下，对于玩法比较简单的游戏而言，通常会采用人工编程的方式来生成游戏中所使用的机器人，对于玩法比较复杂的游戏而言，通常会采用机器学习的方式来生成游戏中所使用的机器人。
技术实现思路
有鉴于此，本申请的目的在于提供一种游戏模型训练方法、装置及电子设备，以减小游戏文件中机器人数据占用的存储空间。在一些实现方式中，本申请实施例提供了一种游戏模型训练方法，包括：针对每个训练完成的角色模型，将预设的第一环境信息输入到该角色模型中，以确定该角色模型针对第一环境信息所输出的第一响应信息；针对每个训练完成的角色模型，根据该角色模型的角色类型、第一环境信息和第一响应信息，生...

【技术保护点】
1.一种游戏模型训练方法，其特征在于，包括：/n针对每个训练完成的角色模型，将预设的第一环境信息输入到该角色模型中，以确定该角色模型针对第一环境信息所输出的第一响应信息；/n针对每个训练完成的角色模型，根据该角色模型的角色类型、第一环境信息和第一响应信息，生成该角色模型的第一训练样本；/n分别使用每个角色模型的第一训练样本对综合模型进行训练。/n

【技术特征摘要】
1.一种游戏模型训练方法，其特征在于，包括：
针对每个训练完成的角色模型，将预设的第一环境信息输入到该角色模型中，以确定该角色模型针对第一环境信息所输出的第一响应信息；
针对每个训练完成的角色模型，根据该角色模型的角色类型、第一环境信息和第一响应信息，生成该角色模型的第一训练样本；
分别使用每个角色模型的第一训练样本对综合模型进行训练。

2.根据权利要求1所述的游戏模型训练方法，其特征在于，按照如下方式训练角色模型：
针对每个角色模型，将预设的第二环境信息输入到该角色模型中，以确定该角色模型针对第二环境信息所输出的第二响应信息；
针对每个角色模型，根据该角色模型所对应的第二环境信息和第二响应信息生成第二训练样本；
针对每个角色模型，使用该角色模型所对应的第二训练样本对该角色模型进行训练。

3.根据权利要求2所述的游戏模型训练方法，其特征在于，针对每个角色模型，使用该角色模型所对应的第二训练样本对该角色模型进行训练，包括：
针对每个角色模型，分别计算该角色模型的每个第二训练样本所对应的拟合误差；
针对每个角色模型，根据该角色模型的每个第二训练样本所对应的拟合误差，从第二训练样本中选择出目标第二训练样本；
针对每个角色模型，根据该角色模型所对应的目标第二训练样本对该角色模型进行训练。

4.根据权利要求1所述的游戏模型训练方法，其特征在于，分别使用每个角色模型的第一训练样本对综合模型进行训练，包括：
根据每个第一训练样本的角色类型和第一响应信息，对第一训练样本进行分组，以确定多组样本集合；每组样本集合中的第一训练样本的角色类型和第一响应信息均是相同的；
针对每组样本集合，根据该组样本集合中的第一训练样本的数量，对该组样本集合中的第一训练样本的数量进行调整；
分别使用所述调整后的每组样本集合中的第一训练样本对综合模型进行训练。

5.根据权利要求4所述的游戏模型训练方法，其特征在于，针对每组样本集合，根据该组样本集合中的第一训练样本的数量，对该组样本集合中的第一训练样本的数量进行调整，包括：
针对每组样本集合，若该组样本集合中的第一训练样本的数量超过预设数量阈值，则对该组样本集合中的第一训练样本进行下采样处理，以调整该组样本集合中的第一训练样本的数量；
针对每组样本集合，若该组样本集合中的第一训练样本的数量低于预设数量阈值，则对该组样本集合中的第一训练样本进行上采样...

【专利技术属性】
技术研发人员：陈柯，陈赢峰，范长杰，胡志鹏，
申请(专利权)人：网易杭州网络有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人