神经网络模型的训练与角色控制方法、装置、电子设备制造方法及图纸

技术编号：40168616 阅读：7 留言：0更新日期：2024-01-26 23:39

本申请提供了一种神经网络模型的训练与角色控制方法、装置、电子设备；方法包括：获取虚拟场景中的虚拟角色在第一时刻对应的第一状态向量，并获取虚拟角色在第二时刻需要对应的第二状态向量；基于第一状态向量和第二状态向量，调用第一神经网络模型进行动作预测处理得到第一动作指令，并调用动作控制模型进行动作预测处理得到第二动作指令；基于选取概率从第一动作指令和第二动作指令中选取用于控制虚拟角色的目标动作指令；将第一状态向量、第二状态向量、以及第二动作指令组合成一个样本，并将样本存储到样本队列中；基于样本队列中的多个样本训练第一神经网络模型。通过本申请，能够以资源集约的方式实现对虚拟角色的动作的精确控制。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能，尤其涉及一种神经网络模型的训练与角色控制方法、装置、电子设备。

技术介绍

1、游戏中的虚拟角色通常会展现多样且灵活的动作，例如奔跑、跳跃等。相关技术中，这些动作由专业动作演员采集形成动画素材库，在游戏使用时再根据角色状态以及玩家指令从素材库中实时匹配出最接近的动画进行播放。然而，这种方法所需的内存空间以及运算量会随着动画素材的增多而线性增长。

2、此外，相关技术还提供了基于规则的动力学控制方法，例如全身运动控制(wbc，whole-body control)、模型预测控制(mpc，model predictive control)等，然而，基于规则的方法的缺点是运算效率和高动态运算精度不可兼得，为了提高运算精度，需要占用大量的运算资源，因此在游戏中在线部署时可能会造成动画卡顿。

技术实现思路

1、本申请实施例提供一种神经网络模型的训练方法、角色控制方法、装置、电子设备、计算机可读存储介质及计算机程序产品，能够以资源集约的方式实现对虚拟角色的动作的精确控制。

2、本申请实施例的技术方案是这样实现的：

3、本申请实施例提供一种神经网络模型的训练方法，包括：

4、获取虚拟场景中的虚拟角色在第一时刻对应的第一状态向量，并获取所述虚拟角色在第二时刻需要对应的第二状态向量；

5、基于所述第一状态向量和所述第二状态向量，调用第一神经网络模型进行动作预测处理以得到第一动作指令，并调用动作控制模型进行动作预测处理以得到第

6、基于选取概率从所述第一动作指令和所述第二动作指令中选取用于控制所述虚拟角色的目标动作指令，其中，所述选取概率在所述第一神经网络模型的训练过程中逐步增大；

7、将所述第一状态向量、所述第二状态向量、以及所述第二动作指令组合成一个样本，并将所述样本存储到样本队列中；

8、基于所述样本队列中的多个所述样本训练所述第一神经网络模型，其中，所述第一神经网络模型用于代替所述动作控制模型来控制所述虚拟角色的动作。

9、本申请实施例提供一种神经网络模型的训练装置，包括：

10、获取模块，用于获取虚拟场景中的虚拟角色在第一时刻对应的第一状态向量，并获取所述虚拟角色在第二时刻需要对应的第二状态向量；

11、动作预测模块，用于基于所述第一状态向量和所述第二状态向量，调用第一神经网络模型进行动作预测处理以得到第一动作指令，并调用动作控制模型进行动作预测处理以得到第二动作指令，其中，所述第一神经网络模型的计算复杂度小于所述动作控制模型的计算复杂度；

12、选取模块，用于基于选取概率从所述第一动作指令和所述第二动作指令中选取用于控制所述虚拟角色的目标动作指令，其中，所述选取概率在所述第一神经网络模型的训练过程中逐步增大；

13、组合模块，用于将所述第一状态向量、所述第二状态向量、以及所述第二动作指令组合成一个样本；

14、存储模块，用于将所述样本存储到样本队列中；

15、训练模块，用于基于所述样本队列中的多个所述样本训练所述第一神经网络模型，其中，所述第一神经网络模型用于代替所述动作控制模型来控制所述虚拟角色的动作。

16、本申请实施例提供一种神经网络模型的角色控制方法，包括：

17、获取虚拟场景中的虚拟角色在第四时刻对应的第四状态向量、以及针对所述虚拟角色触发的操控指令；

18、基于所述操控指令对应的操控指令向量、以及所述第四状态向量，确定所述虚拟角色在第五时刻需要对应的第五状态向量；

19、基于所述第四状态向量和所述第五状态向量，调用第一神经网络模型进行动作预测处理，得到第三动作指令，并根据所述第三动作指令控制所述虚拟角色的动作；

20、其中，所述第一神经网络模型是根据本申请实施例提供的神经网络模型的训练方法进行训练得到的。

21、本申请实施例提供一种神经网络模型的角色控制装置，包括：

22、获取模块，用于获取虚拟场景中的虚拟角色在第四时刻对应的第四状态向量、以及针对所述虚拟角色触发的操控指令；

23、确定模块，用于基于所述操控指令对应的操控指令向量、以及所述第四状态向量，确定所述虚拟角色在第五时刻需要对应的第五状态向量；

24、动作预测模块，用于基于所述第四状态向量和所述第五状态向量，调用第一神经网络模型进行动作预测处理，得到第三动作指令；

25、其中，所述第一神经网络模型是根据本申请实施例提供的神经网络模型的训练方法进行训练得到的；

26、控制模块，用于根据所述第三动作指令控制所述虚拟角色的动作。

27、本申请实施例提供一种电子设备，包括：

28、存储器，用于存储可执行指令；

29、处理器，用于执行所述存储器中存储的可执行指令时，实现本申请实施例提供的神经网络模型的训练方法或角色控制方法。

30、本申请实施例提供一种计算机可读存储介质，存储有可执行指令，用于被处理器执行时，实现本申请实施例提供的神经网络模型的训练方法或角色控制方法。

31、本申请实施例提供一种计算机程序产品，包括计算机程序或指令，用于被处理器执行时，实现本申请实施例提供的神经网络模型的训练方法或角色控制方法。

32、本申请实施例具有以下有益效果：

33、通过在第一神经网络模型的训练过程中，不断增大第一神经网络模型的第一动作指令和动作控制模型的第二动作指令中选取第一动作指令的概率，使得计算复杂度小的第一神经网络模型，能够不断拟合计算复杂度大的动作控制模型的控制能力，从而第一神经网络模型代替动作控制模型来控制虚拟角色的动作时，能够以尽可能低的计算资源和计算时间的消耗，至少实现与动作控制模型同样的控制精度。

本文档来自技高网...

【技术保护点】

1.一种神经网络模型的训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，

3.根据权利要求1所述的方法，其特征在于，所述获取所述虚拟角色在第二时刻需要对应的第二状态向量，包括：

4.根据权利要求1所述的方法，其特征在于，所述基于所述第一状态向量和所述第二状态向量，调用第一神经网络模型进行动作预测处理以得到第一动作指令，并调用动作控制模型进行动作预测处理以得到第二动作指令，包括：

5.根据权利要求4所述的方法，其特征在于，

6.根据权利要求4所述的方法，其特征在于，

7.根据权利要求6所述的方法，其特征在于，所述基于所述第一状态向量、所述第二状态向量、所述惯性力向量、所述重力向量、所述惯性矩阵、以及所述内力矩指令，确定所述第一状态向量的二阶时间导数，包括：

8.根据权利要求1至7任一项所述的方法，其特征在于，在基于选取概率从所述第一动作指令和所述第二动作指令中选取用于控制所述虚拟角色的目标动作指令之前，所述方法还包括：

9.根据权利要求1至7任一项所述的方法

10.根据权利要求1至7任一项所述的方法，其特征在于，所述基于所述样本队列中的多个所述样本训练所述第一神经网络模型，包括：

11.根据权利要求10所述的方法，其特征在于，

12.根据权利要求1至7任一项所述的方法，其特征在于，

13.根据权利要求1至7任一项所述的方法，其特征在于，所述方法还包括：

14.一种神经网络模型的角色控制方法，其特征在于，所述方法包括：

15.一种神经网络模型的训练装置，其特征在于，所述装置包括：

16.一种神经网络模型的角色控制装置，其特征在于，所述装置包括：

17.一种电子设备，其特征在于，所述电子设备包括：

18.一种计算机可读存储介质，存储有可执行指令，其特征在于，所述可执行指令被处理器执行时实现权利要求1至13任一项所述的神经网络模型的训练方法，或权利要求14所述的神经网络模型的角色控制方法。

19.一种计算机程序产品，包括计算机程序或指令，其特征在于，所述计算机程序或指令被处理器执行时实现权利要求1至13任一项所述的神经网络模型的训练方法，或权利要求14所述的神经网络模型的角色控制方法。

...

【技术特征摘要】

1.一种神经网络模型的训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，

3.根据权利要求1所述的方法，其特征在于，所述获取所述虚拟角色在第二时刻需要对应的第二状态向量，包括：

5.根据权利要求4所述的方法，其特征在于，

6.根据权利要求4所述的方法，其特征在于，

9.根据权利要求1至7任一项所述的方法，其特征在于，所述将所述样本存储到样本队列中，包括：

...

【专利技术属性】
技术研发人员：李世迪，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人