智能体控制模型训练方法、计算机设备及存储介质技术

技术编号：39178194 阅读：8 留言：0更新日期：2023-10-27 08:26

本申请涉及人工智能领域，提供一种智能体控制模型训练方法、计算机设备及存储介质，方法包括：获取虚拟环境中的关键位置信息，以及不同对抗道具的位置偏好信息；根据关键位置信息和位置偏好信息，确定不同对抗道具的关键位置数据库；根据当前位置、当前对抗道具及关键位置数据库确定智能体在虚拟环境中目标行动位置；基于预设模型控制智能体移动至目标行动位置，并在目标行动位置与虚拟环境进行交互，得到交互反馈信息；根据交互反馈信息，对预设模型的模型参数进行调整，直至得到目标模型。使智能体能够根据持有的对抗道具的区别，确定不同的关键位置数据库，并且基于不同的关键位置数据库以不同的风格与虚拟环境进行交互，提高智能体的灵活性。高智能体的灵活性。高智能体的灵活性。

全部详细技术资料下载

【技术实现步骤摘要】
智能体控制模型训练方法、计算机设备及存储介质

[0001]本申请涉及人工智能领域，尤其涉及一种智能体控制模型训练方法、计算机设备及存储介质。

技术介绍

[0002]随着人工智能的发展，在计算机游戏中由人工智能进行角色托管、游戏指导、游戏测试、非玩家角色(Non－Player Character，NPC)控制等场景也越来越普遍。然而，现有的对游戏中的智能体控制模型进行训练的方法作战策略较为单一，拟人性和灵活性较差，难以因地制宜地根据实际情况与真人玩家进行合作或对抗。因此，如何训练智能体控制模型以提高智能体的拟人性和灵活性成为了亟需解决的问题。

技术实现思路

[0003]本申请的主要目的在于提供一种智能体控制模型训练方法、计算机设备及存储介质，旨在提高智能体控制的拟人性和灵活性。
[0004]第一方面，本申请提供一种智能体控制模型训练方法，所述智能体控制模型训练方法包括以下步骤：
[0005]获取虚拟环境中的关键位置信息，以及不同对抗道具的位置偏好信息，不同的所述对抗道具对应的道具属性不同，并且不同的道具属性在所述虚拟环境中适配的关键位置不同；
[0006]根据所述关键位置信息和所述位置偏好信息，确定不同对抗道具对应的关键位置数据库；
[0007]获取所述智能体在所述虚拟环境中的当前位置及当前对抗道具，并根据所述当前位置、当前对抗道具及所述关键位置数据库确定所述智能体在所述虚拟环境中下一时刻的目标行动位置；
[0008]基于预设模型控制所述智能体从所述当前位置移动至...

【技术保护点】

【技术特征摘要】
1.一种智能体控制模型训练方法，其特征在于，所述方法包括：获取虚拟环境中的关键位置信息，以及不同对抗道具的位置偏好信息，不同的所述对抗道具对应的道具属性不同，并且不同的道具属性在所述虚拟环境中适配的关键位置不同；根据所述关键位置信息和所述位置偏好信息，确定不同对抗道具对应的关键位置数据库；获取所述智能体在所述虚拟环境中的当前位置及当前对抗道具，并根据所述当前位置、当前对抗道具及所述关键位置数据库确定所述智能体在所述虚拟环境中下一时刻的目标行动位置；基于预设模型控制所述智能体从所述当前位置移动至所述目标行动位置，并在所述目标行动位置与所述虚拟环境进行交互，得到交互反馈信息；根据所述交互反馈信息，对所述预设模型的模型参数进行调整，直至得到目标模型。2.根据权利要求1所述的智能体控制模型训练方法，其特征在于，所述基于预设模型控制所述智能体从所述当前位置移动至所述目标行动位置，并在所述目标行动位置与所述虚拟环境进行交互，得到交互反馈信息，包括：基于所述预设模型，控制所述智能体在所述目标行动位置与所述虚拟环境以及所述虚拟环境中的虚拟角色进行交互，获取所述交互反馈信息。3.根据权利要求2所述的智能体控制模型训练方法，其特征在于，所述方法还包括：在所述虚拟环境中的随机位置，设置用于与所述智能体进行交互的至少一个虚拟角色，所述虚拟角色分别具有至少一种对抗道具。4.根据权利要求2所述的智能体控制模型训练方法，其特征在于，所述基于预设模型控制所述智能体从所述当前位置移动至所述目标行动位置，并在所述目标行动位置与所述虚拟环境进行交互，得到交互反馈信息，包括：获取所述虚拟角色的角色类型，以及所述虚拟角色持有的对抗道具，根据所述角色类型和所述对抗道具，基于所述预设模型控制所述智能体；其中，所述角色类型至少包括：友方角色、敌方角色。5.根据权利要求1所述的智能体控制模型训练方法，其特征在于，所述关键位置信息包括：关键位置坐标、至少一项位置评价数值；所述位置偏好信息包括：至少一项所述位置评价数值对应的评价偏好权重；所述根据所述关键位置信息和所述位置偏好信息，确定不同对抗道具对应的关键位置数据库，包括：根据至少一项所述位置评价数值，以及至少一项所述位置评价数值对应的评价偏好权重，确定所述关键位置坐标针对不同对抗道具的标准化位置评分；根据所述关键位置坐标针对不同对抗道具的标准化位置评分，确定不同对抗道具对应的关键位置...

【专利技术属性】
技术研发人员：张黎，王善意，梁敏明，邓志弘，郭仁杰，杨木，
申请(专利权)人：深圳海普参数科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人