【技术实现步骤摘要】
AI模型的训练方法、使用方法、计算机设备及存储介质
本申请涉及人工智能的
,尤其涉及一种AI模型的训练方法、使用方法、计算机设备及存储介质。
技术介绍
随着人工智能(ArtificialIntelligence,AI)技术的快速发展,人工智能技术被广泛的应用于各个领域,比如目前已将人工智能技术应用于双陆棋、国际跳棋、国际象棋、围棋等博弈类的应用程序中,并且达到超越人类职业选手的水平。除了上述棋类博弈,人工智能技术还可以应用于隐藏角色的多智能体博弈的应用程序中,但对于隐藏角色的多智能体博弈,由于不同的角色已知的信息量不同,且需要分析推理其余角色是对手还是队友,因此人工智能技术在隐藏角色的多智能体博弈的应用中具有更大的挑战。目前,主要是将虚拟遗憾最小化(CounterFactualRegretMinimization,CFR)与估值网络(valuenetwork)相结合,并通过自对弈的训练方式进行迭代训练,得到隐藏角色的多智能体博弈的AI模型。然而,使用现有的AI模型进行隐藏角色的多智能体博弈时,AI模型需要花费较 ...
【技术保护点】
1.一种AI模型的训练方法,其特征在于,包括:/n获取参与交互任务的用户的交互参与数据;/n从所述交互参与数据内提取出样本数据,其中,所述样本数据包括类图像特征、向量特征以及标注的动作标签和角色标签;/n根据所述类图像特征、向量特征以及标注的动作标签和角色标签对预设神经网络进行迭代训练,直至所述预设神经网络的训练次数达到预设阈值,得到AI模型。/n
【技术特征摘要】
1.一种AI模型的训练方法,其特征在于,包括:
获取参与交互任务的用户的交互参与数据;
从所述交互参与数据内提取出样本数据,其中,所述样本数据包括类图像特征、向量特征以及标注的动作标签和角色标签;
根据所述类图像特征、向量特征以及标注的动作标签和角色标签对预设神经网络进行迭代训练,直至所述预设神经网络的训练次数达到预设阈值,得到AI模型。
2.根据权利要求1所述的训练方法,其特征在于,所述根据所述类图像特征、向量特征以及标注的动作标签和角色标签对预设神经网络进行迭代训练,包括:
将所述类图像特征和向量特征输入至预设神经网络进行处理,得到输出结果,其中,所述输出结果包括预测的动作标签和角色标签;
根据所述预测的动作标签和角色标签以及标注的动作标签和角色标签更新所述预设神经网络的权重。
3.根据权利要求2所述的训练方法,其特征在于,所述预设神经网络包括第一子神经网络、第二子神经网络、第三子神经网络、第四子神经网络和第五子神经网络;所述将所述类图像特征和向量特征输入至预设神经网络进行处理,得到输出结果,包括:
将所述类图像特征输入至所述第一子神经网络进行处理,得到第一特征向量;
将所述向量特征输入至所述第二子神经网络进行处理,得到第二特征向量;
将所述第一特征向量与所述第二特征向量进行拼接,得到第一目标特征向量;
将所述向量特征与所述第一目标特征向量进行拼接,得到第二目标特征向量;
将所述第二目标特征向量输入至所述第三子神经网络进行处理,得到第一输出结果,其中,所述第一输出结果包括预测的动作标签;
将所述第一目标特征向量输入至所述第四子神经网络进行处理,得到第二输出结果,其中,所述第二输出结果包括预测的第一角色标签;
将所述第一目标特征向量输入至所述第五子神经网络进行处理,得到第三输出结果,其中,所述第三输出结果包括预测的第二角色标签。
4.根据权利要求3所述的训练方法,其特征在于,所述第一子神经网络为卷积神经网络,所述第二子神经网络为两个串联的两层全连接层,所述第三子神经网络为四个并联的两层全连接层,第四子神经网络和第五子神经网络均为两层全连接层;
或者,所述第一子神经网络包括...
【专利技术属性】
技术研发人员:武建芳,周正,李宏亮,刘永升,
申请(专利权)人:深圳海普参数科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。