AI模型的训练方法、使用方法、计算机设备及存储介质技术

技术编号:25837204 阅读:27 留言:0更新日期:2020-10-02 14:17
本申请提供一种AI模型的训练方法、使用方法、计算机设备及存储介质,该方法包括:获取参与交互任务的用户的交互参与数据;从所述交互参与数据内提取出样本数据,其中,所述样本数据包括类图像特征、向量特征以及标注的动作标签和角色标签;根据所述类图像特征、向量特征以及标注的动作标签和角色标签对预设神经网络进行迭代训练,直至所述预设神经网络的训练次数达到预设阈值,得到AI模型。该训练方法可以减少AI模型的在线演算时间,并提高AI模型的准确率。

【技术实现步骤摘要】
AI模型的训练方法、使用方法、计算机设备及存储介质
本申请涉及人工智能的
,尤其涉及一种AI模型的训练方法、使用方法、计算机设备及存储介质。
技术介绍
随着人工智能(ArtificialIntelligence,AI)技术的快速发展,人工智能技术被广泛的应用于各个领域,比如目前已将人工智能技术应用于双陆棋、国际跳棋、国际象棋、围棋等博弈类的应用程序中,并且达到超越人类职业选手的水平。除了上述棋类博弈,人工智能技术还可以应用于隐藏角色的多智能体博弈的应用程序中,但对于隐藏角色的多智能体博弈,由于不同的角色已知的信息量不同,且需要分析推理其余角色是对手还是队友,因此人工智能技术在隐藏角色的多智能体博弈的应用中具有更大的挑战。目前,主要是将虚拟遗憾最小化(CounterFactualRegretMinimization,CFR)与估值网络(valuenetwork)相结合,并通过自对弈的训练方式进行迭代训练,得到隐藏角色的多智能体博弈的AI模型。然而,使用现有的AI模型进行隐藏角色的多智能体博弈时,AI模型需要花费较多的在线演算时间才能输出结果,同时还无法保证输出结果的准确率,极大地限制了AI技术在这些应用场景中的应用。因此,如何减少AI模型的在线演算时间,并提高AI模型的准确率是目前亟待解决的问题。
技术实现思路
本申请的主要目的在于提供一种AI模型的训练方法、使用方法、计算机设备及存储介质,旨在减少AI模型的在线演算时间,并提高AI模型的准确率。第一方面,本申请提供了一种AI模型的训练方法,所述方法包括:获取参与交互任务的用户的交互参与数据;从所述交互参与数据内提取出样本数据,其中,所述样本数据包括类图像特征、向量特征以及标注的动作标签和角色标签;根据所述类图像特征、向量特征以及标注的动作标签和角色标签对预设神经网络进行迭代训练,直至所述预设神经网络的训练次数达到预设阈值,得到AI模型。第二方面,本申请还提供了一种AI模型的使用方法,应用于服务器,所述服务器部署有所述AI模型,所述AI模型为采用如本申请提供的任一项训练方法进行训练得到的模型;所述方法包括:获取参与交互任务的AI用户的交互参与数据;从所述交互参与数据中提取类图像特征和向量特征,并将所述类图像特征和向量特征输入至与所述AI用户对应的AI模型进行处理,得到输出结果;将所述输出结果发送至所述AI用户,以使所述AI用户根据所述输出结果执行对应的交互动作。第三方面,本申请还提供了一种计算机设备,所述计算机设备包括:存储器和处理器;所述存储器用于存储计算机程序;所述处理器,用于执行所述计算机程序并在执行所述计算机程序时,实现本申请的实施例提供的任一项所述AI模型的训练方法。此外,本申请还提供了另一种计算机设备,所述计算机设备包括:存储器和处理器;所述存储器用于存储计算机程序;所述处理器,用于执行所述计算机程序并在执行所述计算机程序时,实现本申请的实施例提供的任一项所述AI模型的使用方法。第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现本申请实施例提供的任一项所述的AI模型的训练方法,或者,实现本申请实施例提供的任一项所述的AI模型的使用方法。本申请提供一种AI模型的训练方法、使用方法、计算机设备及存储介质,本申请通过从交互参与数据内提取出包含类图像特征、向量特征以及标注的动作标签和角色标签的样本数据,并根据样本数据中的类图像特征、向量特征以及标注的动作标签和角色标签对预设神经网络进行迭代训练,直到预设神经网络的训练次数达到设定值,得到AI模型,由于训练得到的AI模型为神经网络模型,因此在使用AI模型进行隐藏角色的多智能体博弈时,可以大幅度的减少AI模型的在线演算时间,同时通过样本数据中的类图像特征、向量特征以及标注的动作标签和角色标签对预设神经网络进行迭代训练,可以得到准确率高的AI模型。附图说明为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为实施本申请实施例提供的一种AI模型的训练及使用方法的一场景示意图;图2为实施本申请实施例提供的一种AI模型的训练及使用方法的另一场景示意图;图3为本申请实施例提供的一种AI模型的训练方法的流程示意图;图4为本申请实施例中的第一层类图像特征的示意图;图5为本申请实施例中的第二层类图像特征的示意图;图6为本申请实施例中的第三层类图像特征的示意图;图7为本申请实施例中的预设神经网络的一层级结构示意图;图8为本申请实施例中的预设神经网络的另一层级结构示意图;图9为本申请实施例中的多个AI模型在各角色下的胜率的折线图;图10为本申请实施例提供的一种AI模型的使用方法的流程示意图;图11为本申请实施例提供的AI模型的训练使用部署的示意图;图12为本申请实施例提供的一种计算机设备的结构示意性框图。本申请目的的实现、功能特点及优点将结合实施例,参阅附图做进一步说明。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。为解决上述问题,本申请实施例提供一种人工智能(ArtificialIntelligence,AI)模型的训练方法、使用方法、计算机设备及存储介质。在对本申请实施例进行详细介绍之前,先对本申请实施例涉及到的一些名词进行解释说明。由于在本申请说明书中将以AI模型应用在隐藏角色的多智能体博弈游戏为例进行介绍,因此还对涉及到游戏名词进行解释说明。人工智能(ArtificialIntelligence,AI):AI是目前研究和开发用于模拟、延伸以及扩展人类智能的一门新兴科学技术。时下AI技术已被广泛应用于多种场景下,比如游戏场景便是其中一种。终端:指代安装有应用程序(游戏APP)的终端设备。示例性的,可例如为智能手机、平板电脑、手提电脑或者是台式电脑等。AI模型:对于游戏场景来说,智能模拟的重点便是训练算法模型,在本申请中称之为AI模型。示例性的,AI模型在本申请中为深度神经网络。深度神经网络(DeepNeuralNetworks,DNN):DNN本文档来自技高网...

【技术保护点】
1.一种AI模型的训练方法,其特征在于,包括:/n获取参与交互任务的用户的交互参与数据;/n从所述交互参与数据内提取出样本数据,其中,所述样本数据包括类图像特征、向量特征以及标注的动作标签和角色标签;/n根据所述类图像特征、向量特征以及标注的动作标签和角色标签对预设神经网络进行迭代训练,直至所述预设神经网络的训练次数达到预设阈值,得到AI模型。/n

【技术特征摘要】
1.一种AI模型的训练方法,其特征在于,包括:
获取参与交互任务的用户的交互参与数据;
从所述交互参与数据内提取出样本数据,其中,所述样本数据包括类图像特征、向量特征以及标注的动作标签和角色标签;
根据所述类图像特征、向量特征以及标注的动作标签和角色标签对预设神经网络进行迭代训练,直至所述预设神经网络的训练次数达到预设阈值,得到AI模型。


2.根据权利要求1所述的训练方法,其特征在于,所述根据所述类图像特征、向量特征以及标注的动作标签和角色标签对预设神经网络进行迭代训练,包括:
将所述类图像特征和向量特征输入至预设神经网络进行处理,得到输出结果,其中,所述输出结果包括预测的动作标签和角色标签;
根据所述预测的动作标签和角色标签以及标注的动作标签和角色标签更新所述预设神经网络的权重。


3.根据权利要求2所述的训练方法,其特征在于,所述预设神经网络包括第一子神经网络、第二子神经网络、第三子神经网络、第四子神经网络和第五子神经网络;所述将所述类图像特征和向量特征输入至预设神经网络进行处理,得到输出结果,包括:
将所述类图像特征输入至所述第一子神经网络进行处理,得到第一特征向量;
将所述向量特征输入至所述第二子神经网络进行处理,得到第二特征向量;
将所述第一特征向量与所述第二特征向量进行拼接,得到第一目标特征向量;
将所述向量特征与所述第一目标特征向量进行拼接,得到第二目标特征向量;
将所述第二目标特征向量输入至所述第三子神经网络进行处理,得到第一输出结果,其中,所述第一输出结果包括预测的动作标签;
将所述第一目标特征向量输入至所述第四子神经网络进行处理,得到第二输出结果,其中,所述第二输出结果包括预测的第一角色标签;
将所述第一目标特征向量输入至所述第五子神经网络进行处理,得到第三输出结果,其中,所述第三输出结果包括预测的第二角色标签。


4.根据权利要求3所述的训练方法,其特征在于,所述第一子神经网络为卷积神经网络,所述第二子神经网络为两个串联的两层全连接层,所述第三子神经网络为四个并联的两层全连接层,第四子神经网络和第五子神经网络均为两层全连接层;
或者,所述第一子神经网络包括...

【专利技术属性】
技术研发人员:武建芳周正李宏亮刘永升
申请(专利权)人:深圳海普参数科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1