人工智能模型训练方法及系统技术方案

技术编号:39249611 阅读:9 留言:0更新日期:2023-10-30 12:01
本发明专利技术实施例涉及区块链技术领域,公开了一种人工智能模型训练方法及系统。该方法包括:算法节点通过区块链网络发布第一智能合约,第一智能合约包括模型训练算法;若目标数据节点判断自身符合第一智能合约的签署条件,则目标数据节点与算法节点签署第一智能合约;目标数据节点通过区块链网络发布第二智能合约,第二智能合约包括训练执行算法,训练执行算法为将样本数据获取算法和模型训练算法进行融合后生成的算法;算力节点与目标数据节点签署第二智能合约,并执行训练执行算法以生成初始人工智能模型的模型训练结果,将模型训练结果发布于区块链网络中。通过上述方式,本发明专利技术实施例防止了人工智能模型训练过程中的关键数据泄漏。键数据泄漏。键数据泄漏。

【技术实现步骤摘要】
人工智能模型训练方法及系统


[0001]本专利技术实施例涉及区块链
,具体涉及一种人工智能模型训练方法及系统。

技术介绍

[0002]区块链是一项新型信息处理技术,在表示价值、传递信任方面具有天然的优势。基于区块链技术进行人工智能模型的训练,可以充分利用区块链技术优势,使得训练过程安全高效。
[0003]相关技术中,人工智能模型的训练发起方通过区块链发起训练合约,区块链参与方可以通过签署训练合约以参与到人工智能模型的训练过程中,并在训练结束后,将训练完成的模型参数通过区块链网络传输给训练发起方,从而完成训练任务。然而,在实现本专利技术实施例的过程中,专利技术人发现:相关技术中,参与训练人工智能模型区块链参与方需要获取训练样本数据才能执行训练任务,并在训练结束后会获取到模型参数,使得训练过程的安全风险较高,导致关键数据泄漏。

技术实现思路

[0004]鉴于上述问题,本专利技术实施例提供了一种人工智能模型训练方法及系统,用于解决现有技术中存在的通过区块链进行人工智能模型训练的关键数据泄漏的问题。
[0005]根据本专利技术实施例的一个方面,提供了一种人工智能模型训练方法,应用于区块链网络,所述方法包括:
[0006]所述区块链网络的算法节点通过所述区块链网络发布第一智能合约,所述第一智能合约包括用于训练初始人工智能模型的模型训练算法;
[0007]若所述区块链网络上的目标数据节点判断自身符合所述第一智能合约的签署条件,则所述目标数据节点与所述算法节点签署所述第一智能合约;
[0008]所述目标数据节点通过所述区块链网络发布第二智能合约,所述第二智能合约包括训练执行算法,所述训练执行算法为将样本数据获取算法和所述模型训练算法进行融合后生成的算法;
[0009]所述区块链网络上的算力节点与所述目标数据节点签署所述第二智能合约,并执行所述训练执行算法以生成所述初始人工智能模型的模型训练结果,将所述模型训练结果发布于所述区块链网络中。
[0010]在一种可选的方式中,所述样本数据获取算法包括加密样本数据获取算法和样本数据解密算法;
[0011]所述加密样本数据获取算法用于从目标存储位置获取加密样本数据;
[0012]所述样本数据解密算法用于通过所述目标数据节点的公钥对所述加密样本数据进行解密,以生成解密样本数据。
[0013]在一种可选的方式中,所述模型训练算法包括模型训练参数生成算法和模型训练
参数加密算法;
[0014]所述模型训练参数生成算法用于根据所述解密样本数据对所述初始人工智能模型进行训练以生成模型训练参数;
[0015]所述模型训练参数加密算法用于通过所述算法节点的公钥将所述模型训练参数进行加密,以生成所述初始人工智能模型的模型训练结果。
[0016]在一种可选的方式中,在所述目标数据节点通过所述区块链网络发布第二智能合约之前,所述方法还包括:
[0017]所述目标数据节点通过自身的私钥对初始样本数据进行加密,以生成所述加密样本数据;
[0018]所述目标数据节点将所述加密样本数据保存至所述目标存储位置。
[0019]在一种可选的方式中,所述区块链网络上的目标数据节点判断自身符合所述第一智能合约的签署条件包括:
[0020]所述区块链网络上的目标数据节点根据所述第一智能合约确定所述模型训练算法所需的样本类型;
[0021]所述目标数据节点判断自身是否存储有与所述样本类型对应的样本数据;
[0022]若所述目标数据节点判断自身存储有与所述样本类型对应的样本数据,则所述目标数据节点确定自身符合所述第一智能合约的签署条件。
[0023]在一种可选的方式中,所述将所述模型训练结果发布于所述区块链网络中之后,所述方法还包括:
[0024]所述算法节点通过所述区块链网络获取所述模型训练结果;
[0025]所述算法节点通过自身的私钥对所述模型训练结果进行解密,以生成解密后的模型训练参数;
[0026]所述算法节点根据所述模型训练算法对应的验证集数据确定所述解密后的模型训练参数的准确率。
[0027]在一种可选的方式中,所述区块链网络包括多个算力节点,所述多个算力节点基于分布式机器学习的Ring

allreduce架构执行所述训练执行算法。
[0028]在一种可选的方式中,所述方法还包括:
[0029]所述算法节点根据所述多个算力节点中每个算力节点训练完成的模型训练参数的准确率确定对应算力节点的奖励额度;
[0030]所述算法节点根据所述奖励额度分别向每个算力节点发放奖励。
[0031]在一种可选的方式中,所述执行所述训练执行算法以生成所述初始人工智能模型的模型训练结果之后,所述方法还包括:
[0032]所述算力节点根据所述训练执行算法对应的测试集数据对生成的模型训练结果进行测试;
[0033]所述算力节点根据测试结果调整所述训练执行算法的算法参数,根据调整后的算法参数重新执行所述训练执行算法以生成所述初始人工智能模型的模型训练结果。
[0034]根据本专利技术实施例的另一方面,提供了一种人工智能模型训练系统,应用于区块链网络,所述系统包括算法节点、目标数据节点和算力节点;
[0035]所述算法节点用于:通过所述区块链网络发布第一智能合约,所述第一智能合约
包括用于训练初始人工智能模型的模型训练算法;
[0036]所述目标数据节点用于:若判断自身符合所述第一智能合约的签署条件,则所述目标数据节点与所述算法节点签署所述第一智能合约,通过所述区块链网络发布第二智能合约,所述第二智能合约包括训练执行算法,所述训练执行算法为将样本数据获取算法和所述模型训练算法进行融合后生成的算法;
[0037]所述算力节点用于:与所述目标数据节点签署所述第二智能合约,并执行所述训练执行算法以生成所述初始人工智能模型的模型训练结果,将所述模型训练结果发布于所述区块链网络中。
[0038]本专利技术实施例的区块链网络包括算法节点、目标数据节点和算力节点,通过区块链网络进行人工智能模型训练时,首先由算法节点通过区块链网络发布第一智能合约,第一智能合约包括用于训练初始人工智能模型的模型训练算法;当区块链网络上的目标数据节点判断自身符合第一智能合约的签署条件时,目标数据节点与算法节点签署第一智能合约并且通过区块链网络发布第二智能合约,第二智能合约包括将样本数据获取算法和模型训练算法进行融合后生成的训练执行算法;区块链网络上的算力节点可以与目标数据节点签署第二智能合约,并执行训练执行算法以生成初始人工智能模型的模型训练结果,并且将模型训练结果发布于区块链网络中。本专利技术实施例中,训练执行算法对算力节点来说相当于黑盒,算力节点无法获取执行过程中人工智能模型训练的关键数据,有效防止了人工智能模型训练的关键数据泄漏。
[0039]上述说明仅是本专利技术实施例技术方案的概述,为了能够更清楚了解本专利技术本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种人工智能模型训练方法,其特征在于,应用于区块链网络,所述方法包括:所述区块链网络的算法节点通过所述区块链网络发布第一智能合约,所述第一智能合约包括用于训练初始人工智能模型的模型训练算法;若所述区块链网络上的目标数据节点判断自身符合所述第一智能合约的签署条件,则所述目标数据节点与所述算法节点签署所述第一智能合约;所述目标数据节点通过所述区块链网络发布第二智能合约,所述第二智能合约包括训练执行算法,所述训练执行算法为将样本数据获取算法和所述模型训练算法进行融合后生成的算法;所述区块链网络上的算力节点与所述目标数据节点签署所述第二智能合约,并执行所述训练执行算法以生成所述初始人工智能模型的模型训练结果,将所述模型训练结果发布于所述区块链网络中。2.根据权利要求1所述的方法,其特征在于,所述样本数据获取算法包括加密样本数据获取算法和样本数据解密算法;所述加密样本数据获取算法用于从目标存储位置获取加密样本数据;所述样本数据解密算法用于通过所述目标数据节点的公钥对所述加密样本数据进行解密,以生成解密样本数据。3.根据权利要求2所述的方法,其特征在于,所述模型训练算法包括模型训练参数生成算法和模型训练参数加密算法;所述模型训练参数生成算法用于根据所述解密样本数据对所述初始人工智能模型进行训练以生成模型训练参数;所述模型训练参数加密算法用于通过所述算法节点的公钥将所述模型训练参数进行加密,以生成所述初始人工智能模型的模型训练结果。4.根据权利要求2或3所述的方法,其特征在于,在所述目标数据节点通过所述区块链网络发布第二智能合约之前,所述方法还包括:所述目标数据节点通过自身的私钥对初始样本数据进行加密,以生成所述加密样本数据;所述目标数据节点将所述加密样本数据保存至所述目标存储位置。5.根据权利要求1所述的方法,其特征在于,所述区块链网络上的目标数据节点判断自身符合所述第一智能合约的签署条件包括:所述区块链网络上的目标数据节点根据所述第一智能合约确定所述模型训练算法所需的样本类型;所述目标数据节点判断自身是否存储有与所述样本类型对应的样本数据;若所述目标数据节点判断自身存储有与所述样本类型对应的样本数据...

【专利技术属性】
技术研发人员:张高山巴特尔詹义朱华刘仲思王雪倪宁宁方明星赵蓓尹子轩洪东
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1