【技术实现步骤摘要】
【国外来华专利技术】在使用区块链的机器学习的去中心化模型构建中进行自修复的系统及方法
技术介绍
有效的模型构建需要大量数据。尽管分布式计算已被开发,从而使用多个计算机来协调大型计算任务,但是很难将其应用于大规模机器学习(“ML”)问题。分布式模型构建中出现了若干实际问题,诸如协调和部署困难、安全问题、系统等待时间的影响、容错、参数大小等。尽管这些问题和其他问题可以在可以对计算机进行严格控制的单个数据中心环境中进行处理,但是将模型构建从数据中心外部移动到真正去中心化的环境中会带来这些挑战和附加挑战。例如,针对去中心化ML的系统可以在具有有限数目的计算节点的有限分布的计算环境中。因此,与理论上可以使用无限数目的节点(例如,联合ML)的开放方法相比,相对较少数目的节点可以参与这些计算环境中的基于ML的过程。在参与节点数目有限的这样的计算环境中,去中心化ML中每个节点的贡献可能更有价值。因此,可能期望将去中心化模型构建进一步适配来实现容错。容错可以防止整个去中心化模型构建过程中节点(或节点组)的完全丢失,并且减轻故障节点(或节点组)对ML系统的整体学习能力的影响。附图说明根据一个或多个各种实施例,参考以下附图来详细描述本公开。这些附图仅被提供来用于例示的目的,并且仅描绘了典型的或示例性的实施例。图1描绘了根据一些实施例的包括参与者节点的自修复的使用区块链的机器学习(ML)的去中心化模型构建系统的示例。图2A-图2B图示了根据一些实施例的在图1所示的去中心化模型构建系统中的节点根据自修复技术来进行通信的示例。图3图示了根 ...
【技术保护点】
1.一种去中心化机器学习(ML)系统,包括:/n区块链网络的自修复计算机节点,所述区块链网络包括多个计算节点,所述自修复计算机节点从所述区块链网络内的故障状况恢复,并且被编程为:/n生成第一区块链事务,所述第一区块链事务包括所述自修复计算机节点与训练机器学习模型的最新迭代不同步的指示,其中所述第一区块链事务将被添加到分布式分类账,并且通知所述多个计算节点所述自修复计算机节点尚未准备好参与训练所述机器学习模型的后续迭代;/n从所述分布式分类账获得全局ML状态;/n将所获得的所述全局ML状态与在所述自修复计算机节点处的本地ML状态进行比较,以确定所述本地ML状态是否与全局ML状态一致;/n在确定所述本地ML状态与所述全局ML状态不一致时,使用所述区块链网络触发纠正动作,以将所述本地ML状态恢复为与所述全局ML状态一致;/n生成第二区块链事务,所述第二区块链事务包括所述自修复计算机节点与训练机器学习模型的所述最新迭代同步的指示,其中所述第二区块链事务将被添加到所述分布式分类账,并且通知所述多个计算节点所述自修复计算机节点已准备好参与训练所述机器学习模型的后续迭代;以及/n利用所述区块链网络重 ...
【技术特征摘要】
【国外来华专利技术】20190221 US 16/282,0981.一种去中心化机器学习(ML)系统,包括:
区块链网络的自修复计算机节点,所述区块链网络包括多个计算节点,所述自修复计算机节点从所述区块链网络内的故障状况恢复,并且被编程为:
生成第一区块链事务,所述第一区块链事务包括所述自修复计算机节点与训练机器学习模型的最新迭代不同步的指示,其中所述第一区块链事务将被添加到分布式分类账,并且通知所述多个计算节点所述自修复计算机节点尚未准备好参与训练所述机器学习模型的后续迭代;
从所述分布式分类账获得全局ML状态;
将所获得的所述全局ML状态与在所述自修复计算机节点处的本地ML状态进行比较,以确定所述本地ML状态是否与全局ML状态一致;
在确定所述本地ML状态与所述全局ML状态不一致时,使用所述区块链网络触发纠正动作,以将所述本地ML状态恢复为与所述全局ML状态一致;
生成第二区块链事务,所述第二区块链事务包括所述自修复计算机节点与训练机器学习模型的所述最新迭代同步的指示,其中所述第二区块链事务将被添加到所述分布式分类账,并且通知所述多个计算节点所述自修复计算机节点已准备好参与训练所述机器学习模型的后续迭代;以及
利用所述区块链网络重新登记,以参与训练所述机器学习模型的所述后续迭代。
2.根据权利要求1所述的系统,还包括:
来自在所述区块链网络上的所述多个节点的参与者节点,其中所述参与者节点被登记以参与训练机器学习模型的所述最新迭代;以及
在训练所述机器学习模型的最新迭代中,从所述参与者节点中选择的主节点。
3.根据权利要求2所述的系统,其中所述主节点被编程为:
接收所述自修复计算机节点与训练所述机器学习模型的最新迭代不同步的指示;以及
基于所述自修复计算机节点不同步的所述指示,排除所述自修复计算机节点参与训练所述机器学习模型的后续迭代,使得与所述自修复计算机节点的所述本地ML状态相关联的训练参数被避免被应用于所述机器学习模型。
4.根据权利要求3所述的系统,其中排除所述自修复计算机节点参与训练所述机器学习模型的后续迭代使得能够将所述机器学习模型训练为容忍在所述区块链网络内的所述故障状况。
5.根据权利要求2所述的系统,其中所述主节点被编程为:
接收所述自修复计算机节点与训练所述机器学习模型的最新迭代同步的所述指示;以及
基于所述自修复计算机节点同步的所述指示,包括所述自修复计算机节点来参与训练所述机器学习模型的所述后续迭代,使得与所述自修复计算机节点的所述本地ML状态相关联的训练参数被应用于所述机器学习模型。
6.根据权利要求5所述的系统,其中包括所述自修复计算机节点来参与训练所述机器学习模型的所述后续迭代将所述自修复计算机节点重新集成到去中心化机器学习中。
7.根据权利要求2所述的系统,其中所述自修复计算机节点还被编程为:
基于所述纠正动作的所述触发,获得由在所述区块链网络上的参与者节点生成的共享训练参数,其中所述共享训练参数基于在所述最新迭代期间被训练的所述参与者节点的本地模型;以及
将所述训练参数应用于更新在所述自修复计算机节点处的所述本地ML状态。
8.根据权利要求2所述的系统,其中所述主节点还被编程为:
从在所述区块链网络上的所述参与者节点获得共享训练参数,其中所述共享训练参数基于在所述最新迭代期间被训练的所述参与者节点的本地模型;
基于所述共享训练参数来生成合并训练参数;
生成包括所述主节点已生成所述合并训练参数的指示的事务;
使得所述事务作为块被写入在所述分布式分类账上。
9.根据权利要求8所述的系统,其中所述自修复计算机节点还被编程为:
基于所述纠正动作的所述触发,从所述主节点获得所述合并训练参数;
将所述合并训练参数应用于更新在所述自修复计算机节点处的所述本地ML状态。
10.根据权利要求1所述的系统,其中在所述区块链网络内的所述故障状况是网络连接中断、供电中断或计算节点崩溃。
11.根据权利要求9所述的系统,其中所述自修复计算机节点还被编程为:
自动执行节点重启来从所述故障状况恢复。
12.一种对包括多个计算节点的区块链网络的计算节点进行自修复的方法,自修复计算机节点从所述区块链网络内的故障状况恢复,所述方法包括:
由自修复计算机节点自动生成第一区块链事务,所述第一区块链事务包括所述自修复计算机节点与训练机器学习模型的最新迭代不同步的指示,其中所...
【专利技术属性】
技术研发人员:S·马纳莫汉,K·L·沙斯特里,V·加格,
申请(专利权)人:慧与发展有限责任合伙企业,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。