【技术实现步骤摘要】
使用去中心化数据上的堆叠集成来训练异构模型的系统和方法
[0001]本公开的实施例涉及计算机领域,并且更具体地,涉及使用去中心化数据上的堆叠集成来训练异构模型的系统和方法。
技术介绍
[0002]机器学习(ML)通常涉及计算机实现的过程,该过程使用样本数据(例如,训练数据)来建立模型,以便做出预测或决策,而无需被明确编程来这样做。ML过程被用于各种各样的应用中,具体地在开发传统算法来执行各种计算任务是困难或不可行的情况下。
[0003]一种称为监督式机器学习的特定类型的ML过程为各种分类任务提供最先进的接收数据分类。设立监督式机器学习的过程通常涉及(a)中心化大型数据存储库,(b)获取这些数据的地面真值,以及(c)使用地面真值来训练用于分类任务的ML模型。然而,该框架带来了重大的实际挑战,包括针对训练ML模型而创建大型中央数据存储库所带来的数据隐私和安全挑战。
附图说明
[0004]根据一个或多个不同的示例,参考以下附图详细描述本公开。这些附图仅用于说明目的,且仅描述了典型的示例。
[0005 ...
【技术保护点】
【技术特征摘要】
1.一种用于以受保护的方式共享模型的去中心化系统,所述系统包括:集群的第一节点,所述第一节点包括计算机可读指令以:利用第一本地数据集训练第一子模型,所述第一本地数据集在所述第一节点处本地可访问,其中所述第一节点获取所述第一子模型;以及混淆训练后的所述第一子模型以作为第一混淆子模型;以及所述集群的第二节点,所述第二节点包括计算机可读指令以:从所述第一节点接收所述第一混淆子模型;构建包括所述第一混淆子模型和可训练参数层的堆叠集成的本地实例;以及利用在所述第二节点处本地可访问的第二本地数据集训练所述堆叠集成的所述本地实例。2.根据权利要求1所述的系统,其中所述第二节点还包括计算机可读指令以:利用所述第二本地数据集训练第二子模型以作为训练后的第二子模型,其中所述第二节点获取所述第二子模型;混淆训练后的所述第二子模型以作为第二混淆子模型;以及将所述第二混淆子模型传递到所述第一节点。3.根据权利要求2所述的系统,其中所述堆叠集成的所述本地实例还包括所述第二混淆子模型。4.根据权利要求2所述的系统,其中所述第一子模型是参数模型,并且所述第二子模型是非参数模型。5.根据权利要求2所述的系统,其中所述第一子模型和所述第二子模型共享相同的学习目标。6.根据权利要求2所述的系统,其中所述第一子模型和所述第二子模型接收相同的输入向量并且提供相同的输出向量。7.根据权利要求1所述的系统,其中所述第一混淆子模型通过由所述第一节点和所述第二节点预先商定的过程而被混淆。8.根据权利要求1所述的系统,其中所述第一混淆子模型被冻结并且不能够由所述第二节点训练。9.根据权利要求1所述的系统,其中所述第二节点还包括计算机可读指令以:投票来选择针对所述可训练参数层的架构;确定针对所述架构已经达成了协议;以及基于所述协议,使所述第二节点构建所述堆叠集成。10.根据权利要求2所述的系统,其中所述第二节点还包括计算机可读指令以:利用所述第一混淆子模型和所述第二混淆子模型的输出训练所述堆叠集成。11.一种训练堆叠集成...
【专利技术属性】
技术研发人员:S,
申请(专利权)人:慧与发展有限责任合伙企业,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。