基于联邦决策树模型训练的分布式调度方法、系统及介质技术方案

技术编号：33951980 阅读：13 留言：0更新日期：2022-06-29 22:38

本发明专利技术提供了一种基于联邦决策树模型训练的分布式调度方法、系统及介质。方法包括：提供主控节点和若干个计算节点，主控节点包括全局调度器，计算节点包括本地调度器；全局调度器接收资源申请请求并将计算任务分配到各个计算节点；本地调度器接收所分配的计算任务；当某一计算节点的计算资源不足且另一计算节点的计算资源充足时，计算资源不足的计算节点将部分计算任务提交给计算资源充足的计算节点进行执行；当某一计算节点的计算资源不足且其余计算节点不足以接收额外的计算任务时，全局调度器将计算资源不足的计算节点的部分计算任务放入请求队列中，以等待其余计算节点的计算资源的释放。以上方法可以减轻超大规模数据训练过程中的计算压力。据训练过程中的计算压力。据训练过程中的计算压力。

全部详细技术资料下载

【技术实现步骤摘要】
基于联邦决策树模型训练的分布式调度方法、系统及介质

[0001]本专利技术涉及人工智能
，尤其涉及一种基于联邦决策树模型训练的分布式调度方法、分布式调度系统及计算机存储介质。

技术介绍

[0002]跨特征联邦决策树算法是联邦学习中一种重要的基础算法，与传统的中心化决策树算法不同，跨特征联邦决策树算法需要在不泄露本地数据的前提下，一方不泄露本地标签，其余参与方不泄露本地特征，联合一方甚至多方的特征数据构建树模型。跨特征联邦决策树算法可以有效丰富特征维度，从而实现更好的分类效果。
[0003]然而，为了实现数据不出本地的隐私保护，跨特征联邦决策树算法需要进行大量的加密运算以及频繁的通信，这会导致算法的训练效率极其低下。同时，由于树模型的训练往往采用全量数据的训练模式，无法按照逻辑回归或者神经网络之类的算法按批次训练。这些客观因素限制了跨特征联邦决策树算法在千万乃至上亿规模数据上的训练。

技术实现思路

[0004]本专利技术的主要目的在于提供基于联邦决策树模型训练的分布式调度方法、分布式调度系统及计算机存储介质，旨在解决现有技术中在对大规模或者超大规模的数据进行联邦决策树模型训练时，其数据计算量大且算法训练低效的问题。
[0005]本专利技术其中一个实施例提供了一种基于联邦决策树模型训练的分布式调度方法。所述分布式调度方法包括：
[0006]提供一个主控节点和若干个计算节点，所述主控节点包括全局调度器，所述计算节点包括本地调度器；
[0007]所述全局调度器接收资源申请...

【技术保护点】

【技术特征摘要】
1.一种基于联邦决策树模型训练的分布式调度方法，其特征在于，所述分布式调度方法，包括：提供一个主控节点和若干个计算节点，所述主控节点包括全局调度器，所述计算节点包括本地调度器；所述全局调度器接收资源申请请求并将计算任务分配到各个计算节点；所述本地调度器接收所述全局调度器所分配的计算任务；当某一计算节点的计算资源不足且另一计算节点的计算资源充足时，计算资源不足的计算节点将部分计算任务提交给计算资源充足的计算节点进行执行；当某一计算节点的计算资源不足且其余计算节点不足以接收额外的计算任务时，所述全局调度器将计算资源不足的计算节点的部分计算任务放入请求队列中，以等待其余计算节点的计算资源的释放。2.如权利要求1所述的基于联邦决策树模型训练的分布式调度方法，其特征在于，当某一计算节点的计算资源不足且另一计算节点的计算资源充足时，计算资源不足的计算节点将部分计算任务提交给计算资源充足的计算节点进行执行，包括：当某一计算节点的计算资源不足以执行所分配的计算任务时，该计算节点将计算资源不足的信息发送至所述全局调度器，并转发给其余计算节点；其余计算节点接收到某一计算节点的计算资源不足的信息时，若可用资源充足，则将计算资源充足的信息发送至所述全局调度器，并转发至计算资源不足的计算节点；计算资源不足的计算节点接收到其余计算节点发出的计算资源充足的信息时，将部分计算任务提交给计算资源充足的计算节点进行执行。3.如权利要求1所述的基于联邦决策树模型训练的分布式调度方法，其特征在于，所述计算资源包括中央处理器资源、内存资源以及图形处理器资源中的一种或者多种。4.如权利要求1所述的基于联邦决策树模型训练的分布式调度方法，其特征在于，所述全局调度器接收资源申请请求并将计算任务分配到各个计算节点，包括：提供集群可用资源表，所述集群可用资源表包括可用的计算节点信息；在接收到资源申请请求时，所述全局调度器从所述集群可用资源表中选取若干个计算节点用于执行计算任务，其中，所选取的计算节点的空余的计算资源大于未选取的计算节点的空余的计算资源。5.如权利要求4所述的基于联邦决策树模型训练的分布式调度方法，其特征在于，在任务执行的过程中，还包括新增计算节点的步骤：计算某一时间段内所选择的计算节点的计算资源的使用情况；若所选择的计算节点的计算资源的使用情况超过预设临界值，所述全局调度器从所述集群可用资源表中选择可用的计算节点加入到所选择的计算节点。6.如权利要求4所述的基于联邦决策树模型训练的分布式调度方法，其特征在于，在任务执行的过程中，还包括新增计算节点的步骤：根据当前等待任务的调用需求计算所需的计算节点数量；若算出的计算节点数量大于所选择的计算节点数量，所述全局调度器从所述集群可用资源表中选择...

【专利技术属性】
技术研发人员：潘富城，傅致晖，孟丹，李晓林，
申请(专利权)人：杭州博盾习言科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人