分布式批量作业分配方法及装置制造方法及图纸

技术编号：26596820 阅读：15 留言：0更新日期：2020-12-04 21:18

本发明专利技术提供了一种分布式批量作业分配方法及装置，涉及计算机技术领域，该方法包括：获取待分配作业的第一资源偏好数据、多个作业节点的第二资源偏好数据和待分配作业间的依赖关系数据，以每个第二资源偏好数据为聚类中心，对第一资源偏好数据进行K均值聚类处理，得到多个聚类结果，按照待分配作业的个数和依赖关系数据确定每个待分配作业的优先级信息，计算空闲作业节点与聚类结果的相似度值，根据相似度值确定目标聚类结果，根据优先级信息在目标聚类结果中为空闲作业节点分配作业。本发明专利技术对待分配作业先进行聚类，再针对每个空闲作业节点进行聚类内的搜索，能够更快速的找到适合的作业进行分配，实现更高效的分布式批量作业分配。

全部详细技术资料下载

【技术实现步骤摘要】
分布式批量作业分配方法及装置
本专利技术涉及计算机
，尤其是涉及一种分布式批量作业分配方法及装置。
技术介绍
现有银行个人客户权益系统，批量框架为分布式多节点的批处理调度方法，主节点进行任务分发，每个子节点并行作业。然而当有多个作业同时等待被处理时，子节点选取作业的方式是随机选择一个处理。然而不同节点性能优势和作业的优先级、资源消耗侧重点是有差异的。随机的方式并不能高效的使用节点资源。
技术实现思路
本专利技术提供了一种分布式批量作业分配方法及装置，可以通过为子节点选择更合适的作业，提高批量作业的分配效率。第一方面，本专利技术实施例提供了一种分布式批量作业分配方法，该方法包括：获取待分配作业的第一资源偏好数据、多个作业节点的第二资源偏好数据和待分配作业间的依赖关系数据；以每个所述第二资源偏好数据为聚类中心，对所述第一资源偏好数据进行K均值聚类处理，得到多个聚类结果；按照所述待分配作业的个数和所述依赖关系数据确定每个待分配作业的优先级信息；计算空闲作业节点与所述聚类结果的相似度值，根据所述相似度值确定目标聚类结果；根据所述优先级信息在所述目标聚类结果中为所述空闲作业节点分配作业。第二方面，本专利技术实施例还提供一种分布式批量作业分配装置，该装置包括：获取模块，用于获取待分配作业的第一资源偏好数据、多个作业节点的第二资源偏好数据和待分配作业间的依赖关系数据；聚类模块，用于以每个所述第二资源偏好数据为聚类中心，对所述第一资源偏好数据进行K均值聚类处理，得到多个聚类结果；权重模块，用...

【技术保护点】
1.一种分布式批量作业分配方法，其特征在于，包括：/n获取待分配作业的第一资源偏好数据、多个作业节点的第二资源偏好数据和待分配作业间的依赖关系数据；/n以每个所述第二资源偏好数据为聚类中心，对所述第一资源偏好数据进行K均值聚类处理，得到多个聚类结果；/n按照所述待分配作业的个数和所述依赖关系数据确定每个待分配作业的优先级信息；/n计算空闲作业节点与所述聚类结果的相似度值，根据所述相似度值确定目标聚类结果；/n根据所述优先级信息在所述目标聚类结果中为所述空闲作业节点分配作业。/n

【技术特征摘要】
1.一种分布式批量作业分配方法，其特征在于，包括：
获取待分配作业的第一资源偏好数据、多个作业节点的第二资源偏好数据和待分配作业间的依赖关系数据；
以每个所述第二资源偏好数据为聚类中心，对所述第一资源偏好数据进行K均值聚类处理，得到多个聚类结果；
按照所述待分配作业的个数和所述依赖关系数据确定每个待分配作业的优先级信息；
计算空闲作业节点与所述聚类结果的相似度值，根据所述相似度值确定目标聚类结果；
根据所述优先级信息在所述目标聚类结果中为所述空闲作业节点分配作业。

2.根据权利要求1所述的方法，其特征在于，获取待分配作业的第一资源偏好数据和多个作业节点的第二资源偏好数据之前，还包括：
获取待分配作业的预估资源消耗数据和多个作业节点的资源处理能力数据；
根据所述预估资源消耗数据生成第一资源偏好特征向量，并将所述第一资源偏好向量作为第一资源偏好数据；
根据所述资源处理能力数据生成第二资源偏好特征向量，并将所述第二资源偏好向量作为第二资源偏好数据。

3.根据权利要求1所述的方法，其特征在于，按照所述待分配作业的个数和所述依赖关系数据确定每个待分配作业的优先级信息，包括：
按照所述待分配作业的个数确定每个待分配作业的初始权重；
根据所述初始权重和所述依赖关系数据确定每个待分配作业的优先级信息。

4.根据权利要求3所述的方法，其特征在于，包括按照如下公式根据所述初始权重和所述依赖关系数据确定每个待分配作业的优先级信息：

其中，n为待分配作业的总个数，wi为待分配作业的优先级信息，m为被依赖作业的序号，wj为被依赖作业的优先级信息。

5.根据权利要求1所述的方法，其特征在于，根据所述优先级信息在所述目标聚类结果中为所述空闲作业节点分配作业，包括：
根据所述优先级信息利用布谷鸟搜索算法在所述目标聚类结果中确定目标待分配作业；
将所述目标待分配作业中无依赖作业或依赖作业已完成的待分配作业分配给所述空闲作业节点。

6.一种分布式批量作业分配装置，其特征在于，包括：
获取模块，用于获取待分配作业的第一资源偏好数据、多个作业节点的第二资...

【专利技术属性】
技术研发人员：肖慧闵，杜越，郑东欣，
申请(专利权)人：中国银行股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人