用于执行多机器学习任务的分布式系统及其方法技术方案

技术编号：35598997 阅读：19 留言：0更新日期：2022-11-16 15:19

提供了一种用于执行多机器学习任务的分布式系统及其方法。所述分布式系统包括：多个计算装置，被配置为分别获取指定数据集的不同部分数据，并共同执行多个机器学习任务；其中，每个计算装置被配置为：基于自身所获取的部分数据并行地执行所述多个机器学习任务，其中，所述多个机器学习任务为多个模型训练任务或多个模型预测任务。根据所述分布式系统及其方法，能够有效缩短完成多个机器学习任务所需的时间。时间。时间。

全部详细技术资料下载

【技术实现步骤摘要】
用于执行多机器学习任务的分布式系统及其方法
[0001]本申请是申请日为2019年8月16日、申请号为201910759163.0、题为“用于执行多机器学习任务的分布式系统及其方法”的专利申请的分案申请。

[0002]本专利技术总体说来涉及人工智能领域，更具体地讲，涉及一种用于执行多机器学习任务的分布式系统及其方法。

技术介绍

[0003]一个机器学习训练任务的执行结果通常由大量的(例如，数十项)配置参数(即，超参数)的取值所决定。在自动机器学习等场景中，为了评估不同配置下机器学习训练任务的执行结果，常常需要对配置参数的取值进行不同尝试及不同组合，并对不同配置下的机器学习训练任务进行计算及评估。
[0004]在探索最佳的机器学习模型的过程中，所需执行的机器学习训练任务的数量，关于配置参数的数目及每项配置参数可能的取值数目呈指数增长，例如，对于一个仅有10项配置参数需要配置的机器学习训练任务，若每项配置参数存在3种可能的取值，则这10项配置参数将产生共计59049种可能的组合，将对应于59049个机器学习训练任务。
[0005]现有技术通常分别对不同配置下的机器学习训练任务进行独立执行，但存在显著的任务执行效率问题，这使得自动机器学习任务及其他需要对多个机器学习模型进行训练的任务常常无法在合理的时间内完成。

技术实现思路

[0006]本专利技术的示例性实施例在于提供一种用于执行多机器学习任务的分布式系统及其方法，其能够解决现有技术存在的多机器学习任务无法在合理的时间内完成的问题。...

【技术保护点】

【技术特征摘要】
1.一种用于执行多机器学习任务的分布式系统，包括：多个计算装置，被配置为分别获取指定数据集的不同部分数据，并共同执行多个机器学习任务；其中，每个计算装置被配置为：基于自身所获取的部分数据并行地执行所述多个机器学习任务，其中，所述多个机器学习任务为多个模型训练任务或多个模型预测任务。2.如权利要求1所述的分布式系统，其中，每个计算装置被配置为：一方面从数据源请求所述指定数据集中的数据，并对请求到的数据进行预处理后保存在本地，另一方面读取本地保存的数据，并基于读取的数据执行所述多个机器学习任务。3.如权利要求2所述的分布式系统，其中，每个计算装置被配置为：基于读取的每一条数据，并行地执行所述多个机器学习任务中需要使用该条数据的机器学习任务。4.如权利要求3所述的分布式系统，其中，每个计算装置被配置为：基于读取的每一条数据，使用向量化指令并行地执行所述多个机器学习任务中需要使用该条数据的机器学习任务。5.如权利要求1所述的分布式系统，还包括：参数服务器，被配置为维护所述多个机器学习任务所涉及的多个机器学习模型的参数，其中，机器学习模型的参数具有键值对的形式，其中，参数服务器被配置为：按照单个键对应于多个值的形式对所述多个机器学习模型的参数进行相同键合并后保存，或者，按照单个键对应于多个值的形式对所述多个机器学习模型的参数进行相同键合并，并对合并后的结果按照第一压缩方式进行压缩后保存。6.如权利要求5所述的分布式系统，其中，当所述多个机器学习任务为所述多个模型训练任务时，每个计算装置被配置为：将被合并了的训练所述多个机器学习模型所得到的结果提供给参数服务器，或者，将被合并且被按照第二压缩方式压缩了的训练所述多个机器学习模...

【专利技术属性】
技术研发人员：郑淇木，焦英翔，石光川，
申请(专利权)人：第四范式北京技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人