一种兼容多种算法框架的机器学习平台制造技术

技术编号：19859228 阅读：18 留言：0更新日期：2018-12-22 12:04

本发明专利技术公开一种兼容多种算法框架的机器学习平台，该平台通过搭建一个集群兼容所有主流的机器学习框架，统一进行资源调度和用户隔离。主流的机器学习框架搭建在Hadoop+Spark的集群之上，并使用RDD作为数据存储。本发明专利技术优点如下：一、利用yarn进行统一的资源管理，因此继承所有yarn的优点；二、使用Spark作为统一底层计算框架,Spark RDD作为统一数据存储，因此继承所有Spark优点；三、调度多种计算框架，支持所有框架的原生优点，包括同步/异步训练，模型/数据并行计算，在线预测等；四、完成了异构计算框架的整合；五、底层支持CPU和GPU。

全部详细技术资料下载

【技术实现步骤摘要】
一种兼容多种算法框架的机器学习平台
本专利技术涉及一种机器学习平台，尤其涉及一种兼容多种算法框架的机器学习平台。
技术介绍
机器学习已经发展了几十年，在不同时期，为了解决不同的场景的问题，出现了多种机器学习框架，如传统的机器学习框架ScikitLearn，分布式并行计算框架SparkML，以及深度学习框架TensorFlow,Caffe,IntelBigDL等。在实际的场景中，往往需要同时使用这些异构的计算框架解决具体的问题，来达到最优的效果。如果为每一种计算框架都搭建一个单独的集群，这样做存在较大的硬件资源浪费，开发和运维成本也非常高，并且不利于数据共享。
技术实现思路
本专利技术的目的在于通过一种兼容多种算法框架的机器学习平台，来解决以上
技术介绍
部分提到的问题。为达此目的，本专利技术采用以下技术方案：一种兼容多种算法框架的机器学习平台，该平台通过搭建一个集群兼容所有主流的机器学习框架，统一进行资源调度和用户隔离。特别地，所述主流的机器学习框架搭建在Hadoop+Spark的集群之上，并使用RDD作为数据存储。特别地，所述通过搭建一个集群兼容所有主流的机器学习框架，统一进行资源调度和用户隔离，具体包括：Spark原生支持SparkML；对于深度并行学习框架TensorFlow、Caffe以及BigDL，在启动每个SparkExecutor之后：启动TensorFlow,Caffe,BigDLworker，并且为数据和事件添加侦听；通过各个框架对应的feed机制，将SparkRDD数据从包括但不限于HDFS在内的存储介质进行读取并发送到TensorFlow,C...

【技术保护点】
1.一种兼容多种算法框架的机器学习平台，其特征在于，该平台通过搭建一个集群兼容所有主流的机器学习框架，统一进行资源调度和用户隔离。

【技术特征摘要】
1.一种兼容多种算法框架的机器学习平台，其特征在于，该平台通过搭建一个集群兼容所有主流的机器学习框架，统一进行资源调度和用户隔离。2.根据权利要求1所述的兼容多种算法框架的机器学习平台，其特征在于，所述主流的机器学习框架搭建在Hadoop+Spark的集群之上，并使用RDD作为数据存储。3.根据权利要求2所述的兼容多种算法框架的机器学习平台，其特征在于，所述通过搭建一个集群兼容所有主流的机器学习框架，统一进行资源调度和用户隔离，具体包括：Spark原生支持SparkML；对于深度并行学习框架TensorFlow、Caffe以及BigDL，在启动每个SparkExecutor之后：启动TensorFlow,Caffe,BigDLworker，并且为数据和事件添...

【专利技术属性】
技术研发人员：王峰，
申请(专利权)人：无锡雪浪数制科技有限公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人