基于云计算的数据挖掘REST服务平台制造技术

技术编号：12141960 阅读：71 留言：0更新日期：2015-10-02 23:28

一种基于云计算的数据挖掘REST服务平台，包括：云计算集群层，用于提供云存储及并行计算能力；算法引擎层，用于提供并行数据挖掘能力，提供各种并行算法库；数据挖掘服务引擎层，用于对外提供挖掘云服务，所有服务以Restful接口对外暴露；云挖掘服务SDK，用于提供一种本地调用挖掘云服务的方式，通过在其他业务系统中引入云挖掘服务SDK，在业务系统中使用数据挖掘、数据分析功能。本发明专利技术有效适用于海量数据处理、产品收益较高。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据挖掘
，尤其是一种数据挖掘REST服务平台。
技术介绍
随着互联网及移动互联网、物联网的飞速发展，人类社会的数据种类和规模正以前所未有的速度增长。据IDC的研宄报告显示：2013年中国产生的数据总量超过0. 8ZB(相当于8亿TB)，2倍于2012年，相当于2009年全球的数据总量。预计2020年，中国的数据总量将是2013年的10倍，海量数据中如何提取有价值的信息将成为人们迫切要求解决的问题。数据挖掘是从大量不完全有噪声的实际数据中提取隐含在其中的具有潜在实用信息和知识的过程，它能有效发现大规模数据中有价值的信息。然而，传统的建立在关系型数据库、数据仓库上的数据挖掘技术在进行数据分析和统计计算时需要大量的存储资源和计算资源，在面对大规模异构、高维数据时很难完成高效的数据分析。云计算是一种新兴的计算模式，它将计算任务分布在由大量计算节点组成的资源池上，使各种应用系统能够根据需要获取计算能力、存储空间和信息服务。云计算的出现，使得数据挖掘技术和平台有了新的发展方向，结合云计算的虚拟化、高扩展、高可用性构建新一代的数据挖掘平台是一种趋势。云计算是并行计算、分布式计算的发展，是解决海量数据挖掘任务，解决海量数据挖掘的有效手段，在理论和实践上都已得到证实和广泛应用。Google提出的MapReduce框架，是业界广泛认可的海量数据处理的并行计算模型，它对分布式操作如任务调度、节点通信等细节进行了封装，提供了更高层次的编程接口。Hadoop作为MapReduce的开源实现，在大数据挖掘领域得到广泛应用。...

【技术保护点】
一种基于云计算的数据挖掘REST服务平台，其特征在于：所述数据挖掘REST服务平台包括：云计算集群层，用于提供云存储及并行计算能力；算法引擎层，用于提供并行数据挖掘能力，提供各种并行算法库；数据挖掘服务引擎层，用于对外提供挖掘云服务，所有服务以Restful接口对外暴露；云挖掘服务SDK，用于提供一种本地调用挖掘云服务的方式，通过在其他业务系统中引入云挖掘服务SDK，在业务系统中使用数据挖掘、数据分析功能；所述云计算集群层中，采用分布式计算平台作为运行支撑，Hadoop以HDFS作为其分布式存储系统；所述算法引擎层中，调用算法库来提供算法服务功能，算法库实现基于Hadoop、Spark平台的并行关联规则分析、分类、聚类算法；所述数据挖掘服务引擎层中，提供的服务被封装成Restful接口；所述云挖掘服务SDK中，封装基于云的数据挖掘服务平台的Rest服务API接口以供本地调用，在业务系统中引入SDK的开发包，调用SDK服务时实例化相关的Service对象。

【技术特征摘要】

【专利技术属性】
技术研发人员：陈铁明，张旭，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人