一种面向迭代式海量实时流计算方法技术

技术编号：13338144 阅读：140 留言：0更新日期：2016-07-13 10:22

本发明专利技术提出了一种面向迭代式海量实时流计算方法，属于[在线，批处理/流处理，Iterative]类型的大数据编程模型，包括以下步骤：步骤一、搭建集群环境；步骤二、开发拓扑结构，上传拓扑任务到大数据集群环境；步骤三、打开监控页面；步骤四、启动监控器，感知拓扑结构的运行状态。本发明专利技术提出了一种面向迭代式海量实时流计算方法，能够为特定算法或应用提供数据迭代计算的编程基础；具有低延迟、迭代计算、内存计算、高度并行等优点；在充分利用现有的大数据底层通信技术的前提下，实时读取海量流数据，迭代计算并行化的数据流，达到满足特定业务下数据迭代计算的需求。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及云计算大数据计算、分布式计算、流式计算领域，具体涉及到一种面向迭代式海量实时流计算方法。
技术介绍
海量数据的计算是大数据产生和发展的基础，目前流行的基于海量数据的编程模型可以分为在线型与离线型、流处理型与批处理型、DAG型与Iterative型等。例如Hadoop可以分为[离线，批处理，DAG]型，Storm可以分为[在线，流处理，DAG]型，Haloop可以分为[离线，批处理，Iterative]型。然而，目前还没有找到[在线，流处理，Iterative]型的大数据计算框架，而现实应用中有很多类似的应用场景，例如在线推介系统。因此，目前亟待开发出一种能在线迭代式处理流数据的编程模型。
技术实现思路
为解决现有技术的不足，本专利技术提出一种面向迭代式海量实时流计算方法，实现了一种新的大数据下的在线、迭代、内存计算模型，弥补了当前业界对编程模型的不足。本专利技术的技术方案是这样实现的：一种面向迭代式海量实时流计算方法，属于[在线，批处理/流处理，Iterative]类型的大数据编程模型，包括以下步骤：步骤一、搭建集群环境；步骤二、开发拓扑结构，上传拓扑任务到大数据集群环境；步骤三、打开监控页面；步骤四、启动监控器，感知拓扑结构的运行状态。可选地，所述步骤一中的集群环境由6台服务器组成，协同运行在一个私有网络空间里面，共同形成所述面向迭代式海量实时流计算方法...

【技术保护点】
一种面向迭代式海量实时流计算方法，其特征在于，属于[在线，批处理/流处理，Iterative]类型的大数据编程模型，包括以下步骤：步骤一、搭建集群环境；步骤二、开发拓扑结构，上传拓扑任务到大数据集群环境；步骤三、打开监控页面；步骤四、启动监控器，感知拓扑结构的运行状态。

【技术特征摘要】
1.一种面向迭代式海量实时流计算方法，其特征在于，属于[在线，批处理
/流处理，Iterative]类型的大数据编程模型，包括以下步骤：
步骤一、搭建集群环境；
步骤二、开发拓扑结构，上传拓扑任务到大数据集群环境；
步骤三、打开监控页面；
步骤四、启动监控器，感知拓扑结构的运行状态。
2.如权利要求1所述的面向迭代式海量实时流计算方法，其特征在于，所
述步骤一中的集群环境由6台服务器组成，协同运行在一个私有网络空间里面，
共同形成所述面向迭代式海量实时流计算方法的编程模型的物理环境。
3.如权利要求1所述的面向迭代式海量实时流计算方法，其特征在于，所
述拓扑结构由多层前后连接而成，网络层的个数、每一层的分析器个数、层...

【专利技术属性】
技术研发人员：张卫山，段鹏程，宫文娟，卢清华，李忠伟，
申请(专利权)人：中国石油大学华东，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人