一种基于数据流预测的Storm任务伸缩调度算法制造技术

技术编号：15982455 阅读：36 留言：0更新日期：2017-08-12 05:35

本发明专利技术涉及一种基于数据流预测的Storm任务伸缩调度算法，属于数据交换网络领域。通过监控模块获得用户提交的Topology任务的实时运行数据，求解在满足组件负载的情况下Topology中相连组件的并行度，然后迭代求出Topology中所有组件的并行度。利用时间序列模型来预测Topology要处理的数据量，并求得在该情况下Topology中开始组件spout的较优并行度，获得预测情况下的Topology中各组件的较优并行度，并进行调度。在调度中使用线上调度算法，最大限度减少结点间的网络通信并保证集群的负载均衡。本发明专利技术克服了现有对Topology中各组件间的关联性考虑的不足，弥补了不能快速高效地求解到用户提交Topology中各组件的较优并行度的不足，具有提前预测变化、提高吞吐量、降低处理时延的优点。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于数据流预测的Storm任务伸缩调度算法
本专利技术属于数据交换网络领域，涉及一种基于数据流预测的Storm任务伸缩调度算法。
技术介绍
云计算、物联网、社交媒体以及移动互联网等新兴技术和应用模式的普及和推广，促使全球数据量急剧增加，推动人类社会进入大数据时代。在大数据背景下，数据蕴含了丰富的内涵和价值，数据的时效性越来越重要，数据的流式特征也越来越显著，流式计算的重要性也越来越突出。业界推出了S4、Spark、Storm等流式计算框架。Storm是个实时的、分布式的以及具备高容错的计算系统。Storm可以处理大批量的数据，也可以在保证高可靠性的前提下让处理进行得更实时化，能快速处理或输出所有信息。Storm具备容错和分布计算等特性，可以到不同的机器上进行大批量的数据处理。正因Storm所表现出来的强大功能，使得它被广泛应用于国内外的互联网企业，如Twitter、阿里巴巴、雅虎等。但在Storm的应用及研究中，发现其在多个方面都有待完善。Storm是一个实时流式计算框架，时效性要求高，而调度算法的好坏直接影响到tuple的处理时延。Storm中默认的任务调度器使用轮询调度的策略，首先是计算集群中可供分配的slot资源，并判断当前已分配给运行Topology的slot是否需要重新分配，然后对可分配的slot进行排序。计算Topology的executor信息，最后将资源平均地分配给Topology。在调度算法的优化上，业界已有许多相关研究：L.Aniello等提出了一种将相互通信频率高的executor调度到同一个slot上来减少网络通信的改进调度算法...
一种基于数据流预测的Storm任务伸缩调度算法

【技术保护点】
一种基于数据流预测的Storm任务伸缩调度算法，其特征在于：该算法包括以下步骤：S1：设置目标函数；S2：求解Topology中worker数和各个组件的executor数；S3：预测Topology要处理的数据流并求解开始组件spout所需的executor数；S4：任务调度。

【技术特征摘要】
1.一种基于数据流预测的Storm任务伸缩调度算法，其特征在于：该算法包括以下步骤：S1：设置目标函数；S2：求解Topology中worker数和各个组件的executor数；S3：预测Topology要处理的数据流并求解开始组件spout所需的executor数；S4：任务调度。2.如权利要求1所述的一种基于数据流预测的Storm任务伸缩调度算法，其特征在于：所述S1设置目标函数为：其中，Ntuple为所处理tuple的数量，Trec为tuple由发送节点到处理节点所需的接受时间，Tqueue为tuple到处理节点后因bolt繁忙tuple排队的时间，Tproc为tuple的逻辑处理时间，Tsend为tuple处理完后形成新的tuple的发送时间。3.如权利要求1所述的一种基于数据流预测的Storm任务伸缩调度算法，其特征在于：所述S2具体为：S201：确定Topology中开始组件spout所需的executor数，通过公式依次求得后继组件中的较优的executor数；其中，Nexecutori为第i个组件的executor数量，Nexecutori-1为第i-1个组件的executor数量，Vgenerate为前一组件的executor的tuple产生速度，通过监控Topology的运行数据然后取平均值获得，t为一个周期开始后的时间，σ为通过多次试验然后取得一个较优的值，Vproc为第i个组件中executor的tuple处理速度，通过监控Topology的运行数据然后取平均值获得；S202：求得Topology所需的executor总数；S203：根据Storm官方建议每个worke...

【专利技术属性】
技术研发人员：熊安萍，段杭彪，蒋溢，祝清意，蒋亚雄，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：重庆,50

全部详细技术资料下载我是这个专利的主人