The invention discloses a Storm oriented continuous range query based on the feedback load balancing method, including: 1) upstream of worker will range query according to the query range overlap with the grid, the range query is divided into sub queries; 2) according to the grouping strategy the minimum load priority will range slightly sub query is distributed to the downstream worker load assessment updates downstream of worker and an evaluation cost; 3) downstream of the worker sub query task specific scope of implementation, the operation of the database or from the cache access query of moving objects within the scope of information, and to assess the true cost of range queries; 4) the true cost of range query feedback to the downstream worker, update the evaluation load, get the real load, each priority will range query tasks distributed to downstream minimum load of worker, so as to ensure the worker load difference as small as possible, improve The load balance and throughput of the system are calculated, and the actual load of the unit is calculated to update the predicted load, which makes the system more balanced and the resource utilization rate higher.
【技术实现步骤摘要】
一种面向Storm的基于反馈的连续范围查询负载均衡方法
本专利技术涉及通信网络
,尤其涉及一种面向Storm的基于反馈的连续范围查询负载均衡方法。
技术介绍
随着定位手段的多样化、移动终端的普及与通讯基础设施的完备,以基于位置服务(LocationBasedService,LBS)为代表的移动应用已经步入移动大数据时代。移动大数据环境下,数据规模更大、传播速度更快、多样性更加广泛,呈现出鲜明的流式特征,传统LBS技术面临多种新的挑战。基于位置服务的连续范围查询,具有高并发、低延迟特点,因此需要更高效的针对具有流式特征的移动大数据的处理能力。移动大数据时代的数据处理不仅需要存储与处理能力更强更灵活的计算平台,还需依托于计算平台的处理和优化技术。然而,在分布式系统中普遍存在着著名的“短板理论”,一个系统如果出现了负载不均衡问题,那么负载最大的节点往往将成为影响系统整体表现的瓶颈和短板。由于经济发展,地理位置等因素,人口密度在不同区域是不相同的,相应的,和LBS应用相对应的移动对象在地理分布上也是不均匀的。ApacheStorm本身作为一个分布式流处理系统,系统内部并没有提供有效的负载均衡机制,而且Storm自带的分组策略如ShuffleGrouping、FieldsGrouping都是基于一种通用思想而设计的分组策略,而没有考虑处理的任务所包含的语义,如连续范围查询具有查询范围、移动对象密度、范围重叠等时空语义,移动对象在地理分布上是不均匀的,因而范围查询的代价也不尽相同,这样很容易导致处理范围查询的各计算单元之间的负载不均衡,性能下降,所以Storm自 ...
【技术保护点】
一种面向Storm的基于反馈的连续范围查询负载均衡方法,其特征在于,包括:1)、上游worker将范围查询按照查询范围与网格的重叠情况,将范围查询划分为子查询;2)、按照最小负载优先的分组策略将范围子查询分发到下游worker,并用评估代价更新下游worker的评估负载;3)、下游worker执行具体的范围子查询任务,操作数据库或者从缓存中获取查询范围内的移动对象信息,并评估范围查询的真实代价;4)、以范围查询的真实代价反馈给下游worker,下游worker更新评估负载,得到真实负载。
【技术特征摘要】
1.一种面向Storm的基于反馈的连续范围查询负载均衡方法,其特征在于,包括:1)、上游worker将范围查询按照查询范围与网格的重叠情况,将范围查询划分为子查询;2)、按照最小负载优先的分组策略将范围子查询分发到下游worker,并用评估代价更新下游worker的评估负载;3)、下游worker执行具体的范围子查询任务,操作数据库或者从缓存中获取查询范围内的移动对象信息,并评估范围查询的真实代价;4)、以范围查询的真实代价反馈给下游worker,下游worker更新评估负载,得到真实负载。2.根据权利要求1所述的面向Storm的基于反馈的连续范围查询负载均衡方法,其特征在于,所述步骤1)具体步骤为:根据查询范围和网格重叠量,将数据元组分为多个子查询,每个子查询的查询范围只和一个网格重叠。3.根据权利要求1所述的面向Storm的基于反馈的连续范围查询负载均衡方法,其特征在于,所述步骤2)中最小负载优先的分组策略具体包括:2.1、针对每个范围的子查询,从range表中获取子查询的查询范围所在网格已缓存的区域,并借助扫描线算法计算查询范围中未缓存部分所占比例;2.2、计算子查询的预估代价,然后从up表中选取记录负载最小的worker,...
【专利技术属性】
技术研发人员:王波涛,周建鹏,梁伟,李睿,刘广鑫,
申请(专利权)人:东北大学,
类型:发明
国别省市:辽宁,21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。