一种大规模流式数据处理系统的瓶颈节点检测方法技术方案

技术编号：14818663 阅读：280 留言：0更新日期：2017-03-15 12:08

本发明专利技术一种大规模流式数据处理系统的瓶颈节点检测方法，属于大数据计算、模糊逻辑以及流式预处理技术领域。一种大规模流式数据处理系统的瓶颈节点检测方法，简称本方法，所依托的系统，即一种基于模糊逻辑控制的瓶颈检测系统，简称本系统，包括初始化单元、节点状态采集单元、模糊推理单元和解模糊单元；本方法步骤为：1初始化单元初始化模糊逻辑引擎，设定语义化标签及各状态量的隶属函数，加载模糊规则集，设定推理结果判定参数；2获取节点状态；3将输入变量模糊化；4模糊推理；5解模糊，获得判定结果。本发明专利技术检测到流量的变化给系统负载的变化，及时判断瓶颈节点进行扩展，以维护只运行一个资源利用最优的集群，达到减小集群规模的目的。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种大规模流式数据处理系统的瓶颈节点检测方法，属于大数据计算、模糊逻辑以及流式预处理

技术介绍
随着实时大数据技术的发展，很多公司开始部署自己的流式数据处理集群，维护这些集群的运行需要非常大的开销，而流式数据处理系统的典型特征是数据流大小不稳定，系统的复杂随着事件变换很快。为了使得系统能在少数大流量的情况下也能正常运行，在配置集群的时候需要按照预估的最大流量进行资源分配；但是大流量情况通常只在很少的情况下发生，如果资源配置按最高要求配置，则在大部分时候大部分资源都处于闲置状态，系统的资源利用率非常低，造成严重的资源浪费。因此如何监控一个运行中的集群，快速高效地检测到集群中的瓶颈节点并对其实施扩展成为了云计算基础架构领域的关键问题之一。现在主流的流式数据处理引擎都没有对单个节点过载(瓶颈)检测和进行扩展的设计，比如Storm和S4都是使用静态配置的方式进行作业的，对于流量不稳定的情况不能根据需要动态的分配和回收资源，只能从整体检测系统的运行状态，如果需要扩展则需要停止集群，根据需要编辑静态配置文件重新分配资源然后才能继续运行。针对现在云计算平台对扩展性功能的需求，科研人员研究了几种检测瓶颈节点的方法，并且在Storm等平台上进行了集成，在流式数据处理领域得到了诸多应用。对于流式数据处理系统的瓶颈节点检测和扩展的方方法大体分为三类，第一类是基于阈值的静态判断方法，这是一种简单而直观的方法，但是静态阈值的设定需要用户对应用的负载趋势有很深的理解才能正确设置并且阈值对应用是独立的，云平台不能得知这些阈值怎么确定。第二类是一种基于增强学习的...
一种大规模流式数据处理系统的瓶颈节点检测方法

【技术保护点】
一种大规模流式数据处理系统的瓶颈节点检测方法，其特征在于：本方法所依托的系统，即一种基于模糊逻辑控制的瓶颈检测系统，简称本系统包括初始化单元、节点状态采集单元、模糊推理单元和解模糊单元；一种大规模流式数据处理系统的瓶颈节点检测方法，具体步骤如下：步骤1：初始化单元初始化模糊逻辑引擎，设定输入变量的语义化标签及各语义标签的隶属函数，加载模糊规则集，设定推理结果判定参数；步骤2：节点状态采集单元获取节点状态；步骤3：模糊推理单元将输入变量模糊化；步骤4：模糊推理；步骤5：解模糊，获得判定结果；至此，步骤1到步骤5，完成了一种大规模流式数据处理系统的瓶颈节点检测方法。

【技术特征摘要】
1.一种大规模流式数据处理系统的瓶颈节点检测方法，其特征在于：本方法所依托的系统，即一种基于模糊逻辑控制的瓶颈检测系统，简称本系统包括初始化单元、节点状态采集单元、模糊推理单元和解模糊单元；一种大规模流式数据处理系统的瓶颈节点检测方法，具体步骤如下：步骤1：初始化单元初始化模糊逻辑引擎，设定输入变量的语义化标签及各语义标签的隶属函数，加载模糊规则集，设定推理结果判定参数；步骤2：节点状态采集单元获取节点状态；步骤3：模糊推理单元将输入变量模糊化；步骤4：模糊推理；步骤5：解模糊，获得判定结果；至此，步骤1到步骤5，完成了一种大规模流式数据处理系统的瓶颈节点检测方法。2.根据权利要求1所述的一种大规模流式数据处理系统的瓶颈节点检测方法，其特征还在于：步骤1中，模糊逻辑引擎是实现了模糊逻辑控制语言(FCL)标准(IEC1131-7)以及能进行模糊推理的程序引擎，可使用C++语言实现的fuzzylite以及Java等语言实现的jFuzzylogic；语义化标签是模糊逻辑使用的“真值”，各个输入值(即节点状态)有自己的语义标签及对应的隶属函数，这些应该在初始化节点设置好，通常记录在一个配置文件...

【专利技术属性】
技术研发人员：翟岩龙，吴煦，王子硕，扶聪，张鑫宇，
申请(专利权)人：北京理工大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人