一种基于分级指标的分布式电网业务监控方法技术

技术编号:23401355 阅读:51 留言:0更新日期:2020-02-22 13:29
本发明专利技术涉及一种基于分级指标的分布式电网业务监控方法,属于电网业务监控领域。本发明专利技术通过在各业务模块部署探针,采集各类业务模块的浏览量、点击率、访问量等实时数据,对采集的实时业务数据进行无量纲化处理以便于对各类业务数据进行统一监测,避免因业务数据类别、量纲不同对监测结果产生较大差异,运用决策树算法原理将业务监测指标进行分类、分级处理,并运用蚁群算法对经分类分级处理的各项监测指标阈值进行全局选优,建立指标群阈值预警雷达图,以便实时监控各电网业务服务器繁忙程度,对服务器资源进行合理调度,解决因某一业务领域访问拥塞,而造成整个业务系统停止运营甚至崩溃的问题。

A distributed power grid service monitoring method based on hierarchical index

【技术实现步骤摘要】
一种基于分级指标的分布式电网业务监控方法
本专利技术涉及一种基于分级指标的分布式电网业务监控方法,属于电网业务监控领域。
技术介绍
随着电网发展速度的加快和企业规模的增长,电网的安全性以及对其业务系统的运营状况进行分析监测显得尤为重要,经常出现运营监测滞后、电力服务不合理、电力服务系统堵塞、崩溃等状况,缺少一种对分布式电网业务进行合理有效监测的方法,需要建立一套具有客观性性、准确性以及高安全性的综合监测评价指标体系,对分布式电网业务进行实时监控,提供一种具有系统安全性、综合性、前瞻性的电网业务监控方法。
技术实现思路
本专利技术要解决的技术问题是提供一种基于分级指标的分布式电网业务监控方法,该方法利用决策树ID3算法对数据进行训练集、测试集按比例分类进行模拟测试的特点,解决对电网业务监测指标设定分类不客观、不合理的问题,利用蚁群算法进行全局参数选优的特点,解决各项指标阈值选取不合理、产生局部最优解等问题。本专利技术采用的技术方案是:一种基于分级指标的分布式电网业务监控方法,所述方法步骤如下:Step1、分别在各电网业务模块部署网络探针设备(简称NP),该设备利用深度包检测技术(简称DPI)和深度流检测技术(简称DFI)采集各模块访问量、点击率、浏览量等实时业务数据,并将实时数据同步至后台云端监测服务器,便于后台对各模块实时业务数据进行统一分析处理;Step2、因后台同步所得各模块访问量、点击率、浏览量等实时数据,是在基于不同指标下所采集到的业务数据,故这些数据在经济含义、计量单位以及业务水平方面有较大差异,无法在这些数据间直接进行运算,需要利用电网业务指标与无量纲化指标间呈现出的线性关系采用直线型无量纲化方法对Step1中采集的各电网业务模块实时监测数据进行统一处理,便于后续数据分析;各指标数据分内正向指标数据与逆向指标数据,对数据进行无量纲化处理通常需要先将各指标数据压缩至[0,1]的区间内,消除量纲的影响,对数据进行无量纲处理正向指标和逆向指标标准化处理;正向指标标准化公式为:逆向指标标准化公式为:上述公式中Fy、F′y分别为指标最小值、指标最大值、实时数据值、标准化数值,通过上述无量纲化处理可使得各项指标数据满足:0≤F′y≤1,从而消除量纲影响。Step3、为体现监测结果的客观真实性以及其价值意义,运用决策树ID3算法对Step2中已经过无量纲化处理的各业务模块访问量、点击率、浏览量等实时数据进行分类处理;设S是s个实时电网业务数据样本的集合,首先将经无量纲化处理的实时电网业务数据定义为m个不同的类Ci=(i=1,2,…m),si是类Ci中对应的样本数,可计算出给定样本分类所需的信息熵I(s1,s2,…sm):上式中pi为S个数据样本中任意一数据样本属于类Ci的概率,即:pi=si/s,由于信息编码中常用到二进制表示数据,因此对数函数中以2作为底数假设属性X具有n个不同取值,构成有关属性X的取值集合{x1,x2,……xn},若采用属性X对电网业务数据样本集合S的数据样本进行子集划分,构成集合{S1,S2,……Sn},集合中存在子集Sj在属性X上具有相同的值xj(j=1,2,……,v),v为相同值样本数,且xj∈S;若sij为子集Sj中Ci的数据样本数,则由属性X划分成子集的信息熵为:其中上式中为第j个子集的权值,即为集合Sj的样本个数与集合S样本总数的商值,pij为子集Sj中样本属于类Ci的概率,上式中若熵值E(X)越小则证明子集划分的纯度越高,精度越高,以此判断该指标是否满足作为电网业务监测指标的条件,并同时可计算出在属性X上分支将获得的信息增益Gain(X):Gain(X)=I(s1,s2,…sm)-E(X)若信息增益Gain(X)增加则代表信息的不确定性减少程度最大,则该属性作为电网业务监测指标更具合理性和客观性。因此在进行电网业务监测指标分类时以该指标的信息熵E(X)最小和信息增益Gain(X)最大作为最优分类标准进行电网监测业务指标分类。Step4、在Step3中已经以业务监测指标分类标准为根据对电网业务监测指标进行了分类处理,为保证每项指标的数据监测准确性以及其客观公正性,在每项电网业务监测指标下设置分级指标,通过对该项业务监测指标下的一级指标和二级指标概率值构建安全因素矩阵,然后对各项指标的安全因素矩阵进行幂值运算求得该项指标的风险指数,结合该项指标的风险指数以及Step3中的信息熵E(X)和信息增益Gain(A)对其进行去全面综合的评定;各项电网业务指标风险指数由第1层因素集Fa与第2层因素集Fab构成,即:第1层因素的构成为Fa(a=1,2,3)={指标F1,指标F2,指标F3}第2层因素的构成是Fab,即:Fa={Fab}(b=1,2,…,ε)。F1={F11,F12,F13,F14}F2={F21,F22,F23,F24}F3={F31,F32,F33,F34}最终构建出各项指标的安全因素矩阵从而风险指数Fσ=Fε,其中Fσ为该项监测指标的风险指数,ε为第二层因素数量值。Step5、运用蚁群算法在参数选优过程中可避免局部最优解的特性,对Step4中已进行过分级处理的各项电网业务监测指标下的业务数据进行阈值设定,若监测指标类Ci下的业务数据样本数为L,各项监测指标阈值K按照比例规则选择下一业务数据,由数据a1到下一数据a2的选择概率为:上式中分别为t时刻数据范围(a1,a2)、(a1,a3)上的信息素,分别为t时刻数据a1到数据a2、数据a1到数据a3的启发式因子,分别为数据a1,a2、数据a1,a3间的间距值,α、β指信息素与启发信息的相对重要性指数,t为阈值K在各项业务监测指标数据区间范围内完成一次循环选择的时间,edk为阈值K被允许访问的下一数据集合,为防止阈值K对该项业务监测指标数据进行重复选取,可以通过建立禁忌表对阈值K选取过的数据标记信息素,并及时更新,阈值K在某项业务监测指标全局数据区间内的信息素更新规则为:上式中其中为t+1时刻数据范围(a1,a2)上的信息素,为信息素挥发系数,e为其中一个参数,根据数据区间长度不同进行具体取值,为阈值K在数据范围(a1,a2)中释放的信息素,为数据a1,a2间的间距值,TK为阈值K选择数据的路径,为阈值K在数据范围(a1,a2)中释放的信息素最大值,Lbs为数据长度最大值,Tbs为阈值K选择数据的最优路径;阈值K按照上述最优路径在各项监测指标的全局的数据范围内进行数据选择,并利用信息素更新规则避免数据重复选择,从而进行参数选优得各项监测指标阈值K。Step6、结合Step5中计算得出的各项电网业务监测指标阈值K,建立指标群阈值雷达图,如图3所示,图中阴影部分为各项监测指标阈值K联合构建的阈值预警区域。本专利技术的有益效果是:本专利技术首先在各业务模块部署探针,保证本文档来自技高网...

【技术保护点】
1.一种基于分级指标的分布式电网业务监控方法,其特征在于:包括如下步骤:/nStep1、分别在各电网业务模块部署网络探针设备NP,该设备利用深度包检测技术DPI和深度流检测技术DFI采集各模块的实时业务数据,并将实时数据同步至后台云端监测服务器;/nStep2、利用电网业务指标与无量纲化指标间呈现出的线性关系,采用直线型无量纲化方法对Step1中采集的各电网业务模块实时监测数据进行统一处理;/n各指标数据分内正向指标数据与逆向指标数据,对数据进行无量纲化处理先将各指标数据压缩至[0,1]的区间内,对数据进行无量纲处理正向指标和逆向指标标准化处理;/n正向指标标准化公式为:/n

【技术特征摘要】
1.一种基于分级指标的分布式电网业务监控方法,其特征在于:包括如下步骤:
Step1、分别在各电网业务模块部署网络探针设备NP,该设备利用深度包检测技术DPI和深度流检测技术DFI采集各模块的实时业务数据,并将实时数据同步至后台云端监测服务器;
Step2、利用电网业务指标与无量纲化指标间呈现出的线性关系,采用直线型无量纲化方法对Step1中采集的各电网业务模块实时监测数据进行统一处理;
各指标数据分内正向指标数据与逆向指标数据,对数据进行无量纲化处理先将各指标数据压缩至[0,1]的区间内,对数据进行无量纲处理正向指标和逆向指标标准化处理;
正向指标标准化公式为:



逆向指标标准化公式为:



上述公式中Fy、F′y分别为指标最小值、指标最大值、实时数据值、标准化数值,通过上述无量纲化处理使得各项指标数据满足:0≤F′y≤1;
Step3、运用决策树ID3算法对Step2中已经过无量纲化处理的各业务模块的实时数据进行分类处理;设S是s个实时电网业务数据样本的集合,首先将经无量纲化处理的实时电网业务数据定义为m个不同的类Ci=(i=1,2,…m),si是类Ci中对应的样本数,可计算出给定样本分类所需的信息熵I(s1,s2,…sm):



上式中pi为S个数据样本中任意一数据样本属于类Ci的概率,即:pi=si/s,对数函数中以2作为底数;
假设属性X具有n个不同取值,构成有关属性X的取值集合{x1,x2,……xn},若采用属性X对电网业务数据样本集合S的数据样本进行子集划分,构成集合{S1,S2,……Sn},集合中存在子集Sj在属性X上具有相同的值xj(j=1,2,……,v),v为相同值样本数,且xj∈S;若sij为子集Sj中Ci的数据样本数,则由属性X划分成子集的信息熵为:



其中



上式中为第j个子集的权值,即为集合Sj的样本个数与集合S样本总数的商值,pij为子集Sj中样本属于类Ci的概率,上式中若熵值E(X)越小则证明子集划分的纯度越高,精度越高,以此判断该指标是否满足作为电网业务监测指标的条件,并同时可计算出在属性X上分支将获得的信息增益Gain(X):
Gain(X)=I(s1,s2,…sm)-E(X)
若信息增益Gain(X)增加则代表信息的不确定性减少程度最大,在进行电网业务监测指标分类时以该指标的信息熵E(X)最小和信息增益Gain(X)最大作为最优分类标准进行电网监测业务指标分类;
S...

【专利技术属性】
技术研发人员:孙北宁吕维新周植高龚泽政陈羽
申请(专利权)人:云南电网有限责任公司信息中心
类型:发明
国别省市:云南;53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1