基于计量大数据聚类模型的采集终端生产厂商评价方法技术

技术编号:20486935 阅读:19 留言:0更新日期:2019-03-02 19:50
本发明专利技术公开了一种基于计量大数据聚类模型的采集终端生产厂商评价方法,包括步骤:获取采集终端的原始数据,筛选衡量采集终端的评估指标;采用高斯混合模型聚类算法提取典型评估指标数据,获取聚类中心,形成决策矩阵,并对其分别按效益型和成本型进行标准化处理;分别计算采集终端各项评估指标基于层次分析法、熵权法、皮尔逊相关系数法以及变异系数法的权重,用指标权重的组合优化模型获得组合权重,对决策矩阵进行加权处理从而获得采集终端综合评估的评估矩阵;用夹角度量法对采集终端的质量进行综合评估,按照从高至低的顺序将各个采集终端供应商的质量进行优劣排序,获得评价结果。其可以为用用电信息采集系统采集运维工作提供支撑。

Manufacturer Evaluation Method of Collection Terminal Based on Clustering Model of Metrological Big Data

The invention discloses a method for evaluating the manufacturer of acquisition terminal based on the clustering model of large measurement data, which includes steps: acquiring the original data of acquisition terminal, screening evaluation indicators for measuring acquisition terminal; extracting typical evaluation indicators data by using the clustering algorithm of Gauss mixture model, acquiring clustering centers, forming decision matrix, and proceeding according to the benefit type and cost type respectively. Standardization processing; Calculate the weights of each evaluation index of acquisition terminal based on analytic hierarchy process, entropy weight method, Pearson correlation coefficient method and coefficient of variation method, obtain the combination weights with the combination optimization model of index weight, and weigh the decision matrix to obtain the evaluation matrix of comprehensive evaluation of acquisition terminal; Use angle measurement method to synthesize the quality of acquisition terminal. According to the order from high to low, the quality of each acquisition terminal supplier is ranked, and the evaluation results are obtained. It can provide support for the collection, operation and maintenance of electricity information acquisition system.

【技术实现步骤摘要】
基于计量大数据聚类模型的采集终端生产厂商评价方法
本专利技术涉及电力系统领域,特别是涉及基于计量大数据聚类模型的采集终端生产厂商评价方法。
技术介绍
自2011年国网开始大范围建设用电信息采集系统以来,用电信息采集系统越来越多得承担了营销侧的计量业务工作,采集终端定时定期地采集电能表数据项,按要求将采集信息上送系统,是用电信息采集系统的核心组成部分,其质量直接影响着用户用电信息的获取,针对其故障导致的运维也浪费了大量的人力物力。用电信息采集系统覆盖范围的逐步扩大,采集的对象和采集频率逐年提高,各类计量数据和采集数据应用逐渐完善。以浙江的用电信息采集系统为例,用电信息采集每周数据增长量近1TB,历年累积收集的数据十分丰厚,并且在2015年建立的采集运维模块收集了大量的采集终端故障历史信息。但针对这些数据却缺少足够的数据挖掘手段,使数据金矿的价值难以体现。目前浙电采集大数据分析平台已经具备初步的数据分析能力,能够通过大数据技术分析计量装置运行数据,开展可靠性质量评估方法研究,进而提升公司计量精益化管理水平。供电单位一般对采集终端的厂家运行质量评估停留在一些考核指标的基础上,以及针对地市单位反映的批量性故障收集上,相对比较粗犷。
技术实现思路
本专利技术要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进,提供基于计量大数据聚类模型的采集终端生产厂商评价方法,以达到对采集终端质量作出科学、合理的定量评价的目的。为此,本专利技术采取以下技术方案。基于计量大数据聚类模型的采集终端生产厂商评价方法,其特征在于,包括如下步骤:1)获取每个批次和区域中采集终端的原始数据,筛选获取衡量采集终端的评估指标:评估指标包括负荷采集合格率,电量数据采集率,无故障工作时间,反映采集异常的严重异常次数、一般异常次数、轻微异常次数,维修率和在线率;2)采用高斯混合模型聚类算法提取采集终端海量数据中的评估指标数据,获取聚类中心,形成采集终端综合评估的决策矩阵,并对其分别按效益型和成本型进行标准化处理;3)分别计算采集终端各项典型评估指标基于层次分析法、熵权法、皮尔逊相关系数法以及变异系数法的权重,然后用指标权重的组合优化模型获得组合权重,对决策矩阵进行加权处理从而获得采集终端综合评估的评估矩阵;4)根据评估矩阵,用夹角度量法对采集终端的质量进行综合评估,按照从高至低的顺序将各个采集终端供应商的质量进行优劣排序,获得评价结果。作为优选技术手段:在步骤1中,采用8个衡量采集终端的评估指标,分别为:负荷采集合格率α1,电量数据采集率α2,无故障工作时间α3,反映采集异常的严重异常次数α4、一般异常次数α5、轻微异常次数α6,维修率α7和在线率α8:式中:Nsamp是采样时间段的总个数,Tsamp,i是第i次采样的时间长度,即总采样时间;Mi、mi、Ci、ci、bi和Bi分别是第i个采样时间段内采集终端负荷数据总个数、负荷数据合格的个数、理论应采集的数据量、实际采集的数据量、在线的采集终端个数和采集终端总个数;Fser,i、Fgen,i、Fun,i分别是第i个采样时间段内采集终端发生严重、一般和轻微故障的次数;Nsamp,F是首次出现Fser,i+Fgen,i+Fun,i≠0的采样时间段;Trate和TF分别是采集终端的额定运行时间和故障停运时间。作为优选技术手段:在步骤2)高斯混合模型聚类算法中:假设GMM由K个高斯分布混合而成,则每个高斯分布称作一个“组分”,这些“组分”线性相加即为GMM的概率密度函数:式中:ωk表示第k个多维单高斯分布的权值,Nk(x;μk;Σk)表示第k个多维单高斯分布的概率密度函数,x表示数据样本列向量,μk表示第k个高斯模型的期望向量,Σk表示第k个高斯模型的方差;采集终端数据的GMM聚类算法流程为:205)令l=0,随机选择初始化的ω(l),μ(l),Σ(l),求取第i个样本点xi属于第k类高斯模型的初始化后验概率:206)将第201)步得到的结果代入最大似然公式计算第l+1次迭代的GMM聚类参数:式中:N为待聚类的数据点个数;207)若成立(ε一般取10-5),则迭代结束,即为估计得到的GMM聚类参数,继续下一步;否则,回到第202)步;208)采用贝叶斯概率公式计算第i个样本点xi属于第k类高斯模型的概率:根据贝叶斯概率最大准则,将第i个样本点xi划分到使其概率p(μk,Σk|xi)取得最大的那类高斯模型中。作为优选技术手段:在步骤2),决策矩阵为:式中:dij表示第i个采集终端供应商第j个指标的值,P为采集终端供应商个数,Q为衡量供应商的采集终端的评价指标个数,其中Q等于8;效益型指标标准化处理方法为:成本型指标标准化处理方法为:式中:和分别表示所有P个采集终端供应商中指标j的最小值和最大值;Ω1表示效益型指标集合,其中Ω1={1,2,3,8};Ω2表示成本型指标集合,其中Ω2={4,5,6,7}。作为优选技术手段:在步骤3)中,分别采用层次分析法、熵权法、相关系数法和变异系数法计算采集终端指标权重,接着用指标的组合优化模型计算组合权重,其中:层次分析法为:设Q个指标为U={u1,u2,…,uQ},每次取两个指标ui和uj,按1~9的比例用aij表示指标ui与uj对采集终端的影响程度之比,数值越大表示ui相对于uj越重要;这样即可获得一个采集终端评估问题的判断矩阵A=(aij)Q×Q,该判断矩阵具有如下性质:aij>0,aji=1/aij,(i=1,2,…,Q;j=1,2,…,Q);计算指标权重前首先对判断矩阵A进行一致性检验,如果一致性检验未通过,则说明aij取值前后矛盾,需要重新赋值;如果通过,则说明aij取值前后一致,判断矩阵A可用于求取指标权重;求取指标权重可以用列和求逆法,即:将bj归一化,即可求得归一化后的指标权重为式中:且采集终端指标的熵权为:式中:κ表示常数κ=1/lnP,并且假定fij=0时,fijlnfij=0;且计算皮尔逊相关系数权重包括:假设d′x=(d′1x,d′2x,...,d′Px)T和dy′=(d′1y,d′2y,...,d′Py)T表示标准化决策矩阵D′的两个列向量,则第x个指标和第y个指标之间的皮尔逊相关系数定义为式中:和分别是向量dx′和dy′的平均值;基于皮尔逊相关系数的权重定义为式中:且计算变异系数法权重包括:指标uj的变异系数定义为:式中:表示向量(d′1j,d′2j,...,d′Pj)T的平均值;基于变异系数法的指标权重定义为:式中:且指标权重的组合优化模型为:式中:表示待优化的第j个采集终端指标的组合权重,表示采用第k种方法求解得到的第j个指标的权重,G表示权重确定方法的数目,表示的隶属度函数;显然,越大,权重与最终的组合权重越贴近。作为优选技术手段:在步骤4)用夹角度量法对采集终端的质量进行综合评估时,包括步骤:405)形成P个待评估的供应商对应的Q个质量指标的评估矩阵R=(rij)P×Q式中:406)计算采集终端评估中的理想点和负理想点,其分别为式中:407)分别计算每个供应商下的采集终端指标与理想点、负理想点的夹角距离,即式中:ri=(ri1,ri2,...,riQ)表示评估矩阵R的第i个行向量;408)计算每个供应商下的采集终端指标与理本文档来自技高网...

【技术保护点】
1.基于计量大数据聚类模型的采集终端生产厂商评价方法,其特征在于,包括如下步骤:1)获取每个批次和区域中采集终端的原始数据,筛选获取衡量采集终端的评估指标,评估指标包括负荷采集合格率,电量数据采集率,无故障工作时间,反映采集异常的严重异常次数、一般异常次数、轻微异常次数,维修率和在线率;2)采用高斯混合模型聚类算法提取采集终端海量数据中的评估指标数据,获取聚类中心,形成采集终端综合评估的决策矩阵,并对其分别按效益型和成本型进行标准化处理;3)分别计算采集终端各项典型评估指标基于层次分析法、熵权法、皮尔逊相关系数法以及变异系数法的权重,然后用指标权重的组合优化模型获得组合权重,对决策矩阵进行加权处理从而获得采集终端综合评估的评估矩阵;4)根据评估矩阵,用夹角度量法对采集终端的质量进行综合评估,按照从高至低的顺序将各个采集终端供应商的质量进行优劣排序,获得评价结果。

【技术特征摘要】
1.基于计量大数据聚类模型的采集终端生产厂商评价方法,其特征在于,包括如下步骤:1)获取每个批次和区域中采集终端的原始数据,筛选获取衡量采集终端的评估指标,评估指标包括负荷采集合格率,电量数据采集率,无故障工作时间,反映采集异常的严重异常次数、一般异常次数、轻微异常次数,维修率和在线率;2)采用高斯混合模型聚类算法提取采集终端海量数据中的评估指标数据,获取聚类中心,形成采集终端综合评估的决策矩阵,并对其分别按效益型和成本型进行标准化处理;3)分别计算采集终端各项典型评估指标基于层次分析法、熵权法、皮尔逊相关系数法以及变异系数法的权重,然后用指标权重的组合优化模型获得组合权重,对决策矩阵进行加权处理从而获得采集终端综合评估的评估矩阵;4)根据评估矩阵,用夹角度量法对采集终端的质量进行综合评估,按照从高至低的顺序将各个采集终端供应商的质量进行优劣排序,获得评价结果。2.根据权利要求1所述的基于计量大数据聚类模型的采集终端生产厂商评价方法,其特征在于,在步骤1中,采用8个衡量采集终端的评估指标,分别为:负荷采集合格率α1,电量数据采集率α2,无故障工作时间α3,反映采集异常的严重异常次数α4、一般异常次数α5、轻微异常次数α6,维修率α7和在线率α8:式中:Nsamp是采样时间段的总个数,Tsamp,i是第i次采样的时间长度,即总采样时间;Mi、mi、Ci、ci、bi和Bi分别是第i个采样时间段内采集终端负荷数据总个数、负荷数据合格的个数、理论应采集的数据量、实际采集的数据量、在线的采集终端个数和采集终端总个数;Fser,i、Fgen,i、Fun,i分别是第i个采样时间段内采集终端发生严重、一般和轻微故障的次数;Nsamp,F是首次出现Fser,i+Fgen,i+Fun,i≠0的采样时间段;Trate和TF分别是采集终端的额定运行时间和故障停运时间。3.根据权利要求1的基于计量大数据聚类模型的采集终端生产厂商评价方法,其特征在于,在步骤2)高斯混合模型聚类算法中:假设GMM由K个高斯分布混合而成,则每个高斯分布称作一个“组分”,这些“组分”线性相加即为GMM的概率密度函数:式中:ωk表示第k个多维单高斯分布的权值,Nk(x;μk;Σk)表示第k个多维单高斯分布的概率密度函数,x表示数据样本列向量,μk表示第k个高斯模型的期望向量,Σk表示第k个高斯模型的方差;采集终端数据的GMM聚类算法流程为:201)令l=0,随机选择初始化的ω(l),μ(l),Σ(l),求取第i个样本点xi属于第k类高斯模型的初始化后验概率:202)将第201)步得到的结果代入最大似然公式计算第l+1次迭代的GMM聚类参数:式中:N为待聚类的数据点个数;203)若成立(ε一般取10-5),则迭代结束,即为估计得到的GMM聚类参数,继续下一步;否则,回到第202)步;204)采用贝叶斯概率公式计算第i个样本点xi属于第k类高斯模型的概率:根据贝叶斯概率最大准则,将第i个样本点xi划分到使其概率p(μk,Σk|xi)取得最大的那类高斯模型中。4.根据权利要求1的基于计量大数据聚类模型的采集终端生产厂商评价方法,其...

【专利技术属性】
技术研发人员:翟峰梁晓兵曹永峰付义伦李保丰刘海港李熊王伟峰贾杰
申请(专利权)人:国网浙江省电力有限公司中国电力科学研究院有限公司浙江华云信息科技有限公司国家电网有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1