The invention discloses a method for high frequency measurement data screening and data processing of full network electronic transformer, which adopts the method of combining Laida criterion and clustering analysis method to screen and eliminate abnormal data, and adopts Spark off-line parallel calculation method to screen high frequency measurement data based on high frequency measurement data. Distributed running data storage mode in HDFS is used to store the screened data. The invention effectively filters out the useless data in the high-frequency measurement data by adopting an efficient data screening algorithm, which provides a good data basis for further data analysis; adopts Spark parallel computing technology, which greatly improves the speed and effectively improves the screening efficiency of high-frequency measurement data; and adopts HDFS-based distribution for the screened high-frequency measurement data. Running data storage improves the efficiency of data storage and access.
【技术实现步骤摘要】
全网域电子式互感器高频度计量数据甄别及数据处理方法
本专利技术涉及一种全网域电子式互感器高频度计量数据甄别及数据处理方法,属于电子式电流互感器智能应用
技术介绍
2010年,为加快智能电网建设步伐,国家电网公司启动了智能变电站“四确保一争取”工程,江苏西泾220kV变电站、四川永昌110kV变电站、延安750kV变电站等智能变电站,在国内首次全站均采用电子式互感器。2016年,国网公司计划在3年内建成投运新一代智能变电站500座,智能变电站建设进一步加快,电子式互感器逐步进入大规模应用阶段。电子式互感器的采样频率高达4kHz,每一个合并单元每天约产生86GB的数据,按照典型220kV智能变电站20个间隔计算,每天约1.7TB数据,每年约有620TB数据,以现有的智能变电站实际情况而言,将这些数据进行采集、存储的成本高、难度大,因此需要一种有效的数据甄别及数据处理方法对全网域电子式互感器大数据进行前期处理,以提高数据分析效率,同时降低系统的运行维护成本。
技术实现思路
本专利技术的目的,在于提供一种全网域电子式互感器高频度计量数据甄别及数据处理方法,通过提出高频度计量数据甄别及数据方法,有效的提高全网域电子式互感器高频度计量数据的预处理效率,从而为之后的计量数据分析奠定数据基础。为了达成上述目的,本专利技术的解决方案是:一种全网域电子式互感器高频度计量数据甄别及数据处理方法,其特征是,包括以下步骤:步骤1:采用拉伊达准则与聚类分析方法融合的方式进行高频度计量数据甄别,对异常数据进行筛选和剔除;步骤2:基于高频度计量数据,采用Spark离线并行计算方式进 ...
【技术保护点】
1.一种全网域电子式互感器高频度计量数据甄别及数据处理方法,其特征是,包括以下步骤:步骤1:采用拉伊达准则与聚类分析方法融合的方式进行高频度计量数据甄别,对异常数据进行筛选和剔除;步骤2:基于高频度计量数据,采用Spark离线并行计算方式进行高频度计量数据的甄别;步骤3:采用基于HDFS的分布式运行数据存储方式对甄别后的数据进行存储。
【技术特征摘要】
1.一种全网域电子式互感器高频度计量数据甄别及数据处理方法,其特征是,包括以下步骤:步骤1:采用拉伊达准则与聚类分析方法融合的方式进行高频度计量数据甄别,对异常数据进行筛选和剔除;步骤2:基于高频度计量数据,采用Spark离线并行计算方式进行高频度计量数据的甄别;步骤3:采用基于HDFS的分布式运行数据存储方式对甄别后的数据进行存储。2.根据权利要求1所述的全网域电子式互感器高频度计量数据甄别及数据处理方法,其特征是,步骤1中,包括以下步骤:步骤11,采用拉伊达准则进行异常数据的筛选和剔除;步骤12,再使用基于聚类分析的方法对数据进行再次甄别,通过检查数据对象的主要特征和对其进行聚类分析来确定离群点。3.根据权利要求2所述的全网域电子式互感器高频度计量数据甄别及数据处理方法,其特征是,步骤11具体为:在相同条件下获得一系列测量数据x1,x2.....xn,其算术平均值为其中,n为数据个数;按贝塞尔公式计算出实验标准差s:若某个可疑值xd与n个数据的算术平均值之差的绝对值大于等于3s时,判定为异常值,即:4.根据权利要求3所述的全网域电子式互感器高频度计量数据甄别及数据处理方法,其特征是,步骤12具体为:首先对第i个数据对象ai,1≤i≤n的m个属性赋值量化为pit,1≤t≤m,采用欧氏距离法计算任意两个数据对象ai和aj之间的相异度表示为根据相异度大小把n个数据进行聚成k个类,其中包括数据点最少的集合Ai中包含的数据点即为离群点。5.根据权利要求1所述的全网域电子式互感器高频度计量数据甄别及数据处理方法,其特征是,步骤2中,包括以下步骤:步骤21...
【专利技术属性】
技术研发人员:寇英刚,范洁,陈刚,杨世海,李志新,卢树峰,徐敏锐,陈文广,陈飞,陆子刚,吴桥,黄道,程含渺,陈晶,李志立,
申请(专利权)人:国网江苏省电力有限公司电力科学研究院,国家电网有限公司,国网江苏省电力有限公司,福建亿榕信息技术有限公司,江苏省电力试验研究院有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。