一种配电网在线数据异常检测方法技术

技术编号:12482347 阅读:66 留言:0更新日期:2015-12-10 19:24
本发明专利技术提供一种配电网在线数据异常检测方法,根据语法规范,定义配电网在线数据的语法异常规则;从配电网的检测训练集中筛选出满足检测要求的长度范围的配电网在线数据,并预处理配电网在线数据,得到配电网在线筛选数据;根据配电网在线筛选数据及用户的使用参数,生成筛选异常规则;根据语法异常规则和筛选异常规则对配电网在线数据进行异常检测,得到检测结果序列集;根据异常程度对检测结果序列集排序,得到最终检测结果。本发明专利技术提出的检测方法,能够高效率、实时且灵活地对配电网在线数据进行异常检测,进而提升了配电网在线数据质量,实现了从海量配电网在线数据中快速地找到异常数据,提高了配电网仿真计算和状态监测等工作结果的精确度。

【技术实现步骤摘要】

本专利技术涉及配电网在线数据检测领域,具体涉及一种配电网在线数据异常检测方 法。
技术介绍
配电网规模大,范围广,负担着直接为广大用户供电的任务。近年来,生产生活领 域对电力的需求逐年增长,配电网承担的负载越来越高,对供电质量的要求越来越严格。为 了对配电网的运行情况进行监控,配电网终端对电流、电压、开关位置等状态量进行了采 集,采集频率较高使得总体采集数据量级非常大。因此,对采集到的大规模配电网数据进行 异常运行状态分析成为越来越重要的问题。 现在的配电网在线数据异常检测方法主要分为三类:一是先将配电网在线数据分 成若干数据段,再在这些数据段中找出与其他数据段距离较大的数据段,这种方法简洁直 观,但检测出的异常结果的长度是固定的,同时检测结果过分依赖于对配电网在线数据的 人工划分;二是利用模式匹配的方法进行异常数据的检测,这类方法对训练集的依赖过大; 三是通过定义正常数据段的规则进行配电网在线数据的异常检测,这种方法具有良好的可 扩展性,能够适用于不同类型配电网在线数据的异常检测。 在当前的基于规则的配电网在线数据的异常检测方法中,规则是由时间段组成 的,这种组成规则的方式虽然有效,但在进行规则提取和异常子序列检测时需要用复杂的 算法(时间复杂度为〇(n 2))对被检测的配电网在线数据进行分段,影响了检测效率,也无 法对配电网数据进行实时异常检测。 因此,对于大规模配电网在线数据,需要一种新的高效、灵活的实时检测方法去解 决配电网在线数据的异常检测问题。
技术实现思路
有鉴于此,本专利技术提供的,该方法能够高效率、 实时且灵活地对配电网在线数据进行异常检测,进而提升了配电网在线数据质量,实现了 从海量配电网在线数据中快速地找到异常数据,提高了配电网仿真计算和状态监测等工作 结果的精确度。 本专利技术的目的是通过以下技术方案实现的: -种配电网在线数据异常检测方法,所述方法包括如下步骤: 步骤1.根据语法规范,定义配电网在线数据的语法异常规则; 步骤2.从所述配电网的检测训练集中筛选出满足检测要求的长度范围的配电网 在线数据,并预处理所述配电网在线数据,得到配电网在线筛选数据; 步骤3.根据所述配电网在线筛选数据及用户的使用参数,生成筛选异常规则; 步骤4.根据所述语法异常规则和筛选异常规则对所述配电网在线数据进行异常 检测,得到检测结果序列集; 步骤5.根据异常程度对所述检测结果序列集排序,得到最终检测结果。 优选的,所述步骤1中的所述语法异常规则为包括一个或多个规则元组的序列, 每个所述规则元组均对应时间序列中的一个时序点;所述规则元组的形式如下: 〈规则元组> ={〈数值下限〉,〈数值上限〉,〈方向>} 〈数值下限〉和〈数值上限〉为已定义的参数、具体的值或者表达式;〈方向〉为 up、dw、eq、ud或数值,其中,up表示下一个值比当前值大,dw表示下一个值比当前值小,eq 表示下一个值等于当前值,ud表示下一个值与当前值无关,数值表示以当前所述时序点为 起点的序列段的斜率。 优选的,所述步骤2,包括: 2-1.从所述配电网的检测训练集中筛选出满足检测要求的长度范围的配电网在 线数据; 2-2.利用SAX解析方法对筛选后的所述配电网在线数据进行符号化预处理,得到 符号序列; 2-3.提取所述符号序列中全部的出现次数不少于2次的符号子序列,及所述符号 子序列在所述符号序列中的间隔序列; 2-4.将所述符号子序列及所述间隔序列均存入集合中; 2-5.根据所述集合,建立以所述间隔序列为键值的二叉堆; 2-6.在所述二叉堆中,选取满足 length (T)〈 = length (t)*count(T, t)* Θ 的符号 序列T ; 其中,t是所述符号子序列;T是所述符号序列;count (T,t)表示t在T中出现的 次数,Iength(T)表示符号序列T的长度;length (t)表示符号子序列t的长度;Θ为用户 输入的经验参数。 优选的,所述步骤4之前,还包括: a.对所述语法异常规则和所述筛选异常规则分别进行格式分析; b.将所述语法异常规则和所述筛选异常规则中格式符合检测要求的规则放入规 则文件。 优选的,所述步骤4,包括:4-1.根据所述规则文件,进行时间序列异常模式检测, 得到检测的初始结果; 4-2.将测试时间序列分成若干序列段,并指定初始均值和标准差; 4-3.在一个所述序列段中,对于所述初始结果中的每一条规则,分别判断所有长 度与所述规则相同的子序列是否满足这条规则;若不满足,则继续对下一条规则进行判断; 若满足,则输出这个子序列为异常子序列;直到判断完所述初始结果中的全部规则; 4-4.全部的所述异常子序列组成所述检测结果序列集。 优选的,所述步骤5中的对所述检测结果序列集排序的排序原则,包括: c.所述检测结果序列集中的子序列的异常程度是该子序列中每个点的异常程度 的平均值; d.所述子序列中每个点的异常程度与该点被判定为异常的规则的数量呈正相关 的关系; e.所述子序列中每个点的异常程度与该点被判定为异常的相同规则的数量呈负 相关的关系。 优选的,所述步骤5,包括: 5-1.定义一个频率矩阵F : 其中,F中的每一个元素表示序列中的第j个点被第i条规则检测出的次数; η为子序列的总数;m为规则的总数; 5-2.得到序列点P]的分数的计算公式为:! 5-3.分别算出所述检测结果序列集中的每一条子序列的分数;所述子序列 < P1, P2,. . .,pn>的分数的计算公式为: 5-4.再按照每一条子序列的分数的降序对所述子序列进行排序,得到最终检测结 果。 从上述的技术方案可以看出,本专利技术提供了, 根据语法规范,定义配电网在线数据的语法异常规则;从配电网的检测训练集中筛选出满 足检测要求的长度范围的配电网在线数据,并预处理配电网在线数据,得到配电网在线筛 选数据;根据配电网在线筛选数据及用户的使用参数,生成筛选异常规则;根据语法异常 规则和筛选异常规则对配电网在线数据进行异常检测,得到检测结果序列集;根据异常程 度对检测结果序列集排序,得到最终检测结果。本专利技术提出的检测方法,能够高效率、实时 且灵活地对配电网在线数据进行异常检测,进而提升了配电网在线数据质量,实现了从海 量配电网在线数据中快速地找到异常数据,提高了配电网仿真计算和状态监测等工作结果 的精确度。 与最接近的现有技术比,本专利技术提供的技术方案具有以下优异效果: 1、本专利技术所提供的技术方案,能够高效率、实时且灵活地对配电网在线数据进行 异常检测,进而提升了配电网在线数据质量,实现了从海量配电网在线数据中快速地找到 异常数据,提高了配电网仿真计算和状态监测等工作结果的精确度。 2、本专利技术所提供的技术方案设计了配电网在线数据的异常检测方法,该方法充分 利用了配电网在线数据异常模式可以被人工定义,以及基于规则的时间序列异常检测高效 的特点,为配电网数据的异常检测提供了灵活的解决方案,对于提升我院在配电网大数据 智能分析领域的影响力具有积极作用。 3、本专利技术所提供的技术方案,可处理在线实时数据,在对一段配电网数据处理完 成后,会更新相关参数,并利用更新后的值处理下一段配电网数据。 4、本专利技术所本文档来自技高网...

【技术保护点】
一种配电网在线数据异常检测方法,其特征在于,所述方法包括如下步骤:步骤1.根据语法规范,定义配电网在线数据的语法异常规则;步骤2.从所述配电网的检测训练集中筛选出满足检测要求的长度范围的配电网在线数据,并预处理所述配电网在线数据,得到配电网在线筛选数据;步骤3.根据所述配电网在线筛选数据及用户的使用参数,生成筛选异常规则;步骤4.根据所述语法异常规则和筛选异常规则对所述配电网在线数据进行异常检测,得到检测结果序列集;步骤5.根据异常程度对所述检测结果序列集排序,得到最终检测结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘科研盛万兴刁赢龙唐建岗叶学顺何开元贾东梨胡丽娟
申请(专利权)人:中国电力科学研究院国家电网公司国网北京市电力公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1