一种基于可变阈值的油色谱在线监测数据异常值检测方法技术

技术编号:16300698 阅读:91 留言:0更新日期:2017-09-26 18:43
本发明专利技术公开了一种基于可变阈值的油色谱在线监测数据异常值检测方法,包括以下步骤:开始采集油色谱在线监测数据;采集到初始2个数据后,计算动态阈值δ(2);根据动态阈值更新机制得到动态阈值δ(3);传感器捕获到第i个数据obj(i),计算异常因子OF(i),然后判断第i个数据所处的状态,若第i个数据处于异常态,判定obj(i)是一个异常值,其中i>2;根据动态阈值更新机制得到动态阈值δ(i+1);重复最后两个步骤直到传感器停止采集数据。本发明专利技术在无需训练集的条件下,实现了油色谱在线监测数据的实时异常值检测,该方法在保持较高检测精度的同时,维持了较低的误报率。

An outlier detection method for oil chromatographic online monitoring data based on variable threshold

The invention discloses a method of outlier detection on-line monitoring data of variable threshold based on oil chromatogram, which comprises the following steps: start collecting data online monitoring of the oil chromatography; collected 2 initial data, the calculation of dynamic threshold Delta (2); according to the dynamic threshold update mechanism to dynamic threshold Delta (3); sensor capture the I data obj (I), to calculate the abnormal factor OF (I), and then determine the I of the state of the data, if the data is abnormal I, decision obj (I) is an abnormal value, including i> 2; according to the dynamic threshold updating mechanism of dynamic threshold. (i+1); repeat the last two steps until the sensor to stop collecting data. The invention realizes the real-time abnormal value detection of the on-line monitoring data of oil chromatography without the need of a training set, and maintains low detection accuracy while maintaining a low false positive rate.

【技术实现步骤摘要】
一种基于可变阈值的油色谱在线监测数据异常值检测方法
本专利技术涉及油色谱在线监测
,更具体地说,涉及一种基于可变阈值的油色谱在线监测数据异常值检测方法。
技术介绍
油色谱在线监测设备能及时有效地监测变压器的运行状况,发现和跟踪潜在的故障,目前已经广泛应用于110kV及以上电压等级的智能变电站。但由于油色谱在线监测易受环境温度、湿度和监测设备自身误差等因素的影响,在线数据存在失真,在分析和诊断前需要进行数据异常值检测和校正。支持向量机的异常值检测方法需要每隔一段时间采集到足够多的数据后才能对收集的数据进行检测,不是一种实时的检测方法;朴素贝叶斯分类器检测方法实现了实时检测,但事先需要一个训练集来学习分类器参数,大多数情况下一个好的训练集难以获得;主成分回归分析能有效地去除噪声数据,但事先需要一个训练集来计算主元,且复杂度较高;神经网络算法拟合效果好,但数据量大时,训练时间长,存在“过学习”的问题。
技术实现思路
本专利技术要解决的技术问题在于,提供一种基于可变阈值的油色谱在线监测数据异常值检测方法。本专利技术解决其技术问题所采用的技术方案是:构造一种基于可变阈值的油色谱在线监测数据异常值检测方法,包括以下步骤:步骤S010,开始采集油色谱在线监测数据,色谱数据为{obj(1),obj(2),obj(3),…,obj(k),…},其中k=1,2,3,…,代表一系列等间隔的时刻;步骤S020,采集到初始2个油色谱数据obj(1)和obj(2)后,假设obj(1)和obj(2)为正常态,令数据点obj(1)的动态阈值δ(1)=obj(1),则数据点obj(2)的动态阈值δ(2)=NHD(2)=|obj(2)-obj(1)|;步骤S030,根据动态阈值更新机制得到数据点obj(3)的动态阈值δ(3);步骤S040,传感器捕在t时刻捕获第i个数据obj(i),计算数据点obj(i)的跳距离以及异常因子其中,obj(j)为t时刻之前捕获的数据之中已被检测为正常且在时间上距离obj(i)最近的数据点,δ(i)为数据点obj(i)对应的动态阈值,然后判断第i个数据obj(i)所处的状态,如果第i个数据处于异常态,判定数据obj(i)是一个异常值,其中i>2,j<i;步骤S050,根据动态阈值更新机制得到下一个数据点obj(i+1)的动态阈值δ(i+1);(6)重复步骤S040和步骤S050直到传感器停止采集数据。在上述步骤S040中,第i个数据obj(i)所处的状态的判断方法如下:若数据点obj(i)的异常因子OF(i)∈[0,1],则为正常态;若数据点obj(i)的异常因子OF(i)∈(1,trustvalue],则为临界态;若数据点obj(i)的异常因子OF(i)∈(trustvalue,+∞],则为异常态;其中,trustvalue是一个大于1的参数。在上述步骤S030和步骤S050中,动态阈值更新机制为:(1)数据obj(i-1)处于正常态,数据obj(i)处于临界态,新动态阈值δ(i+1)在阈值δ(i)的基础上增大;(2)数据obj(i-1)处于正常态,数据obj(i)处于异常态,新动态阈值δ(i+1)保持不变;(3)数据obj(i-1)处于临界态,数据obj(i)处于异常态,新阈值δ(i+1)在阈值δ(i)的基础上增大;(4)数据obj(i-1)处于临界态,数据obj(i)处于正常态,新动态阈值δ(i+1)保持不变;(5)数据obj(i-1)处于异常态,数据obj(i)处于临界态,新动态阈值δ(i+1)保持不变;(6)数据数据obj(i-1)处于异常态,数据obj(i)处于正常态,新阈值δ(i+1)在阈值δ(i)的基础上减小;(7)数据obj(i-1)处于正常态,数据obj(i)处于正常态,新阈值δ(i+1)在阈值δ(i)的基础上减小;(8)数据obj(i-1)处于异常态,数据obj(i)处于异常态,新阈值δ(i+1)在阈值δ(i)的基础上增大;(9)数据obj(i-1)处于临界态,数据obj(i)处于临界态,新阈值δ(i+1)等于NHD(i)。在上述动态阈值更新机制中,新动态阈值δ(i+1)在阈值δ(i)的基础上增大即δ(i+1)=2*δ(i),新阈值δ(i+1)在阈值δ(i)的基础上减小即δ(i+1)=δ(i)/2。实施本专利技术一种基于可变阈值的油色谱在线监测数据异常值检测方法,具有以下有益效果:本专利技术在无需训练集的条件下,实现了油色谱在线监测数据的实时异常值检测,该方法在保持较高检测精度的同时,维持了较低的误报率。附图说明下面将结合附图及实施例对本专利技术作进一步说明,附图中:图1为本专利技术一种基于可变阈值的油色谱在线监测数据异常值检测方法的流程示意图;图2为本专利技术实施例中某一变压器某一段时间的氢气在线监测数据的检测结果示意图。具体实施方式为了对本专利技术的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本专利技术的具体实施方式。如图1所示,本专利技术提供一种基于可变阈值的油色谱在线监测数据异常值检测方法,包括以下步骤:步骤S010,开始采集油色谱在线监测数据,色谱数据为{obj(1),obj(2),obj(3),…,obj(k),…},其中k=1,2,3,…,代表一系列等间隔的时刻;步骤S020,采集到初始2个油色谱数据obj(1)和obj(2)后,假设obj(1)和obj(2)为正常态,令数据点obj(1)的动态阈值δ(1)=obj(1),则数据点obj(2)的动态阈值δ(2)=NHD(2)=|obj(2)-obj(1)|;步骤S030,根据动态阈值更新机制得到数据点obj(3)的动态阈值δ(3);步骤S040,传感器捕在t时刻捕获第i个数据obj(i),计算数据点obj(i)的跳距离以及异常因子其中,obj(j)为t时刻之前捕获的数据之中已被检测为正常且在时间上距离obj(i)最近的数据点,δ(i)为数据点obj(i)对应的动态阈值,然后判断第i个数据obj(i)所处的状态,如果第i个数据处于异常态,判定数据obj(i)是一个异常值,其中i>2,j<i;步骤S050,根据动态阈值更新机制得到下一个数据点obj(i+1)的动态阈值δ(i+1);(6)重复步骤S040和步骤S050直到传感器停止采集数据。在所述步骤S040中,第i个数据obj(i)所处的状态的判断方法如下:若数据点obj(i)的异常因子OF(i)∈[0,1],则为正常态;若数据点obj(i)的异常因子OF(i)∈(1,trustvalue],则为临界态;若数据点obj(i)的异常因子OF(i)∈(trustvalue,+∞],则为异常态;其中,trustvalue是一个大于1的参数。在所述步骤S030和步骤S050中,动态阈值更新机制为:(1)数据obj(i-1)处于正常态,数据obj(i)处于临界态,新动态阈值δ(i+1)在阈值δ(i)的基础上增大;(2)数据obj(i-1)处于正常态,数据obj(i)处于异常态,新动态阈值δ(i+1)保持不变;(3)数据obj(i-1)处于临界态,数据obj(i)处于异常态,新阈值δ(i+1)在阈值δ(i)的基础上增大;(4)数据obj(i-1)处于临界态,数据obj(i)处于正常态,新动态本文档来自技高网...
一种基于可变阈值的油色谱在线监测数据异常值检测方法

【技术保护点】
一种基于可变阈值的油色谱在线监测数据异常值检测方法,其特征在于,包括以下步骤:步骤S010,开始采集油色谱在线监测数据,色谱数据为{obj(1),obj(2),obj(3),…,obj(k),…},其中k=1,2,3,…,代表一系列等间隔的时刻;步骤S020,采集到初始2个油色谱数据obj(1)和obj(2)后,假设obj(1)和obj(2)为正常态,令数据点obj(1)的动态阈值δ(1)=obj(1),则数据点obj(2)的动态阈值δ(2)=NHD(2)=|obj(2)‑obj(1)|;步骤S030,根据动态阈值更新机制得到数据点obj(3)的动态阈值δ(3);步骤S040,传感器捕在t时刻捕获第i个数据obj(i),计算数据点obj(i)的跳距离

【技术特征摘要】
1.一种基于可变阈值的油色谱在线监测数据异常值检测方法,其特征在于,包括以下步骤:步骤S010,开始采集油色谱在线监测数据,色谱数据为{obj(1),obj(2),obj(3),…,obj(k),…},其中k=1,2,3,…,代表一系列等间隔的时刻;步骤S020,采集到初始2个油色谱数据obj(1)和obj(2)后,假设obj(1)和obj(2)为正常态,令数据点obj(1)的动态阈值δ(1)=obj(1),则数据点obj(2)的动态阈值δ(2)=NHD(2)=|obj(2)-obj(1)|;步骤S030,根据动态阈值更新机制得到数据点obj(3)的动态阈值δ(3);步骤S040,传感器捕在t时刻捕获第i个数据obj(i),计算数据点obj(i)的跳距离以及异常因子其中,obj(j)为t时刻之前捕获的数据之中已被检测为正常且在时间上距离obj(i)最近的数据点,δ(i)为数据点obj(i)对应的动态阈值,然后判断第i个数据obj(i)所处的状态,如果第i个数据处于异常态,判定数据obj(i)是一个异常值,其中i>2,j<i;步骤S050,根据动态阈值更新机制得到下一个数据点obj(i+1)的动态阈值δ(i+1);(6)重复步骤S040和步骤S050直到传感器停止采集数据。2.根据权利要求1所述的一种基于可变阈值的油色谱在线监测数据异常值检测方法,其特征在于,在所述步骤S040中,第i个数据obj(i)所处的状态的判断方法如下:若数据点obj(i)的异常因子OF(i)∈[0,1],则为正常态;若数据点obj(i)的异常因子OF(i)∈(1,trustvalue],则为临界态;若数据点obj(i)的异常因子OF(i)∈(tru...

【专利技术属性】
技术研发人员:周正钦周盟谷凯凯许晓路徐进霞聂徳鑫陈敏维梁宏池毛光辉
申请(专利权)人:国家电网公司国网甘肃省电力公司国网福建省电力有限公司国网电力科学研究院武汉南瑞有限责任公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1