一种基于特征互相关性和概率密度的数据异常分析方法技术

技术编号:26600827 阅读:30 留言:0更新日期:2020-12-04 21:23
本发明专利技术涉及一种基于特征互相关性和概率密度的数据异常分析方法,包括:基于连续烟气监测系统CEMS采集到废气污染物数据,进行筛选和预处理后,计算每个数据特征与各个数据特征之间的互相关系数,找出存在明显相关性并且呈现正相关性的数据特征,根据找出的数据特征的相关系数值来判断数据是否异常;其余不具备明显相关性的数据特征,利用非参数估计的Parzen窗方法进行概率密度函数估计出各数据特征的概率密度,根据概率密度确定正常数据特征的区间,如果数据特征值超过区间值,则判断为异常数据。

【技术实现步骤摘要】
一种基于特征互相关性和概率密度的数据异常分析方法
本专利技术涉及环保领域中连续烟气监测系统数据异常的研究,尤其涉及到一种基于特征互相关性和概率密度的数据异常分析方法,其适用于各类生产制造业废气监测系统。
技术介绍
随着现代工业程度的快速发展,环境污染和生态破坏日益严重引起了世界各国的广泛关注。连续烟气监测系统CEMS(ContinuousEmissionMonitoringSystem,CEMS)作为一种监控设备,可以连续、实时、在线监测污染物排放总量的目标。CMES作为污染物排放监测中的重要组成部分得到了越来越多的重视。它不仅是智慧工厂的重要的研究方向,还可以在智慧城市、智能生产等智能系统中起着重要的作用。以往关于工厂生产废气监测的研究,其主要是通过建立异常数据经验判断法,依靠经验初步剔除可以的数据,并采用现场核定法,使用统计学二次判定。以往对于工厂废气数据并没有做出深入的探究;由于废气采样数据通道较多,数据较为复杂,找出其中异常数据也较为困难。基于工厂中连续烟气监测系统多路传感器采集到的工厂废气数据,在不改变原有数据和设备基础上完成对废气数本文档来自技高网...

【技术保护点】
1.一种基于特征互相关性和概率密度的数据异常分析方法,其特征在于:基于连续烟气监测系统CEMS采集到废气污染物数据,进行筛选和预处理后,计算每个数据特征与各个数据特征之间的互相关系数,找出存在明显相关性并且呈现正相关性的数据特征,根据找出的数据特征的相关系数值来判断数据是否异常;/n其余不具备明显相关性的数据特征,利用非参数估计的Parzen窗方法进行概率密度函数估计出各数据特征的概率密度,根据概率密度确定正常数据特征的区间,如果数据特征值超过区间值,则判断为异常数据。/n

【技术特征摘要】
1.一种基于特征互相关性和概率密度的数据异常分析方法,其特征在于:基于连续烟气监测系统CEMS采集到废气污染物数据,进行筛选和预处理后,计算每个数据特征与各个数据特征之间的互相关系数,找出存在明显相关性并且呈现正相关性的数据特征,根据找出的数据特征的相关系数值来判断数据是否异常;
其余不具备明显相关性的数据特征,利用非参数估计的Parzen窗方法进行概率密度函数估计出各数据特征的概率密度,根据概率密度确定正常数据特征的区间,如果数据特征值超过区间值,则判断为异常数据。


2.根据权利要求1所述的基于特征互相关性和概率密度的数据异常分析方法,其特征在于,所述筛选和预处理包括:
所述筛选为删除和过滤数据中的缺失值,所述预处理为筛选后的数据进行包括均值、方差、最小值、最大值、中位数和分位数的统计值描述。


3.根据权利要求2所述的基于特征互相关性和概率密度的数据异常分析方法,其特征在于,...

【专利技术属性】
技术研发人员:任红军朱晓然牛小民魏建华徐敏杰
申请(专利权)人:汉威科技集团股份有限公司
类型:发明
国别省市:河南;41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1