一种基于特征相关性分区回归的电力调度监控数据异常检测方法技术

技术编号:30634648 阅读:30 留言:0更新日期:2021-11-04 00:17
本发明专利技术实施例提出了一种基于特征相关性分区回归的电力调度监控数据异常检测方法,包括:将电力调度监控历史数据划分为训练集和测试集,基于皮尔逊相关系数计算训练集特征间的相关系数矩阵;根据计算所得相关系数矩阵对训练集进行特征子空间的划分;根据特征子空间内特征相关程度的高低选择特征作为伪标签,剩余特征作为预测属性,基于支持向量回归SVR训练用于预测伪标签的回归模型;对测试集进行与训练集相同的特征子空间划分,并使用对应的回归模型计算各特征子空间中测试集样本的异常程度;根据特征子空间内相关程度计算所对应的权重;根据加权后集成的最终异常分数获得测试集样本的检测结果。样本的检测结果。样本的检测结果。

【技术实现步骤摘要】
一种基于特征相关性分区回归的电力调度监控数据异常检测方法


[0001]本专利技术涉及电力调度监控数据异常检测方法,尤其涉及一种基于特征相关性分区回归的电力调度监控数据异常检测方法。

技术介绍

[0002]智能电网是以物理电网为基础,将现代先进的传感测量技术、通讯技术、信息技术、计算机技术和控制技术与物理电网高度集成而形成的新型电网,其包含发电、输电、变电、配电、用电和调度环节。而智能电网调度控制中心作为电网运行控制的指挥中枢,它的稳定性直接影响着所提供服务的稳定性,控制中心系统的崩溃会给管理者以及使用者造成较大的损失。而人工智能在电力系统领域的广泛应用,不仅能有效提升电力系统的工作效率,同时也能够保证电力系统运行过程中的安全。由于监控系统在电网运行时会在短时间内产生大量监控数据,较难通过咨询专家等方式人工为这些数据全部标定正、异常标签。因此,这些存储的历史电网调度监控数据往往缺少准确的标签信息。同时由于电网系统本身的鲁棒性,监控系统能够采集到的异常数据数量远少于正常数据。所以,不需要数据标签的无监督异常检测方法逐渐成为了解决该领域内问题本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于特征相关性分区回归的电力调度监控数据异常检测方法,其特征在于,包括如下步骤:(1)计算特征间相关性,具体为:随机选取全部电力监控历史数据中的部分历史数据作为训练集S,其余的历史数据作为测试集T;电力调度监控历史数据为电力调度监控系统采集到的与电力调度系统业务相关的进程实时资源占用数据,其特征属性包括进程CPU占用率、内存占用率、磁盘IO、网络IO、线程个数、网络连接数;数据集中样本的特征维度为N,基于训练集S的样本特征计算对应的皮尔逊相关系数矩阵C:应的皮尔逊相关系数矩阵C:其中,x
a
,x
b
分别为训练集S中的样本在第a,b维特征属性下的值,ρ
ab
为x
a
,x
b
间的相关系数,a,b∈1,2,...,N且a≠b;Cov(x
a
,x
b
)是x
a
与x
b
之间的协方差,Var()则是各自对应的方差,ρ
ab
=ρ
ba
;(2)划分特征子空间,具体为:根据训练集S中样本的特征维度N,确定需要划分的特征子空间数量k,设第i个特征子空间S
i
包含的特征数量为n
i
,则:k=int(α
×
N)+1其中,i=1,2,

,k,int()为向下取整,特征子空间的划分系数α=0.2,用以控制特征子空间中特征维数的高低;设S'为一个特征空间,其初始值为整个训练集S;在每次循环中,根据步骤(1)中计算所得皮尔逊相关系数矩阵C获得在特征空间S'中相关系数最高的特征并提取出与相关性排名靠前的j维特征性排名靠前的j维特征以及均为l
×
1的向量,均包含训练集S所有样本在对应维度特征属性下的值,l为训练集S中的样本数量;令将x
i
与作为组成第i个特征子空间S
i
的特征维度,并在更新特征空间S'

S'

S
i
之后继续进行上述循环,循环终止条件为S'=φ,φ代表空集;完成全部k个特征子空间的划分;(3)训练特征子空间回归模型,具体为:将步骤(2)中所得的特征子空间S
i
中对应的作为伪标签,剩余特征
作为预测属性,并基于支持向量回归SVR算法训练用于预测伪标签的回归模型f
i
(x
i
),经过训练后获得模型的一般形式如下所示:f
i
(x
i
)=w

【专利技术属性】
技术研发人员:高欣刘治宇李康生贾欣薛冰傅世元黄旭黄子健
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1