基于多域特征分析与特征选择的电力数据识别方法与系统技术方案

技术编号:34107455 阅读:11 留言:0更新日期:2022-07-12 00:43
本发明专利技术提出一种基于多域特征分析与特征选择的电力数据识别方法与系统,其中方法包括步骤1、分析所监测的电力数据中的电压、电流时间序列提取功率特征、电流谐波特征以及电压

【技术实现步骤摘要】
基于多域特征分析与特征选择的电力数据识别方法与系统


[0001]本专利技术涉及电力数据识别
,尤其涉及一种基于多域特征分析与特征选择的电力数据识别方法与系统。

技术介绍

[0002]用户电力数据的监测与准确分析为需求侧的精细化管理提供数据支撑,是推进灵活互动智能用电的首要环节。因此,为实现用户电能高效利用与合理调度,加强智能电网





交互服务体系,通过对智能电表等终端设备的用电数据进行实时收集、监测、分析与管理,获得更细粒度的能耗信息,引导用户侧优化用电方式,是实施智能用电的关键技术。
[0003]目前,国内外学者对用户电力数据分析的研究主要通过非侵入式负荷监测(Non

intrusive load monitoring,NILM)技术获得详细的用电数据信息及构成,以深度挖掘其蕴含价值。在NILM研究初期,基于时序概率模型的隐马尔科夫模型(Hidden markov model,HMM)是研究的热点。现有技术中存在一些基于单一类型特征提取对电力数据识别的方法,但是这种方法存在特征重叠现象,难以适用于数据特性差异较小的应用场景,因此研究人员开始利用多特征的互补特性提高数据识别精度,但是现有技术中的面向多域特征组合的方法还存在电力数据特征挖掘不充分、算法效率低等问题,特征提取的有效性与冗余性还需进一步研究。

技术实现思路

[0004]本申请提出了一种基于多域特征分析与特征选择的电力数据识别方法与系统,以便有效解决电力数据特征挖掘不充分导致识别精度不高的问题。
[0005]为了实现上述目的,本申请提出了一种基于多域特征分析与特征选择的电力数据识别方法,包括以下步骤:
[0006]步骤1、分析所监测的电力数据中的电压、电流时间序列提取功率特征、电流谐波特征以及电压

电流轨迹特征;
[0007]步骤2、利用基于随机森林的特征重要性排序和广义序列后向选择搜索策略相结合的特征选择算法进行特征选择和降维,筛选出最优的一组特征子集;
[0008]步骤3、利用步骤2所得的特征子集对分类模型进行训练,得到优化后的分类模型;
[0009]步骤4、将未知的电力数据输入至步骤3所得到的分类模型中,进行分类。
[0010]在一些实施例中,在所述步骤1中,针对功率特征:基于对电压、电流数据做快速傅里叶变换,求取有功功率、无功功率作为功率特征,经FFT变换后的k阶频域信号U(k)、I(k)表示如下:
[0011][0012]公式(1)中U
m
(k)、I
m
(k)、U
n
(k)、I
n
(k)分别为复变量U(k)和I(k)的实部和虚部;由
此求得有功功率P和无功功率Q分别为:
[0013][0014]公式(2)中,N为一个稳态周期内电流、电压的采样点数。
[0015]在一些实施例中,在所述步骤1中,针对电流谐波特征:依据FFT变换后的k阶频域信号U(k)、I(k),对前5阶奇次谐波电流幅值I
har,k
和相位角及总谐波失真系数进行特征量化,得到公式(3)、(4):
[0016][0017][0018]上式中,I
m
,I
n
分别指复变量I的实部和虚部,G
k
为第k阶谐波分量的有效值,G1为基波分量的有效值,T
HD
为总谐波失真系数。
[0019]在一些实施例中,在所述步骤1中,针对电压

电流轨迹特征:利用电压、电流之间的耦合关系,基于其物理意义量化十个电压

电流轨迹特征,分别为:1)电流跨度;2)区域面积;3)环路方向;4)不对称性;5)平均曲线率;6)自相交交点数;7)中间线峰值;8)中间线形状;9)左右段区域;10)瞬时导纳。
[0020]在一些实施例中,所述步骤2具体包括以下步骤:
[0021]步骤21、设置全局最大分类准确率及对应的最优特征子集,将全局最大分类准确率记作MaxAcc,将对应的最优特征子集记作BestS;
[0022]步骤22、采用10折交叉验证法对随机森林识别模型用训练集进行训练评估,所述训练集与步骤1得到的所有特征形成的特征子集相对应,取10次迭代中随机森林识别模型平均分类准确率作为该特征子集的分类准确率并赋值于MaxAcc,取10次迭代中分类准确率最高一次迭代产生的特征重要性分数作为特征排序的依据;
[0023]步骤23、根据特征重要性分数排序结果,删除该特征子集中特征重要性分数最低的L个特征得到最新的特征子集作为训练集;
[0024]步骤24、重复执行步骤22

23,此时所用的训练集与最新的特征子集相对应,直到得到的特征子集中的特征数目为零;
[0025]步骤25、输出特征选择过程中的最大平均分类准确率,对应的特征子集即为最优特征子集。
[0026]在一些实施例中,在所述步骤22中,假设电力数据分为B个类别,在决策树的节点m
处所有样本中,所述样本指所述训练集中的一部分数据,样本点属于第b类的概率为p
m,b
,则概率分布的基尼指数用G
m
表示,其计算公式如式(5)所示:
[0027][0028]假设所述训练集有c个特征X1~X
c
,特征X
i
在节点m分裂前后的Gini指数变化量V
IM,im
定义如下:
[0029]V
IM,im
=G
m

G
l

G
r
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0030]其中,G
l
和G
r
为分裂后新节点的Gini指数;
[0031]假设决策树j中包含特征X
i
的节点集合为M,特征X
i
在第j棵树的重要性评分定义为:
[0032][0033]假设所述随机森林识别模型共有n棵决策树,特征X
i
在所有决策树节点分裂不纯度的平均改变量定义为:
[0034][0035]最后对于特征X
i
对所求得的重要性评分进行归一化处理,如下所示:
[0036][0037]重复上述步骤,计算步骤22的特征子集中所有特征的重要性评分。
[0038]本申请还提出了一种基于多域特征分析与特征选择的电力数据识别系统,包括:
[0039]特征提取模块,其用于分析所监测的电力数据中的电压、电流时间序列提取功率特征、电流谐波特征以及电压

电流轨迹特征;
[0040]特征选择模块,其利用基于随机森林的特征重要性排序和广义序列后向选择搜索策略相结合的特征选择本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多域特征分析与特征选择的电力数据识别方法,其特征在于:包括以下步骤:步骤1、分析所监测的电力数据中的电压、电流时间序列提取功率特征、电流谐波特征以及电压

电流轨迹特征;步骤2、利用基于随机森林的特征重要性排序和广义序列后向选择搜索策略相结合的特征选择算法进行特征选择和降维,筛选出最优的一组特征子集;步骤3、利用步骤2所得的特征子集对分类模型进行训练,得到优化后的分类模型;步骤4、将未知的电力数据输入至步骤3所得到的分类模型中,进行分类。2.根据权利要求1所述的基于多域特征分析与特征选择的电力数据识别方法,其特征在于:在所述步骤1中,针对功率特征:基于对电压、电流数据做快速傅里叶变换,求取有功功率、无功功率作为功率特征,经FFT变换后的k阶频域信号U(k)、I(k)表示如下:公式(1)中U
m
(k)、I
m
(k)、U
n
(k)、I
n
(k)分别为复变量U(k)和I(k)的实部和虚部;由此求得有功功率P和无功功率Q分别为:公式(2)中,N为一个稳态周期内电流、电压的采样点数。3.根据权利要求2所述的基于多域特征分析与特征选择的电力数据识别方法,其特征在于:在所述步骤1中,针对电流谐波特征:依据FFT变换后的k阶频域信号U(k)、I(k),对前5阶奇次谐波电流幅值I
har,k
和相位角φ
k
及总谐波失真系数进行特征量化,得到公式(3)、(4):(4):上式中,I
m
,I
n
分别指复变量I的实部和虚部,G
k
为第k阶谐波分量的有效值,G1为基波分量的有效值,T
HD
为总谐波失真系数。4.根据权利要求3所述的基于多域特征分析与特征选择的电力数据识别方法,其特征在于:在所述步骤1中,针对电压

电流轨迹特征:利用电压、电流之间的耦合关系,基于其物
理意义量化十个电压

电流轨迹特征,分别为:1)电流跨度;2)区域面积;3)环路方向;4)不对称性;5)平均曲线率;6)自相交交点数;7)中间线峰值;8)中间线形状;9)左右段区域;10)瞬时导纳。5.根据权利要求4所述的基于多域特征分析与特征选择的电力数据识别方法,其特征在于:所述步骤2具体包括以下步骤:步骤21、设置全局最大分类准确率及对应的最优特征子集,将全局最大分类准确率记作MaxAcc,将对应的最优特征子集记作BestS;步骤22、采用10折交叉验证法对随机森林识别模型用训练集进行训练评估,所述训练集与步...

【专利技术属性】
技术研发人员:卢媛顾建伟冷小洁栾卫平杨尉穆芮杨冉昕王伟荣俊兴王丽锋李柔霏张睿赵慧群张志浩黄征孙伟杰王艳红李玉文杨禹太冯逊周学军贺艳丽杜廷文陶方杰
申请(专利权)人:国网山东省电力公司威海供电公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1