一种基于支持向量机的高铁电能质量数据的分类方法技术

技术编号:9718813 阅读:159 留言:0更新日期:2014-02-27 05:35
本发明专利技术涉及一种基于支持向量机(SVM)的高速铁路电能质量数据的分类方法,包括如下步骤:(1)将高铁电能质量监测数据进行预处理后作为训练和测试样本集;(2)进行支持向量机训练;(3)基于支持向量机的回归特征消去法(SVM_RFE)进行高铁负荷电能质量的特征选择;(4)综合分类正确率和特征子集的个数对特征子集进行优劣评估,确定最优的特征子集;(5)利用最优特征子集训练支持向量机SVM;(6)利用最终的支持向量机模型对高铁电能质量的样本数据进行识别,获得高铁电能质量数据的分类。该发明专利技术从海量监测数据中提取高铁运行时的数据,并能选择出能反映高铁运行时的电能质量特征,为电能质量数据的挖掘分类提供了一种思路和方法。

【技术实现步骤摘要】
一种基于支持向量机的高铁电能质量数据的分类方法
本专利技术涉及电能质量数据分类方法,具体涉及一种基于支持向量机的高铁电能质量数据的分类方法。
技术介绍
随着以特高压电网为骨干网架、各级电网协调发展的坚强智能电网建设加快,电网中产生电能质量扰动的因素不断增加,使得电网所遭受的电能质量问题也日趋严重。为加强电网电能质量管理,我国部分省(市)电力公司如上海、江苏、福建、山西、辽宁、江西、河南、湖南等先后建立了全省(市)的电能质量监测系统,部分省公司也建立了省内的多个地市级电能质量监测系统。目前各省(市)电能质量监测系统基本达到了电能质量基本数据采集、报表生成等功能,但在电能质量信息挖掘方面,还缺乏高级分析技术,致使采集到的海量电能质量监测数据得不到充分利用,造成了严重的数据浪费。针对这种情况,亟需开展电能质量数据挖掘技术,从电能质量数据中提取有用的信息,从而使电能质量监测系统更好地服务于电网规划、运行和检修等。然而,电能质量监测数据是一种多维海量数据集,其包括有效值数据和波形数据,并且包括电压偏差、频率偏差、谐波、间谐波、电压波动与闪变、三相不平衡度、电压暂升、电压暂降和电压短时中断等多种指标,使得电能质量监测数据挖掘面临巨大挑战。目前,数据挖掘在电能质量分析中尚处于初级阶段。针对电能质量的扰动识别分类问题的研究比较多,实用性比较强。而针对干扰源特性分析,从海量监测数据中提取干扰源运行时的数据并根据监测数据特征判断干扰源类型识别的研究还较少。
技术实现思路
针对现有技术的不足,本专利技术的目的是提供一种基于支持向量机的高铁电能质量数据的分类方法,基于支持向量机的回归特征消去法(SVM-RFE)进行高铁负荷的电能质量特征识别方法,进行高铁负荷电能质量的特征选择,利用最优的特征子集训练支持向量机,最后完成对有无高铁负荷运行的电能质量数据分类。该专利技术从海量监测数据中提取高铁运行时的数据,并能选择出反映高铁运行时的电能质量特征,为电能质量数据的挖掘分类提供了一种思路和方法。本专利技术的目的是采用下述技术方案实现的:本专利技术提供一种基于支持向量机的高铁电能质量数据的分类方法,其改进之处在于,所述方法包括下述步骤:(1)通过在线的电能质量监测仪获取高铁电能质量监测数据,进行预处理后作为训练样本集;(2)利用训练样本集训练支持向量机SVM,获得SVM模型、训练样本集及测试样本集的分类正确率;(3)基于支持向量机的回归特征消去法进行高铁负荷电能质量的特征选择;(4)综合分类正确率和特征子集的个数对特征子集进行优劣评估,确定最优特征子集;(5)利用最优特征子集训练支持向量机SVM,获得最终的支持向量机模型;(6)利用最终的支持向量机模型对高铁电能质量的样本数据进行识别,获得高铁电能质量数据的分类。进一步地,所述步骤(1)中,高铁电能质量监测数据包括电压偏差、电流有效值、频率偏差、有功功率、无功功率,视在功率、电量、谐波、间谐波、电压波动与闪变、三相不平衡度、电压暂升、电压暂降和电压短时中断;所述谐波为0-50次的谐波。进一步地,所述步骤(1)中,预处理包括:①将每3秒采样的高铁电能质量监测数据,每20个采样数据进行平均处理,转化为每分钟1个样本数据x′i;②将样本数据按照每个特征进行归一化处理。假设x′i=(x′i,1,x′i,2,...,x′i,m)是第i个原始数据样本,有m个特征,其中x′i,j为第i个样本的第j个特征的值;归一化的表达式如下:<1>;其中,N表示共有N个样本数据,x'max和x'min分别为第j个特征的数据向量的最大值和最小值;x'mid为最大值和最小值的平均值;xi,j为归一化后的值;则归一化后的第i个数据样本为xi=(xi,1,xi,2,...,xi,m)。进一步地,所述步骤(1)中,所述训练样本集是将样本数据xi和高铁运行状态yi=[+1,-1]相对应,即将有高铁运行状态的电能质量数据样本判为标识“+1”的类别;将其余数据样本判为标识“-1”的类别,最终形成归一化后的样本集为n为样本数量。进一步地,所述步骤(2)中,所述支持向量机SVM,是一个二分模式的分类器;建立支持向量机SVM模型指的是寻找最优分类面,其表达式如下:<2>;其中:K(x,xi)为核函数,xi为支持向量,为支持向量机的权值系数,b*为偏移系数。进一步地,所述步骤(3)中,基于支持向量机的回归特征消去法进行高铁负荷电能质量的特征选择包括下述步骤:a、根据支持向量机SVM模型中的最优分类面即表达式(2)中的支持向量及权值系数制定特征排序准则,计算训练样本特征子集中每个特征在该准则下的排序准则分数;b、对特征的排序准则分数按从大到小顺序对其对应的特征进行排序,选择排在前面的特征,并消除掉排在最后的1个特征,形成新的特征子集;c、根据新的特征子集更新训练样本集;d、使用更新后的训练样本集,返回步骤(2)重新训练支持向量机;e、重复迭代步骤(a)-(d),直到特征子集中剩余最后一个特征时结束。进一步地,所述步骤(a)中,根据支持向量机SVM模型中的信息来制定特征排序准则,是依据各特征对分类的贡献来定义排序准则;其排序准则如下:对于线性支持向量机SVM,第i个特征的排序准则分数定义为DJ(i)=(wi)2,其中对于非线性支持向量机SVM,第i个特征的排序准则分数定义为其中,a是列向量,其元素为H是一个矩阵,其元素为yiyjK(xi,xj);H(-i)为消去第i个特征后的矩阵。进一步地,所述步骤(4)中,选择分类正确率最大的特征子集作为最优的特征子集;若特征子集对应的分类正确率相同或相近,则取维数最小的特征子集作为最优的特征子集。进一步地,所述步骤(6)中,高铁电能质量的样本数据是指将高铁的电能质量数据按照最优的特征子集进行组合归一化后的数据,组合归一化后的数据作为样本数据输入最终的支持向量机模型。与现有技术比,本专利技术达到的有益效果是:1、本专利技术能够从包含上百个特征指标的电能质量数据中,获取最能反映高铁负荷运行特点的电能质量特征集,同时也提高了有无高铁负荷运行的电能质量数据的分类精度。2、本专利技术从海量监测数据中提取高铁运行时的数据,并能选择出能反映高铁运行时的电能质量特征,本专利技术所提方法可用于其他负荷的电能质量特性分析,为电能质量数据的挖掘分类提供了一种思路和方法。附图说明图1是本专利技术提供的高铁负荷电能质量数据分类的流程图;图2是本专利技术提供的基于回归特征消去法SVM_RFE进行高铁负荷电能质量的特征选择的流程图;图3是本专利技术提供的针对高铁电能质量进行特征选择和分类预测的结果图。具体实施方式下面结合附图对本专利技术的具体实施方式作进一步的详细说明。本专利技术提供一种基于支持向量机的高铁电能质量数据的分类方法,其流本文档来自技高网...
一种基于支持向量机的高铁电能质量数据的分类方法

【技术保护点】
一种基于支持向量机的高铁电能质量数据的分类方法,其特征在于,所述方法包括下述步骤:(1)通过在线的电能质量监测仪获取高铁电能质量监测数据,进行预处理后作为训练样本集;(2)利用训练样本集训练支持向量机SVM,获得SVM模型、训练样本集及测试样本集的分类正确率;(3)基于支持向量机的回归特征消去法进行高铁负荷电能质量的特征选择;(4)综合分类正确率和特征子集的个数对特征子集进行优劣评估,确定最优特征子集;(5)利用最优特征子集训练支持向量机SVM,获得最终的支持向量机模型;(6)利用最终的支持向量机模型对高铁电能质量的样本数据进行识别,获得高铁电能质量数据的分类。

【技术特征摘要】
1.一种基于支持向量机的高铁电能质量数据的分类方法,其特征在于,所述方法包括下述步骤:(1)通过在线的电能质量监测仪获取高铁电能质量监测数据,进行预处理后作为训练样本集;所述步骤(1)中,预处理包括:①将每3秒采样的高铁电能质量监测数据,每20个采样数据进行平均处理,转化为每分钟1个样本数据;②将样本数据按照每个特征进行归一化处理;假设x′i=(x′i,1,x′i,2,...,x′i,m)是第i个原始数据样本,具有m个特征,x′i,j为第i个样本的第j个特征的值;归一化的表达式如下:其中,N表示共有N个样本数据,x'max和x'min分别为第j个特征的数据向量的最大值和最小值;x'mid为最大值和最小值的平均值;xi,j为归一化后的值;则归一化后的第i个数据样本为xi=(xi,1,xi,2,...,xi,m);(2)利用训练样本集训练支持向量机SVM,获得SVM模型、训练样本集及测试样本集的分类正确率;(3)基于支持向量机的回归特征消去法进行高铁负荷电能质量的特征选择;(4)综合分类正确率和特征子集的个数对特征子集进行优劣评估,确定最优特征子集;(5)利用最优特征子集训练支持向量机SVM,获得最终的支持向量机模型;(6)利用最终的支持向量机模型对高铁电能质量的样本数据进行识别,获得高铁电能质量数据的分类;所述步骤(1)中,所述训练样本集是将样本数据xi和高铁运行状态yi=[+1,-1]相对应,即将有高铁运行状态的电能质量数据样本判为标识“+1”的类别;将其余数据样本判为标识“-1”的类别,最终形成归一化后的样本集为n为样本数量;所述步骤(2)中,所述支持向量机SVM,是一个二分模式的分类器;建立支持向量机SVM模型指的是寻找最优分类面,其...

【专利技术属性】
技术研发人员:杨岑玉王同勋周胜军
申请(专利权)人:国家电网公司国网智能电网研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1