一种基于DFS和SVM特征选择的短期负荷预测方法及系统技术方案

技术编号:20364609 阅读:35 留言:0更新日期:2019-02-16 17:18
本发明专利技术涉及一种基于DFS和SVM特征选择的短期负荷预测方法及系统,所述方法包括:根据影响短期负荷预测的特征的F‑score值获取特征子集,根据特征子集所对应的SVM分类模型的分类正确率确定最优特征子集,利用所述最优特征子集中特征所对应的历史数据训练短期负荷预测模型,并利用该短期负荷预测模型预测预测日负荷值;本发明专利技术实现了输入数据的有效降维,综合考虑全局搜索能力以及局部搜索能力,实现了对神经网络权值和阈值的优化,避免陷入局部最优,提高了负荷预测的精度。

【技术实现步骤摘要】
一种基于DFS和SVM特征选择的短期负荷预测方法及系统
本专利技术涉及电力工程
,具体涉及一种基于DFS和SVM特征选择的短期负荷预测方法及系统。
技术介绍
电力系统短期负荷预测关系到电力系统的规划与可靠、经济运行,准确的短期负荷预测结果有助于提高系统的安全性和稳定性,能够减少发电成本。但是近年来,随着智能化、数字化、信息化电网的全面建设,电力行业数据量呈现爆发式增长态势,如何在海量的数据中挖掘出相对重要的信息就显得格外重要,因此需要一种数据挖掘方法以提高短期负荷预测的精度。根据数据来源的不同,可以将智能电网大数据分为两大类:一类是电网内部数据;另一类是外部数据。内部数据来自用电信息采集系统(CIS)、营销系统、广域监测系统(WAMS)、配电管理系统、生产管理系统(PMS)、能量管理系统(EMS)、设备检测和监测系统、客户服务系统、财务管理系统等的数据。外部数据来自电动汽车充换电管理系统、气象信息系统、地理信息系统(GIS)、公共服务部门、互联网等。这些数据分散放置在不同地方,由不同单位部门管理,具有分散放置、分布管理的特性。这些数据之间并不完全独立,其相互关联、相互影响,存在着比较复杂的关系。如气象条件和社会经济形势会影响用户的用电情况、用户用电数据影响电力市场交易情况,电力市场数据可以为相关公共服务部门决策提供依据。随着智能电网的建设,电力负荷预测理论研究得到快速发展,负荷预测方法不断涌现,回归分析法、小波分析法、模糊理论法,神经网络法、贝叶斯法等。但是就目前海量电力数据而言,现有负荷预测方法存在一定的局限性,回归分析法:只是单纯从统计意义上描述变量之间的数量关系,往往对数据量有所限制;神经网络法:在训练过程中容易出现过拟合现象,在面对多个输入变量可能会出现收敛速度慢以及陷入局部最小值等问题。对于海量数据,一方面,特征量越多获取的信息也就越多;另一方面,过多的特征会增加计算的复杂性,并且其中冗余的、不相关的甚至噪声信息会影响结果的准确性。
技术实现思路
本专利技术提供一种基于DFS和SVM特征选择的短期负荷预测方法及系统,其目的是降低数据的冗余度,提高短期负荷预测的精度。本专利技术的目的是采用下述技术方案实现的:一种基于DFS和SVM特征选择的短期负荷预测方法,其改进之处在于,所述方法包括:根据影响短期负荷预测的特征的F-score值获取特征子集;根据特征子集所对应的SVM分类模型的分类正确率确定最优特征子集;利用所述最优特征子集中特征所对应的历史数据训练短期负荷预测模型,并利用该短期负荷预测模型预测预测日负荷值。优选的,所述影响短期负荷预测的特征包括负荷特征、温度特征、天气情况特征、湿度特征、预测日日期类型特征、气压特征、风速特征及露点温度特征。优选的,所述根据影响短期负荷预测的特征的F-score值获取特征子集,包括:(1)根据所述特征的历史数据确定所述特征的F-score值;(2)建立特征子集,其中,所述特征子集初始为空集;(3)选择F-score值最大的特征不放回地加入到特征子集,输出所述特征子集;(4)返回所述步骤(3)直至所有特征都被加入到特征子集。进一步的,所述根据所述特征的历史数据确定所述特征的F-score值,包括:按下式确定第i个特征的F-score值Fi:其中,是第i个特征在第j类历史数据上的平均值,是第i个特征在整个历史数据上的平均值,是第i个特征的第j类历史数据的第k个样本值;l是历史数据的类别数,nj是第j类历史数据所含样本的个数。进一步的,历史数据的类别按照季节分为四类,每类历史数据所含样本的个数为对应季节含有的天数。优选的,所述根据特征子集所对应的SVM分类模型的分类正确率确定最优特征子集,包括:利用特征子集中特征所对应的历史数据训练SVM分类模型;测试所述SVM分类模型的分类正确率,选择SVM分类模型分类正确率最高时对应的特征子集作为最优特征子集。进一步的,所述SVM分类模型选用下述多项式核函数:K(x,x')=(x·x'+1)d其中,d为正整数,x为输入空间,即特征子集,x'表示将输入空间映射到的一个高维特征空间。优选的,所述利用所述最优特征子集中特征所对应的历史数据训练短期负荷预测模型,并利用该短期负荷预测模型预测预测日负荷值,包括:将所述最优特征子集中特征所对应的历史数据按照比例分为训练样本及测试样本;根据所述训练样本,利用改进粒子群优化的神经网络算法建立短期负荷预测模型,并利用测试样本测试所述短期负荷预测模型;将所述最优特征子集中特征所对应的预测日数据作为所述短期负荷预测模型的输入量,获取预测日负荷数据。一种基于DFS和SVM特征选择的短期负荷预测系统,其改进之处在于,所述系统包括:获取单元,用于根据影响短期负荷预测的特征的F-score值获取特征子集;确定单元,用于根据特征子集所对应的SVM分类模型的分类正确率确定最优特征子集;预测单元,用于利用所述最优特征子集中特征所对应的历史数据训练短期负荷预测模型,并利用该短期负荷预测模型预测预测日负荷值。优选的,所述影响短期负荷预测的特征包括负荷特征、温度特征、天气情况特征、湿度特征、预测日日期类型特征、气压特征、风速特征及露点温度特征。优选的,所述获取单元,包括:确定模块,用于根据所述特征的历史数据确定所述特征的F-score值;建立模块,用于建立特征子集,其中,所述特征子集初始为空集;选择模块,用于选择F-score值最大的特征不放回地加入到特征子集,输出所述特征子集;返回模块,用于返回所述选择模块直至所有特征都被加入到特征子集。进一步的,所述确定模块,用于:按下式确定第i个特征的F-score值Fi:其中,是第i个特征在第j类历史数据上的平均值,是第i个特征在整个历史数据上的平均值,是第i个特征的第j类历史数据的第k个样本值;l是历史数据的类别数,nj是第j类历史数据所含样本的个数。进一步的,历史数据的类别按照季节分为四类,每类历史数据所含样本的个数为对应季节含有的天数。优选的,所述确定单元,包括:训练模块,用于利用特征子集中特征所对应的历史数据训练SVM分类模型;第一测试模块,用于测试所述SVM分类模型的分类正确率,选择SVM分类模型分类正确率最高时对应的特征子集作为最优特征子集。进一步的,所述SVM分类模型选用下述多项式核函数:K(x,x')=(x·x'+1)d其中,d为正整数,x为输入空间,即特征子集,x'表示将输入空间映射到的一个高维特征空间。优选的,所述预测单元,包括:划分模块,用于将所述最优特征子集中特征所对应的历史数据按照比例分为训练样本及测试样本;第二测试模块,用于根据所述训练样本,利用改进粒子群优化的神经网络算法建立短期负荷预测模型,并利用测试样本测试所述短期负荷预测模型;获取模块,用于将所述最优特征子集中特征所对应的预测日数据作为所述短期负荷预测模型的输入量,获取预测日负荷数据。与最接近的现有技术相比,本专利技术提供的技术方案具有如下有益效果:本专利技术提供的技术方案,根据影响短期负荷预测的特征的F-score值获取特征子集,根据特征子集所对应的SVM分类模型的分类正确率确定最优特征子集,利用所述最优特征子集中特征所对应的历史数据训练短期负荷预测模型,并利用该短期负荷预测模型预测预测日负荷值本文档来自技高网
...

【技术保护点】
1.一种基于DFS和SVM特征选择的短期负荷预测方法,其特征在于,所述方法包括:根据影响短期负荷预测的特征的F‑score值获取特征子集;根据特征子集所对应的SVM分类模型的分类正确率确定最优特征子集;利用所述最优特征子集中特征所对应的历史数据训练短期负荷预测模型,并利用该短期负荷预测模型预测预测日负荷值。

【技术特征摘要】
1.一种基于DFS和SVM特征选择的短期负荷预测方法,其特征在于,所述方法包括:根据影响短期负荷预测的特征的F-score值获取特征子集;根据特征子集所对应的SVM分类模型的分类正确率确定最优特征子集;利用所述最优特征子集中特征所对应的历史数据训练短期负荷预测模型,并利用该短期负荷预测模型预测预测日负荷值。2.如权利要求1所述的方法,其特征在于,所述影响短期负荷预测的特征包括负荷特征、温度特征、天气情况特征、湿度特征、预测日日期类型特征、气压特征、风速特征及露点温度特征。3.如权利要求1所述的方法,其特征在于,所述根据影响短期负荷预测的特征的F-score值获取特征子集,包括:(1)根据所述特征的历史数据确定所述特征的F-score值;(2)建立特征子集,其中,所述特征子集初始为空集;(3)选择F-score值最大的特征不放回地加入到特征子集,输出所述特征子集;(4)返回所述步骤(3)直至所有特征都被加入到特征子集。4.如权利要求3所述的方法,其特征在于,所述根据所述特征的历史数据确定所述特征的F-score值,包括:按下式确定第i个特征的F-score值Fi:其中,是第i个特征在第j类历史数据上的平均值,是第i个特征在整个历史数据上的平均值,是第i个特征的第j类历史数据的第k个样本值;l是历史数据的类别数,nj是第j类历史数据所含样本的个数。5.如权利要求3所述的方法,其特征在于,历史数据的类别按照季节分为四类,每类历史数据所含样本的个数为对应季节含有的天数。6.如权利要求1所述的方法,其特征在于,所述根据特征子集所对应的SVM分类模型的分类正确率确定最优特征子集,包括:利用特征子集中特征所对应的历史数据训练SVM分类模型;测试所述SVM分类模型的分类正确率,选择SVM分类模型分类正确率最高时对应的特征子集作为最优特征子集。7.如权利要求6所述的方法,其特征在于,所述SVM分类模型选用下述多项式核函数:K(x,x')=(x·x'+1)d其中,d为正整数,x为输入空间,即特征子集,x'表示将输入空间映射到的一个高维特征空间。8.如权利要求1所述的方法,其特征在于,所述利用所述最优特征子集中特征所对应的历史数据训练短期负荷预测模型,并利用该短期负荷预测模型预测预测日负荷值,包括:将所述最优特征子集中特征所对应的历史数据按照比例分为训练样本及测试样本;根据所述训练样本,利用改进粒子群优化的神经网络算法建立短期负荷预测模型,并利用测试样本测试所述短期负荷预测模型;将所述最优特征子集中特征所对应的预测日数据作为所述短期负荷预...

【专利技术属性】
技术研发人员:田世明卜凡鹏苏运郭乃网田英杰韩凝晖张琪祁瞿海妮柳劲松
申请(专利权)人:中国电力科学研究院有限公司国网上海市电力公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1