一种基于快速序列浮动特征选择的短期住宅负荷预测方法技术

技术编号:22565822 阅读:55 留言:0更新日期:2019-11-16 12:20
本发明专利技术公开了一种基于快速序列浮动特征选择的短期住宅负荷预测方法,首先住宅电力负荷的原数据特征经过特征工程生成新数据特征;然后针对生成的新数据特征进行快速序列浮动后向特征选择,选出有利于预测的特征子集,丢弃不利于预测的特征子集,最后把选择后的利于预测的特征子集输入到特定机器学习模型中,得出短期住宅负荷的预测结果。本发明专利技术基于特征评分和特征搜索该两类方法的优点,既考虑到了特征评分对于特征的重要性,也能通过搜索算法为不同的机器学习模型找到最合适的特征子集。同时,其还克服了特征搜索中需要大量计算资源以及计算时间的缺点,能够在较短的计算时间内搜索出合适的特征子集。

A short-term residential load forecasting method based on fast series floating feature selection

The invention discloses a short-term residential load forecasting method based on fast sequence floating feature selection. First, the original data feature of residential power load generates new data feature through feature engineering; then, the fast sequence floating backward feature selection is carried out for the generated new data feature to select the feature subset that is conducive to prediction, discard the feature subset that is not conducive to prediction, and finally The feature subsets which are good for prediction are input into the specific machine learning model, and the short-term residential load prediction results are obtained. Based on the advantages of feature scoring and feature search, the invention not only considers the importance of feature scoring for features, but also finds the most suitable feature subset for different machine learning models through search algorithm. At the same time, it overcomes the shortcomings of large amount of computing resources and computing time in feature search, and can search out the appropriate feature subset in a short computing time.

【技术实现步骤摘要】
一种基于快速序列浮动特征选择的短期住宅负荷预测方法
本专利技术涉及机器学习的
,尤其涉及到一种基于快速序列浮动特征选择的短期住宅负荷预测方法。
技术介绍
随着电力系统分发展,可再生能源将以更加分散的方式出现,分散于各个住宅的可再生能源产生与存储系统(如光伏屋顶)是潜在的未来电力系统工程。在此情形下,针对单个家庭或者住宅的负荷预测变得尤为重要。因为高精度的住宅负荷预测不仅有利于可再生能源系统的维护,还能最大化能源的利用效率,产生更高的经济效益。电力负荷预测是一个电力系统的一个典型任务,根据预测对象的不同级别,可以分为系统级别的负荷预测和住宅级别的负荷预测。现有的研究大多数是对于系统级别的负荷预测,如全市或者全小区的电力负荷预测。随着分布式能源的发展,住宅级别的负荷预测变得越来越重要,也受到了越来越高的关注。相比于系统级别的电力负荷预测,单个住宅的电力负荷波动性与随机性更高,因此预测的难度也越大。根据目的的不同,电力负荷可以分为长期、中期、短期几种。长期负荷预测是指未来3到5年甚者更长时间段内的负荷预测,主要是用于进行电网改造和扩建工作的规划;中期负荷是月至年的负荷预测,主要用于确定机组的运行方式和设备大修计划等;短期负荷预测是指周以内的负荷预测,可用于安排电力调度计划,包括负荷经济分配,电力系统安全性检测,设备检修等。在未来的多变且分布式电网场景中,短期负荷预测变得更加重要,本专利技术是用于短期住宅负荷预测的预测方法。对于短期住宅负荷预测,现有的方法大多将研究的重点放在了对于预测模型的改进或者创新上。如使用创新的机器学习模型用于电力负荷预测、使用改进的机器学习模型用于电力负荷预测或者使用集成方法把不同的集成学习模型组合成一个更好的模型用于电力负荷预测。但是电力负荷预测精度的上限是由数据本身决定的,一个好的预测模型只是能更好地接近这个上限。而对于数据本身的研究和处理是能够去提高预测精度的上限的,所以对电力负荷数据本身的研究处理是负荷预测的关键一环。特征工程就是从数据处理的角度去提高住宅电力负荷预测的一种方式,现有的方法一般是通过在原有的负荷数据基础上加入一些领域特征如电压、电流、风速和温度等,又或者加入一些由已有特征经过线性组合而成的多项式特征。这种方法有一个问题便是新创造的特征对于负荷预测不一定有用,还有可能造成维度灾难而使计算资源消耗增大等问题。所以需要通过一种叫做特征选择的手段去丢弃无用的特征,保留有用的特征。现有的特征选择方法主要分为两大类:一是通过各种方式对数据的特征进行评分,然后选择评分高的特征用于预测;二是通过搜索方法搜索原有特征集中的特征子集并用于预测,选择预测效果最好的特征子集用于预测。这两种方法各有缺点,第一种特征评分的方法无法确定具体选择哪些特征的预测效果会更好,第二种特征的搜索方法则需要大量的计算资源与计算时间。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种消耗资源少、预测性能和预测精度高的基于快速序列浮动特征选择的短期住宅负荷预测方法。为实现上述目的,本专利技术所提供的技术方案为:一种基于快速序列浮动特征选择的短期住宅负荷预测方法,包括以下步骤:S1:短期住宅电力负荷的原数据特征经过特征工程生成新数据特征;S2:针对步骤S1生成的新数据特征进行快速序列浮动后向特征选择,选出有利于预测的特征子集,丢弃不利于预测的特征子集;S3:把选择后的利于预测的特征子集输入到特定机器学习模型中,得出短期住宅负荷的预测结果。进一步地,所述步骤S2进行快速序列浮动后向特征选择的具体步骤如下:S2-1:先使用多种不同的特征评分方法计算各个特征的评分,并根据特征在不同特征评分方法下的排名计算出其综合评分,综合排名越是靠前的特征其综合评分越好;S2-2:从特征全集Yfull开始,开始时已选择的特征子集Yk=Yfull;S2-3:从已选择的特征子集Yk中随机抽取R个特征,步骤S2-1中计算出的特征评分越好则该特征被抽到的概率越低,该R个特征组成特征子集Yt;S2-4:重复步骤S2-3T次,得到T个特征子集Yt,t=1,…,T;S2-5:在Yt中选择出丢弃后能使预测效果最好的一个记为最终要丢弃的特征子集Yd,丢弃特征后更新此时的已选择特征子集Yk=Yk-Yd;S2-6:从丢弃的特征子集Yd中随机抽取lambda*R个特征,0<lambda<1;步骤S2-1中计算出的特征评分越好则该特征被抽到的概率越高,该lambda*R个特征组成特征子集S2-7:重复步骤S2-6T次,得到T个特征子集S2-8:在中选择出在加入后能使预测效果最好的一个记为Ya,加入特征后更新此时的已选择特征子集Yk=Yk+Ya,更新此时的丢弃特征子集Yd=Yd–Ya;S2-9:如果此时的预测效果比上一次执行步骤S2-6至S2-8之前要好,则重复执行步骤S2-6至S2-8,否则进入步骤S2-10;S2-10:如果此时的预测效果比上一次执行步骤S2-3至S2-5时的预测效果更好,则重复执行步骤S2-3至S2-5,否则进入步骤S2-11;S2-11:输出预测效率最好时候的Yk。进一步地,所述步骤S3的具体过程如下:将步骤S2通过快速序列浮动后向特征选择而得到的有利于预测的特征子集输入到岭回归、弹性网回归、拉索回归、LassoLar回归、决策回归树和支持向量机中,然后该每个模型分别使用各自选择出的那一份特征来进行训练,然后进行预测并比较预测性能;最后选择在该些机器学习模型中表现最好的一个作为元模型,其余的模型作为基模型,并将该些模型融合为一个集成模型,集成模型的预测结果作为预测方法最终的预测结果。与现有技术相比,本方案原理如下:首先,住宅电力负荷的原数据特征经过特征工程生成新数据特征;然后针对生成的新数据特征进行快速序列浮动后向特征选择,选出有利于预测的特征子集,丢弃不利于预测的特征子集,最后把选择后的利于预测的特征子集输入到特定机器学习模型中,得出短期住宅负荷的预测结果。与现有技术相比,本方案优点如下:1.快速序列浮动后向特征选择基于特征评分和特征搜索该两类方法的优点,既考虑到了特征评分对于特征的重要性,也能通过搜索算法为不同的机器学习模型找到最合适的特征子集。同时,其还克服了特征搜索中需要大量计算资源以及计算时间的缺点,能够在较短的计算时间内搜索出合适的特征子集。2.使用经过快速序列浮动特征选择的数据来对岭回归、弹性网回归、拉索回归、LassoLar回归、决策回归树和支持向量机这些机器学习模型进行训练,然后把其中预测效果最好的模型作为元模型,其他模型作为基模型来进行模型融合,组成一个集成模型进行预测,大大提高预测精度。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的服务作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员本文档来自技高网
...

【技术保护点】
1.一种基于快速序列浮动特征选择的短期住宅负荷预测方法,其特征在于,包括以下步骤:/nS1:短期住宅电力负荷的原数据特征经过特征工程生成新数据特征;/nS2:针对步骤S1生成的新数据特征进行快速序列浮动后向特征选择,选出有利于预测的特征子集,丢弃不利于预测的特征子集;/nS3:把选择后的利于预测的特征子集输入到特定机器学习模型中,得出短期住宅负荷的预测结果。/n

【技术特征摘要】
1.一种基于快速序列浮动特征选择的短期住宅负荷预测方法,其特征在于,包括以下步骤:
S1:短期住宅电力负荷的原数据特征经过特征工程生成新数据特征;
S2:针对步骤S1生成的新数据特征进行快速序列浮动后向特征选择,选出有利于预测的特征子集,丢弃不利于预测的特征子集;
S3:把选择后的利于预测的特征子集输入到特定机器学习模型中,得出短期住宅负荷的预测结果。


2.根据权利要求1所述的一种基于快速序列浮动特征选择的短期住宅负荷预测方法,其特征在于,所述步骤S2进行快速序列浮动后向特征选择的具体步骤如下:
S2-1:先使用多种不同的特征评分方法计算各个特征的评分,并根据特征在不同特征评分方法下的排名计算出其综合评分,综合排名越是靠前的特征其综合评分越好;
S2-2:从特征全集Yfull开始,开始时已选择的特征子集Yk=Yfull;
S2-3:从已选择的特征子集Yk中随机抽取R个特征,步骤S2-1中计算出的特征评分越好则该特征被抽到的概率越低,该R个特征组成特征子集Yt;
S2-4:重复步骤S2-3T次,得到T个特征子集Yt,t=1,…,T;
S2-5:在Yt中选择出丢弃后能使预测效果最好的一个记为最终要丢弃的特征子集Yd,丢弃特征后更新此时的已选择特征子集Yk=Yk-Yd;
S2-6:从丢弃的特征子集Yd中随机抽取lambda*R个特...

【专利技术属性】
技术研发人员:霍文浩刘义杨超蒋丽谢胜利
申请(专利权)人:广东工业大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1