一种预测方法和装置制造方法及图纸

技术编号:20624170 阅读:24 留言:0更新日期:2019-03-20 15:09
本发明专利技术的实施例提供了一种预测方法和装置,涉及电力技术领域,解决了如何预测电力系统小概率事件的问题。该方法包括,根据K近邻算法,确定运行数据中每个第一正样本归属的数据集以及第一正样本的近邻样本;根据预设条件,在数据集中筛选满足预设条件的第一正样本;根据任意两个满足预设条件的第一正样本对应的特征变量的差值,确定第二正样本;根据随机森林的分类预测模型,确定每个第二正样本的决策树分类模型;根据简单多数投票法,确定每个第二正样本的决策树分类模型的票数;根据每个第二正样本的决策树分类模型的票数,确定数据集的分类结果;根据每个数据集的分类结果,确定分类结果中出现次数最多的分类结果为运行数据的预测结果。

A Prediction Method and Device

The embodiment of the present invention provides a prediction method and device, which relates to the field of power technology and solves the problem of how to predict small probability events in power system. The method includes: according to K-nearest neighbor algorithm, determining the data set of each first positive sample and the nearest neighbor sample of the first positive sample in the running data; screening the first positive sample satisfying the presupposition condition in the data set according to the presupposition condition; determining the second positive sample according to the difference of the characteristic variables corresponding to the first positive sample satisfying the presupposition condition; and according to the random forest. Classification prediction model determines the decision tree classification model of each second positive sample; determines the number of votes of the decision tree classification model of each second positive sample according to the simple majority voting method; determines the classification result of the data set according to the number of votes of the decision tree classification model of each second positive sample; determines the most frequent occurrence of the classification result according to the classification result of each data set. The classification result is the prediction result of the operation data.

【技术实现步骤摘要】
一种预测方法和装置
本专利技术涉及电力
,尤其涉及一种预测方法和装置。
技术介绍
在电力系统中,小概率事件虽然出现次数较少,但是对整个电力系统的危害却很大。因此,预测电力系统小概率事件的发生可以有效的防范危害,保护电力系统的安全。由上述可知,如何预测电力系统小概率事件成为了一个亟待解决的问题。
技术实现思路
本专利技术的实施例提供一种预测方法和装置,解决了,如何预测电力系统小概率事件的问题。为达到上述目的,本专利技术的实施例采用如下技术方案:第一方面、本专利技术的实施例提供一种预测方法,包括:获取电力系统的运行数据;根据K近邻算法,确定运行数据中每个第一正样本归属的数据集以及第一正样本的近邻样本;根据预设条件,在数据集中筛选满足预设条件的第一正样本;其中,预设条件包括第一正样本与第一正样本的每个近邻样本的距离的平均值均小于近邻允许阈值;根据任意两个满足预设条件的第一正样本对应的特征变量的差值,确定第二正样本;根据随机森林的分类预测模型,确定每个第二正样本的决策树分类模型;其中,每个决策树对应一个分类结果,分类结果包括小概率事件;根据简单多数投票法,确定每个第二正样本的决策树分类模型的票数;根据每个第二正样本的决策树分类模型的票数,确定数据集的分类结果;根据每个数据集的分类结果,确定分类结果中出现次数最多的分类结果为运行数据的预测结果。由上述方案可知,本专利技术的实施例提供的预测方法,通过K近邻算法确定电力系统的运行数据中每个第一正样本归属的数据集以及第一正样本的近邻样本;然后在数据集中筛选满足预设条件的第一正样本,由于电力系统的运行数据中满足预设条件的第一正样本的数量有限,因此需要根据任意两个满足预设条件的第一正样本对应的特征变量的差值,确定第二正样本,从而可以得到更多的正样本;进一步地根据随机森林的分类预测模型,确定每个第二正样本的决策树分类模型,并根据简单多数投票法,确定每个第二正样本的决策树分类模型的票数;根据每个第二正样本的决策树分类模型的票数,确定数据集的分类结果;根据每个数据集的分类结果,确定分类结果中出现次数最多的分类结果为运行数据的预测结果;当该预测结果为小概率事件时,说明根据当前电力系统存在发生小概率事件的风险,因此用户可以根据该预测结果提前有效的防范,从而可以保护电力系统的安全,解决了如何预测电力系统小概率事件的问题。第二方面、本专利技术的实施例提供一种预测装置,包括:获取单元,用于获取电力系统的运行数据;处理单元,用于根据K近邻算法,确定获取单元获取的运行数据中每个第一正样本归属的数据集以及第一正样本的近邻样本;处理单元,还用于根据预设条件,在数据集中筛选满足预设条件的第一正样本;其中,预设条件包括第一正样本与第一正样本的每个近邻样本的距离的平均值均小于近邻允许阈值;处理单元,还用于根据任意两个满足预设条件的第一正样本对应的特征变量(比如用电类型,用电客户类型,天气,日期等变量)的差值,确定第二正样本;处理单元,还用于根据随机森林的分类预测模型,确定每个第二正样本的决策树分类模型;其中,每个决策树对应一个分类结果,分类结果包括小概率事件;处理单元,还用于根据简单多数投票法,确定每个第二正样本的决策树分类模型的票数;处理单元,还用于根据每个第二正样本的决策树分类模型的票数,确定数据集的分类结果;处理单元,还用于根据每个数据集的分类结果,确定运行数据的预测结果。第三方面,本专利技术的实施例提供一种预测装置,包括:通信接口、处理器、存储器、总线;存储器用于存储计算机执行指令,处理器与存储器通过总线连接,当预测装置运行时,处理器执行存储器存储的计算机执行指令,以使预测装置执行如上述第一方面提供的方法。第四方面,本专利技术的实施例提供一种计算机存储介质,包括指令,当其在计算机上运行时,使得计算机执行如上述第一方面提供的方法。可以理解地,上述提供的任一种预测装置用于执行上文所提供的第一方面对应的方法,因此,其所能达到的有益效果可参考上文第一方面的方法以及下文具体实施方式中对应的方案的有益效果,此处不再赘述。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术的实施例提供的一种预测方法的流程示意图;图2为本专利技术的实施例提供的一种预测装置的结构示意图之一;图3为本专利技术的实施例提供的一种预测装置的结构示意图之二。附图标记:预测装置-10;获取单元-101;处理单元-102。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。为了便于清楚描述本专利技术实施例的技术方案,在本专利技术的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分,本领域技术人员可以理解“第一”、“第二”等字样并不是在对数量和执行次序进行限定。在本专利技术实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本专利技术实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。在本专利技术实施例的描述中,除非另有说明,“多个”的含义是指两个或两个以上。例如,多个网络是指两个或两个以上的网络。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。本文中符号“/”表示关联对象是或者的关系,例如A/B表示A或者B。在大数据、数据挖掘、机器学习研究领域中,概率预测是一个很有趣的话题。传统的预测理论例如神经网络,模糊理论,灰色理论等技术在在各个行业的突发事件预测中都达到了很好的效果。目前,电力系统中经常使用决策树算法来对事件进行预测。决策树是一种归纳分类算法,它通过对训练集的学习,挖掘出有用的规则,用于对新集进行预测。对于传统的电力事件预测,例如负荷特性、用电分布等,使用历史数据对决策树算法训练构造出较高精度的分类模型即可对预期负荷量进行预测。但是对于电力系统中的小概率事件,由于其样本数量较少使得输入数据不平衡。在对分类模型进行训练时,分类模型为了全局正确率会将正样本预测为负样本,无法达到分类模型预测正样本的目的。因此,本专利提出了一种预测方法,通过对电力系统的运行数据中的第一正样本进行数据处理,从而可以构造不同的第二正样本,从而可以对电力系统中的小概率事件进行预测,具体的实现方式如下:实施例一本专利技术的实施例提供一种预测方法,如图1所示包括:S101、获取电力系统的运行数据。S102、根据K近邻算法(英文全称:k-NearestNeighbour,简称:KNN),确定运行数据中每个第一正样本归属的数据集以及第一正样本的近邻样本。需要说明的是,电力系统的运行数据中存在正常数据本文档来自技高网...

【技术保护点】
1.一种预测方法,其特征在于,包括:获取电力系统的运行数据;根据K近邻算法,确定所述运行数据中每个第一正样本归属的数据集以及所述第一正样本的近邻样本;根据预设条件,在所述数据集中筛选满足所述预设条件的第一正样本;其中,所述预设条件包括第一正样本与所述第一正样本的每个近邻样本的距离的平均值均小于近邻允许阈值;根据任意两个满足所述预设条件的第一正样本对应的特征变量的差值,确定第二正样本;根据随机森林的分类预测模型,确定每个所述第二正样本的决策树分类模型;根据简单多数投票法,确定每个所述第二正样本的决策树分类模型的票数;根据每个所述第二正样本的决策树分类模型的票数,确定所述数据集的分类结果;其中,所述分类结果包括小概率事件;根据每个所述数据集的分类结果,确定所述分类结果中出现次数最多的分类结果为所述运行数据的预测结果。

【技术特征摘要】
1.一种预测方法,其特征在于,包括:获取电力系统的运行数据;根据K近邻算法,确定所述运行数据中每个第一正样本归属的数据集以及所述第一正样本的近邻样本;根据预设条件,在所述数据集中筛选满足所述预设条件的第一正样本;其中,所述预设条件包括第一正样本与所述第一正样本的每个近邻样本的距离的平均值均小于近邻允许阈值;根据任意两个满足所述预设条件的第一正样本对应的特征变量的差值,确定第二正样本;根据随机森林的分类预测模型,确定每个所述第二正样本的决策树分类模型;根据简单多数投票法,确定每个所述第二正样本的决策树分类模型的票数;根据每个所述第二正样本的决策树分类模型的票数,确定所述数据集的分类结果;其中,所述分类结果包括小概率事件;根据每个所述数据集的分类结果,确定所述分类结果中出现次数最多的分类结果为所述运行数据的预测结果。2.根据权利要求1所述的预测方法,其特征在于,所述根据预设条件,在所述数据集中筛选满足所述预设条件的第一正样本前,所述方法还包括:获取所述数据集中正样本的总数K、所述数据集中近邻样本的数量N,以及每个所述第一正样本与所述第一正样本的每个近邻样本的距离的平均值d(i,k),K大于或等于0;根据第一公式、所述总数K、所述数量N和所述平均值d(i,k),确定所述近邻允许阈值;其中,所述第一公式包括:3.根据权利要求1所述的预测方法,其特征在于,所述根据任意两个满足所述预设条件的第一正样本对应的特征变量的差值,确定第二正样本,包括:根据第二公式和任意两个满足所述预设条件的第一正样本对应的特征变量的差值,确定新特征变量fmj;其中,所述第二公式包括:fmj=xmj+diffj×rand[0,1];diffj=xnj-xmj;其中,xnj表示满足所述预设条件的第一正样本n的第j个特征变量,xmj表示满足所述预设条件的第一正样本m的第j个特征变量,n>m,且n∈[0,K],m∈[0,K],K表示所述数据集中正样本的总数,K≥0;根据满足所述预设条件的第一正样本m的每个所述新特征变量fmj,确定第二正样本;其中,所述第二正样本包括[fm1,…,fmj,...,fmy],y表示第一正样本m包含的特征变量的总数,y为大于或等于1的整数,j∈[1,y]。4.根据权利要求1所述的预测方法,其特征在于,所述根据每个所述第二正样本的决策树分类模型的票数,确定所述数据集的分类结果,包括:根据组合分类模型和每个所述第二正样本的决策树分类模型的票数,确定所述数据集的分类结果H(a);其中,所述组合分类模型包括:其中,H(a)表示数据集a的分类结果,t表示第二正样本的总数,hi(x)表示第二正样本x的决策树分类模型,Y表示输出变量,I(hi(x)=Y)表示示性函数。5.一种预测装置,其特征在于,包括:获取单元,用于获取电力系统的运行数据;处理单元,用于根据K近邻算法,确定所述获取单元获取的所述运行数据中每个第一正样本归属的...

【专利技术属性】
技术研发人员:贺建章乔治张沛
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1