The embodiment of the present invention provides a prediction method and device, which relates to the field of power technology and solves the problem of how to predict small probability events in power system. The method includes: according to K-nearest neighbor algorithm, determining the data set of each first positive sample and the nearest neighbor sample of the first positive sample in the running data; screening the first positive sample satisfying the presupposition condition in the data set according to the presupposition condition; determining the second positive sample according to the difference of the characteristic variables corresponding to the first positive sample satisfying the presupposition condition; and according to the random forest. Classification prediction model determines the decision tree classification model of each second positive sample; determines the number of votes of the decision tree classification model of each second positive sample according to the simple majority voting method; determines the classification result of the data set according to the number of votes of the decision tree classification model of each second positive sample; determines the most frequent occurrence of the classification result according to the classification result of each data set. The classification result is the prediction result of the operation data.
【技术实现步骤摘要】
一种预测方法和装置
本专利技术涉及电力
,尤其涉及一种预测方法和装置。
技术介绍
在电力系统中,小概率事件虽然出现次数较少,但是对整个电力系统的危害却很大。因此,预测电力系统小概率事件的发生可以有效的防范危害,保护电力系统的安全。由上述可知,如何预测电力系统小概率事件成为了一个亟待解决的问题。
技术实现思路
本专利技术的实施例提供一种预测方法和装置,解决了,如何预测电力系统小概率事件的问题。为达到上述目的,本专利技术的实施例采用如下技术方案:第一方面、本专利技术的实施例提供一种预测方法,包括:获取电力系统的运行数据;根据K近邻算法,确定运行数据中每个第一正样本归属的数据集以及第一正样本的近邻样本;根据预设条件,在数据集中筛选满足预设条件的第一正样本;其中,预设条件包括第一正样本与第一正样本的每个近邻样本的距离的平均值均小于近邻允许阈值;根据任意两个满足预设条件的第一正样本对应的特征变量的差值,确定第二正样本;根据随机森林的分类预测模型,确定每个第二正样本的决策树分类模型;其中,每个决策树对应一个分类结果,分类结果包括小概率事件;根据简单多数投票法,确定每个第二正样本的决策树分类模型的票数;根据每个第二正样本的决策树分类模型的票数,确定数据集的分类结果;根据每个数据集的分类结果,确定分类结果中出现次数最多的分类结果为运行数据的预测结果。由上述方案可知,本专利技术的实施例提供的预测方法,通过K近邻算法确定电力系统的运行数据中每个第一正样本归属的数据集以及第一正样本的近邻样本;然后在数据集中筛选满足预设条件的第一正样本,由于电力系统的运行数据中满足预设条件的第 ...
【技术保护点】
1.一种预测方法,其特征在于,包括:获取电力系统的运行数据;根据K近邻算法,确定所述运行数据中每个第一正样本归属的数据集以及所述第一正样本的近邻样本;根据预设条件,在所述数据集中筛选满足所述预设条件的第一正样本;其中,所述预设条件包括第一正样本与所述第一正样本的每个近邻样本的距离的平均值均小于近邻允许阈值;根据任意两个满足所述预设条件的第一正样本对应的特征变量的差值,确定第二正样本;根据随机森林的分类预测模型,确定每个所述第二正样本的决策树分类模型;根据简单多数投票法,确定每个所述第二正样本的决策树分类模型的票数;根据每个所述第二正样本的决策树分类模型的票数,确定所述数据集的分类结果;其中,所述分类结果包括小概率事件;根据每个所述数据集的分类结果,确定所述分类结果中出现次数最多的分类结果为所述运行数据的预测结果。
【技术特征摘要】
1.一种预测方法,其特征在于,包括:获取电力系统的运行数据;根据K近邻算法,确定所述运行数据中每个第一正样本归属的数据集以及所述第一正样本的近邻样本;根据预设条件,在所述数据集中筛选满足所述预设条件的第一正样本;其中,所述预设条件包括第一正样本与所述第一正样本的每个近邻样本的距离的平均值均小于近邻允许阈值;根据任意两个满足所述预设条件的第一正样本对应的特征变量的差值,确定第二正样本;根据随机森林的分类预测模型,确定每个所述第二正样本的决策树分类模型;根据简单多数投票法,确定每个所述第二正样本的决策树分类模型的票数;根据每个所述第二正样本的决策树分类模型的票数,确定所述数据集的分类结果;其中,所述分类结果包括小概率事件;根据每个所述数据集的分类结果,确定所述分类结果中出现次数最多的分类结果为所述运行数据的预测结果。2.根据权利要求1所述的预测方法,其特征在于,所述根据预设条件,在所述数据集中筛选满足所述预设条件的第一正样本前,所述方法还包括:获取所述数据集中正样本的总数K、所述数据集中近邻样本的数量N,以及每个所述第一正样本与所述第一正样本的每个近邻样本的距离的平均值d(i,k),K大于或等于0;根据第一公式、所述总数K、所述数量N和所述平均值d(i,k),确定所述近邻允许阈值;其中,所述第一公式包括:3.根据权利要求1所述的预测方法,其特征在于,所述根据任意两个满足所述预设条件的第一正样本对应的特征变量的差值,确定第二正样本,包括:根据第二公式和任意两个满足所述预设条件的第一正样本对应的特征变量的差值,确定新特征变量fmj;其中,所述第二公式包括:fmj=xmj+diffj×rand[0,1];diffj=xnj-xmj;其中,xnj表示满足所述预设条件的第一正样本n的第j个特征变量,xmj表示满足所述预设条件的第一正样本m的第j个特征变量,n>m,且n∈[0,K],m∈[0,K],K表示所述数据集中正样本的总数,K≥0;根据满足所述预设条件的第一正样本m的每个所述新特征变量fmj,确定第二正样本;其中,所述第二正样本包括[fm1,…,fmj,...,fmy],y表示第一正样本m包含的特征变量的总数,y为大于或等于1的整数,j∈[1,y]。4.根据权利要求1所述的预测方法,其特征在于,所述根据每个所述第二正样本的决策树分类模型的票数,确定所述数据集的分类结果,包括:根据组合分类模型和每个所述第二正样本的决策树分类模型的票数,确定所述数据集的分类结果H(a);其中,所述组合分类模型包括:其中,H(a)表示数据集a的分类结果,t表示第二正样本的总数,hi(x)表示第二正样本x的决策树分类模型,Y表示输出变量,I(hi(x)=Y)表示示性函数。5.一种预测装置,其特征在于,包括:获取单元,用于获取电力系统的运行数据;处理单元,用于根据K近邻算法,确定所述获取单元获取的所述运行数据中每个第一正样本归属的...
【专利技术属性】
技术研发人员:贺建章,乔治,张沛,
申请(专利权)人:中国联合网络通信集团有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。