【技术实现步骤摘要】
基于改进随机森林算法的低压智能监测终端故障预测方法、装置、介质及设备
本专利技术智能低压故障预测领域,尤其涉及一种基于改进随机森林算法的低压智能监测终端故障预测方法、装置、介质及设备。
技术介绍
随机森林算法属于人工智能算法中的监督学习算法,基于随机森林算法的配网抢修故障量预测方法已经提出,预测故障量作为抢修资源和团队的合理分配依据。现有技术中已经提出了使用灰色投影改进随机森林算法预测系统短期负荷。配电网故障量预测领域提出一种基于灰色投影随机森林分类算法的配电网故障预测模型,基于历史故障、负荷、天气、区域分类等信息,预测不同区域、不同电压等级故障的数量,为各单位抢修资源和抢修团队的合理分配提供参考依据,然而预测精度需要进一步提高。
技术实现思路
本专利技术提出了一种基于改进随机森林算法的低压智能监测终端故障预测方法、装置、介质及设备,通过采用改进的随机森林算法自适应调节关联矩阵的权重和投票权值使精确度保持最佳100%准确,有效提高预测精度。本专利技术提供的技术方案如下:一方面,一种 ...
【技术保护点】
1.一种基于改进随机森林算法的低压智能监测终端故障预测方法,其特征在于,包括:/n步骤1:获取A、B、C三相电压与电流的历史特征值,构建历史样本特征集;/n历史样本特征向量为S
【技术特征摘要】
1.一种基于改进随机森林算法的低压智能监测终端故障预测方法,其特征在于,包括:
步骤1:获取A、B、C三相电压与电流的历史特征值,构建历史样本特征集;
历史样本特征向量为Si,Si=[si1,si2,...,sim],i=1,2,...,n;m表示每个样本包含的特征值数量,n表示历史样本的规模,sim表示第i个历史样本的第m个特征值;
步骤2:通过计算历史样本特征向量与待预测样本特征向量之间的相关性,求得大小为n*m的关联判断矩阵Z;
其中,Zij表示第i个历史样本至第n个历史样本的第j个特征值与待预测样本集第j列特征值之间的相关性,i=2,…,n,j=1,…,m,
其中,n表示历史样本数量,m表示样本特征值的数量,l表示待预测样本数量;xej表示第e个历史样本第j个特征值,ykj表示第k个待预测样本第j个特征值;分别是历史样本特征集和待预测样本特征集中所有样本的第j个特征值的平均值;
步骤3:构建特征权重矩阵W,W=[W1,W2,...Wi,...,Wn]T,其中Wi=[w1,w2,...wj...,wm],wj为第j个特征值的权重,初始值为随机值,权重取值大于等于0且小于等于1;
步骤4:对特征权重矩阵W和关联判断矩阵Z进行点乘计算,求得关联决策矩阵U;
步骤5:从作为训练样本集的历史样本特征集中随机选择d个特征,获取决策树的加权投票值a,
其中,λ为调参因子,初始值为随机值,随机值大于等于0且小于等于1;rj表示训练样本集中第j列特征向量与待预测样本集第j列特征向量的相关性;xfj表示第f个训练样本第j个特征值,ykj表示第k个待预测样本第j个特征值,f=1,2,..,t;k=1,2,..,l;j=1,2,...,m;分别是训练样本集和待预测样本集中所有样本中第j个特征值的平均值;t表示训练样本数量;
步骤6:利用U从历史样本特征向量集中选择出相似历史样本特征集;
根据设定的相似历史样本个数自适应调节阈值,每列特征值设定一个阈值ηq,q=1,2,...,m,若U*{Si}矩阵中的元素大于等于设定的阈值ηq,即zijwjsij≥ηq,i=2,...,n;j=1,2,...,m,在U*{Si}矩阵的前g行中,g≥t,前v列中,v≤m,累计选出满足zijwjsij≥ηq的t*m个元素,构成相似历史样本特征集Su;
步骤7:利用所选的相似历史样本特征集和对应的故障类别,对随机森林中的决策树进行训练,获得已训练好的随机森林;
步骤8:利用决策树的加权投票值a和关联决策矩阵U对随机森林中各决策树的故障预测结果进行加权,并通过对a进行调节,以预测准确率为100%目标,获得最终的预测模型;
步骤9:将待预测样本特征向量输入最终的预测模型中,获得最终的故障预测结果;
利用初始值a和I(.)值、预测准确率为100%,代入fRF(X),计算U,并基于步骤2获得的Z值自适应更新W;
fRF(X)表示最终的预测模型,I(·)表示满足括号中表达式的个数,fltree(X)=i表示已训练好的随机森林中的第l棵决策树的故障预测结果为i,c表示整个随机森林的故障预测结果类别数目,将fltree(X)=i预测正确的次数作为最终故障预测正确的样本数,预测样本特征向量个数作为预测样本数。
2.根据权利要求1所述的一种基于改进随机森林算法的低压智能监测终端故障预测方法,其特征在于,所述对随机森林中的决策树进行训练的过程如下:
(1)设定参数;
将历史样本特征的数量作为每颗决策树的特征维度,电压与电流特征值需要判定的次数作为决策树棵数,以设定的决策时间间隔次数作为每个决策树节点的层级,设置节点上最少样本数为一天内采样次数;
实际样本数为特征值个数乘以采样次数;节点上最少的信息增益为1,每棵决策树的根节点对应相似历史样本特征集的故障量;
(2)样本选取;
从历史样本集X中选取训练子集Xi作为根节点的样本;
(3)特征划分;
若当前节点已达终止条件,即当前节点被训练过或被标记为叶节点,没有更多节点特征值做决策判定,设置当前节点为叶节点,该叶节点的预测输出为当前节点样本集中数量最多一类ci,以概率pi表示ci类所占当前样本集的比例;
若当前节点未达到终止条件,则从Z维特征中无放回的随机选取特征z;利用这z维特征,寻找分类效果最好的一维特征k及其阈值th;
在计算分类效果最好的一维特征k时,确定各种判别类型的最佳阈值,当前节点上样本第k维特征值小于此对应判别类型的特征阈值,被划分到左节点,其余则分到右节点。然后继续训练其他节点,得到弱分类器;
(4)持...
【专利技术属性】
技术研发人员:邓威,唐海国,朱吉然,张帝,游金梁,彭涛,康童,叶丹,
申请(专利权)人:国网湖南省电力有限公司,国网湖南省电力有限公司电力科学研究院,国家电网有限公司,
类型:发明
国别省市:湖南;43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。