当前位置: 首页 > 专利查询>河海大学专利>正文

一种考虑不平衡样本的特高压换流阀运行状态评估方法技术

技术编号:30324773 阅读:33 留言:0更新日期:2021-10-10 00:03
本发明专利技术公开了一种考虑不平衡样本的特高压换流阀运行状态评估方法,包括如下步骤:输入换流阀状态数据集;基于特征综合重要度对换流阀状态数据集中的特征状态量进行筛选和排序,选取到最优状态量特征组合;对数据集进行自适应加权过采样,实现数据均衡化;训练LightGBM分类器,获取到LightGBM评估模型;利用训练好的LightGBM评估模型对换流阀运行状态进行评估。本发明专利技术解决了现有方法过度依赖于足量均衡样本的问题,在对特高压换流阀状态评估方面具有更高的准确率,算法简单且易于实现,在一定程度上帮助工程人员正确判断换流阀的运行状态等级,为特高压换流阀的检修决策提供针对性的理论指导,应用价值和前景巨大。应用价值和前景巨大。应用价值和前景巨大。

【技术实现步骤摘要】
一种考虑不平衡样本的特高压换流阀运行状态评估方法


[0001]本专利技术涉及特高压换流阀运行状态评估方法,具体涉及一种考虑不平衡样本的特高压换流阀运行状态评估方法。

技术介绍

[0002]目前,我国电力设备的检修方式正在由定期检修等传统检修方式逐步向状态检修转变。对电力设备进行状态评估,准确判断其所处的运行状态,是实现状态检修的基础与核心内容。特高压换流阀作为特高压直流输电的核心设备,起着整流、逆变、开关等关键作用,若能对其进行准确的运行状态评估,则可以及时发现异常,降低故障率,提高电网的运行安全。
[0003]最初,换流站运维人员通过在外围观测,能够粗略估计出换流阀的在线运行情况,进而确定检修策略;后来,换流阀的状态评估主要依据国家电网企业标准《高压直流输电换流阀状态评价导则》(以下简称《导则》)进行评分计算。该方法基于换流阀39个状态量的测量结果,采取扣分的方式,依据最终得分判断运行状态。虽然《导则》计及的设备全面,但其中存在着很多相关度过高或重要度过低的特征,这些特征不仅对评估结果几乎无贡献,且大幅增加了数据采集的工作量。此外,《导则》所采用的评分法需要人为进行扣分,导致评估的效率较低。当下,人工智能技术在预测、评估任务中的效率、精度、自学习能力等方面不断发展,这也为换流阀的运维检修提供了一种全新的技术手段与研究思路。不过,该类方法对历史数据要求较高,需要足量且可靠的故障样本作为支撑。当前国内投运的特高压换流阀可靠性较高,非正常运行状态的样本极少,并且各类别样本分布不均衡,若直接使用人工智能算法进行评估,则会使模型偏向于多数类,对非正常运行状态的样本识别性能不佳,从而无法有效指导检修工作。
[0004]针对以上问题,一种更加客观、评估正确率更高、能够解决样本不均衡问题的换流阀运行状态评估方法是亟需解决的问题。

技术实现思路

[0005]专利技术目的:为了克服现有技术中存在的不足,提供一种考虑不平衡样本的特高压换流阀运行状态评估方法,以有效避免传统方法中主观性强、评估效率不足、过于依赖样本质量等问题,在对特高压换流阀状态评估方面具有更高的准确率,算法简单且易于实现,在一定程度上帮助工程人员正确判断换流阀的状态等级,为特高压换流阀的检修决策提供针对性的理论指导,应用价值和前景巨大。
[0006]技术方案:为实现上述目的,本专利技术提供一种考虑不平衡样本的特高压换流阀运行状态评估方法,包括如下步骤:
[0007]S1:输入换流阀状态数据集;
[0008]S2:基于特征综合重要度对换流阀状态数据集中的特征状态量进行筛选和排序,选取到最优状态量特征组合;
[0009]S3:对步骤S2处理后的数据集进行自适应加权过采样,实现数据均衡化;
[0010]S4:训练LightGBM分类器,获取到LightGBM评估模型;
[0011]S5:基于步骤S3预处理后的数据集,利用训练好的LightGBM评估模型对换流阀运行状态进行评估。
[0012]进一步地,所述步骤S1中换流阀状态数据集包括晶闸管组件、阀冷却组件、阀避雷器的特征指标。
[0013]进一步地,所述步骤S2中特征状态量的提取方法为:
[0014]A1:分析晶闸管组件、阀冷却组件、阀避雷器在特高压换流阀工作中承担的作用;
[0015]A2:对选择的各状态量进行量化;
[0016]A3:设定四种运行状态等级。
[0017]进一步地,所述步骤S2中特征综合重要度计算方法为:
[0018]B1:分别用基于距离度量的ReliefF(RF),基于样本分布特性的Fisher Score(FS)以及基于特征局部保持能力的Laplacian Score(LS)对提取的特征状态量进行重要度排序,依次得到序列I
RF
,I
FS
与I
LS

[0019]B2:采用线性互补融合方法计算综合重要度I:
[0020]I
i
=I
RF,i
+I
FS,i
+I
LS,i i=1,2,...,39
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0021]进一步地,所述步骤S3中自适应加权过采样的方法为:
[0022]C1:对数据集中的少数类样本进行层次聚类,将每个样本划分为单独的子簇,然后不断重复地将其中最近的两个子簇合并,直至满足迭代终止条件;
[0023]C2:对各少数类子簇分类测试,基于错分率自适应地确定各子簇的最终采样规模;
[0024]C3:基于各少数类样本与多数类的距离大小来赋以不同权重,计算各样本的概率分布,并完成过采样。
[0025]进一步地,所述步骤C2中错分率与过采样后的子簇规模关系为:
[0026][0027]其中,与分别为子簇D1与D2过采样后的规模;与分别为子簇D1与D2的错分率。
[0028]进一步地,所述步骤C3具体为:
[0029]计算紧密因子:
[0030][0031][0032][0033]其中:x
ij
为子簇D
i
中第j个样本,选取出k个与之欧氏距离最小的多数类样本,记为y
ij(l)
,l=1,2,

,k,距离记为d(x
ij
,y
ij(l)
);f
i
是D
i
的截止函数,避免样本距离太小导致的
过大;T是f
i
(x)的最大值,计算方法见式(4);Q
i
为子簇D
i
的样本数量;y
ij(1)
为距离样本x
ij
最近的多数类样本。
[0034]计算样本x
ij
的权重W(x
ij
)与概率分布大小:
[0035][0036][0037]进一步地,所述步骤C3中过采样的计算公式为:
[0038]c=ω
·
a+(1

ω)
·
b
ꢀꢀꢀ
(8)
[0039]其中,a是基于P(x
ij
)抽样出某一子簇中的样本,b是样本a的k个最近邻之一的样本,ω表示0到1之间的随机数字。
[0040]进一步地,所述步骤S4中采用网格搜索法获取LightGBM评估模型的最优超参数:
[0041]采用网格搜索对LightGBM评估模型的弱回归树数量、最大深度、叶子数目与学习率进行参数寻优。
[0042]有益效果:本专利技术与现有技术相比,具备如下优点:
[0043]1、通过特征筛选,在保证模型高准确率的基础上,剔除无效状态量,选出最优状态量集合,从而提高了评估的效率和准确率。
[0044]2、减小了噪声点对模型训练的影响,增强了不均衡样本的训练效果,解决了现有方法过度本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种考虑不平衡样本的特高压换流阀运行状态评估方法,其特征在于,包括如下步骤:S1:输入换流阀状态数据集;S2:基于特征综合重要度对换流阀状态数据集中的特征状态量进行筛选和排序,选取到最优状态量特征组合;S3:对步骤S2处理后的数据集进行自适应加权过采样,实现数据均衡化;S4:训练LightGBM分类器,获取到LightGBM评估模型;S5:基于步骤S3预处理后的数据集,利用训练好的LightGBM评估模型对换流阀运行状态进行评估。2.根据权利要求1所述的一种考虑不平衡样本的特高压换流阀运行状态评估方法,其特征在于,所述步骤S1中换流阀状态数据集包括晶闸管组件、阀冷却组件、阀避雷器的特征指标。3.根据权利要求2所述的一种考虑不平衡样本的特高压换流阀运行状态评估方法,其特征在于,所述步骤S2中特征状态量的提取方法为:A1:分析晶闸管组件、阀冷却组件、阀避雷器在特高压换流阀工作中承担的作用;A2:对选择的各状态量进行量化;A3:设定四种运行状态等级。4.根据权利要求1所述的一种考虑不平衡样本的特高压换流阀运行状态评估方法,其特征在于,所述步骤S2中特征综合重要度计算方法为:B1:分别用基于距离度量的ReliefF,基于样本分布特性的Fisher Score以及基于特征局部保持能力的Laplacian Score对提取的特征状态量进行重要度排序,依次得到序列I
RF
,I
FS
与I
LS
;B2:采用线性互补融合方法计算综合重要度I:I
i
=I
RF,i
+I
FS,i
+I
LS,i i=1,2,...,39
ꢀꢀꢀꢀꢀꢀ
(1)5.根据权利要求1所述的一种考虑不平衡样本的特高压换流阀运行状态评估方法,其特征在于,所述步骤S3中自适应加权过采样的方法为:C1:对数据集中的少数类样本进行层次聚类,将每个样本划分为单独的子簇,然后不断重复地将其中最近的两个子簇合并,直至满足迭代终止条件;C2:对各少数类子簇分类测试,基于错分率自适应地确定各子簇的最终采样规模;C3:基于各少数类样本与多...

【专利技术属性】
技术研发人员:梅飞顾佳琪张家堂裴鑫陈子平
申请(专利权)人:河海大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1