System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及数据处理,尤其涉及一种数据增强方法及相关设备。
技术介绍
1、随着电力通信网络规模的不断扩大,拓扑结构日益复杂,接入终端及生产业务快速增长,电力通信网络在智能运维上面临挑战。
2、当前,可以通过电力通信网传输设备健康度评估模型量化网络健康状态,提高网络智能运维水平。其中,深度神经网络故障预测模型,是电力通信网传输设备健康度评估模型的一个重要组成部分。
3、但是,从电力通信网采集的原始数据经数据预处理后,告警数据数量远少于非告警数据数量,对应的性能数据的数据特征分布存在不均衡的现象,会导致故障预测模型的预测性能劣化,传输设备健康度分析结果的准确性下降。
4、由此,相关技术中通常采用过采样方法对告警数据对应的性能数据进行数据增强,以训练上述故障预测模型。过采样方法是一种常用的数据增强方法,用于提高少数类样本的数量,处理不平衡数据集。常见的过采样方法有人工少数类过采样法(syntheticminority over-sampling technique,smote)和针对不平衡学习的自适应合成抽样方法(adaptive synthetic sampling approach for imbalanced learning,adasyn)等。然而,相关技术中的过采样方法没有针对电力通信网传输设备性能数据分布特征进行数据增强,也即,相关技术未考虑到不同设备故障类型与性能数据分布特征之间的关系,其数据增强方法并未基于上述性能数据分布特征。通过相关技术的技术方案进行数据增强,可能导致样本分布不平衡
技术实现思路
1、有鉴于此,本申请的目的在于解决
技术介绍
提出的技术问题,提出一种数据增强方法及相关设备。
2、基于上述目的,本申请提供了数据增强方法。所述方法包括:
3、获取告警数据对应的性能数据序列;所述性能数据序列包括告警数据产生时的性能数据和告警数据产生之前的多个性能数据;
4、确定所述性能数据的总体变化程度评估值和突变程度评估值;
5、基于所述总体变化程度评估值和所述突变程度评估值,确定所述告警数据对应的故障类型;
6、选择与所述故障类型对应的数据增强模型,对所述性能数据进行数据增强。
7、可选地,所述确定所述性能数据的总体变化程度评估值和突变程度评估值,包括:
8、根据所述性能数据,通过如下公式得到所述性能数据的总体变化程度评估值;
9、
10、其中,pi+1表示第i+1时刻的性能数据,pi表示第i时刻的性能数据;
11、根据所述性能数据,通过如下公式得到所述性能数据的突变程度评估值;
12、dn=|pn-pn-1|;
13、其中,pn为告警数据产生时的性能数据,pn-1为告警数据产生前一时刻的性能数据。
14、可选地,所述基于所述总体变化程度评估值和所述突变程度评估值,确定所述告警数据对应的故障类型,包括:
15、确定所述告警数据对应的突变门限;
16、响应于所述突变程度评估值大于所述突变门限,确定所述故障类型为突变故障。
17、可选地,所述基于所述总体变化程度评估值和所述突变程度评估值,确定所述告警数据对应的故障类型,还包括:
18、响应于所述突变程度评估值小于或等于所述突变门限,确定所述告警数据对应的间隙门限;
19、响应于所述总体变化程度评估值大于所述间隙门限,确定所述故障类型为缓变故障;
20、响应于所述总体变化程度评估值小于或等于所述间隙门限,确定所述故障类型为间歇故障。
21、可选地,所述选择与所述故障类型对应的数据增强模型,对所述性能数据进行数据增强,包括:
22、响应于确定所述故障类型为突变故障,对所述告警数据产生时的性能数据叠加服从[0,dn/(n+1)]分布的噪声,得到过采样数据;
23、将所述性能数据序列中告警数据产生之前的多个性能数据与所述过采样数据组合,得到过采样数据序列。
24、可选地,所述选择与所述故障类型对应的数据增强模型,对所述性能数据进行数据增强,包括:
25、响应于确定所述故障类型为缓变故障,对所述性能数据序列中的所有性能数据叠加服从[0,diff/(n+1)]分布的噪声,得到过采样数据;
26、将所述过采样数据组合,得到过采样数据序列。
27、可选地,所述选择与所述故障类型对应的数据增强模型,对所述性能数据进行数据增强,还包括:
28、响应于确定所述故障类型为间歇故障,对所述性能数据序列中的所有性能数据进行满足[0,(n+1)/2]分布的移位,得到过采样数据;
29、将所述过采样数据组合,得到过采样数据序列。
30、基于同一专利技术构思,本申请一个或多个实施例还提供了一种数据增强装置,包括:
31、获取模块,被配置为获取告警数据对应的性能数据序列;所述性能数据序列包括告警数据产生时的性能数据和告警数据产生之前的多个性能数据;
32、评估模块,被配置为确定所述性能数据的总体变化程度评估值和突变程度评估值;
33、判断模块,被配置为基于所述总体变化程度评估值和所述突变程度评估值,确定所述告警数据对应的故障类型;
34、数据增强模块,被配置为选择与所述故障类型对应的数据增强模型,对所述性能数据进行数据增强。
35、基于同一专利技术构思,本申请一个或多个实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任意一项所述的数据增强方法。
36、基于同一专利技术构思,本申请一个或多个实施例还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行上述任一所述的数据增强方法。
37、从上面所述可以看出,本申请提供的数据增强方法,通过获取告警数据对应的性能数据序列;所述性能数据序列包括告警数据产生时的性能数据和告警数据产生之前的多个性能数据;确定所述性能数据的总体变化程度评估值和突变程度评估值;基于所述总体变化程度评估值和所述突变程度评估值,确定所述告警数据对应的故障类型;选择与所述故障类型对应的数据增强模型,对所述性能数据进行数据增强。
38、本申请根据告警数据分为突变、缓变和间歇故障数据的分布规律,应用不同的数据增强方法,在保留告警数据特征分布的前提下生成新的告警数据,平衡告警数据数量和非告警数据数量,解决数据集经过初步数据预处理后仍存在特征分布不均衡的问题。应用提出的数据增强算法训练后的故障预测本文档来自技高网...
【技术保护点】
1.一种数据增强方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述确定所述性能数据的总体变化程度评估值和突变程度评估值,包括:
3.根据权利要求1所述的方法,其特征在于,所述基于所述总体变化程度评估值和所述突变程度评估值,确定所述告警数据对应的故障类型,包括:
4.根据权利要求3所述的方法,其特征在于,所述基于所述总体变化程度评估值和所述突变程度评估值,确定所述告警数据对应的故障类型,还包括:
5.根据权利要求3所述的方法,其特征在于,所述选择与所述故障类型对应的数据增强模型,对所述性能数据进行数据增强,包括:
6.根据权利要求4所述的方法,其特征在于,所述选择与所述故障类型对应的数据增强模型,对所述性能数据进行数据增强,包括:
7.根据权利要求4所述的方法,其特征在于,所述选择与所述故障类型对应的数据增强模型,对所述性能数据进行数据增强,还包括:
8.一种数据增强装置,其特征在于,包括:
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计
10.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,其特征在于,所述计算机指令用于使计算机执行权利要求1至7任一所述方法。
...【技术特征摘要】
1.一种数据增强方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述确定所述性能数据的总体变化程度评估值和突变程度评估值,包括:
3.根据权利要求1所述的方法,其特征在于,所述基于所述总体变化程度评估值和所述突变程度评估值,确定所述告警数据对应的故障类型,包括:
4.根据权利要求3所述的方法,其特征在于,所述基于所述总体变化程度评估值和所述突变程度评估值,确定所述告警数据对应的故障类型,还包括:
5.根据权利要求3所述的方法,其特征在于,所述选择与所述故障类型对应的数据增强模型,对所述性能数据进行数据增强,包括:
6.根据权利要求4所...
【专利技术属性】
技术研发人员:郑启薇,周鸿喜,谷小爽,林通,张书林,黄俊桦,赵永利,刘涛,宁云潇,张杰,
申请(专利权)人:国家电网有限公司信息通信分公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。