基于双重加权朴素贝叶斯的电气事故分类方法技术

技术编号:32672733 阅读:16 留言:0更新日期:2022-03-17 11:27
本发明专利技术公开了一种基于双重加权朴素贝叶斯的电气事故分类方法,包括:获取用户用电数据作为原始数据集,其中,原始数据集包括用户用电数据的属性和实例;将原始数据集拆分为训练集和测试集;采用训练集对朴素贝叶斯分类器进行实例加权和属性加权训练,得到双重加权的朴素贝叶斯架构;采用双重加权的朴素贝叶斯架构对测试集进行测试,得到电气事故类别。本发明专利技术将属性加权和实例加权有机结合在朴素贝叶斯统一框架内,能实现对电气事故快速、准确和动态的分类。动态的分类。动态的分类。

【技术实现步骤摘要】
基于双重加权朴素贝叶斯的电气事故分类方法


[0001]本专利技术涉及电气事故诊断技术,具体是基于双重加权朴素贝叶斯的电气事故分类方法。

技术介绍

[0002]随着电气工程的发展,电气化进程对人们生活改善显著,但由诸多因素引起的电气事故也时有发生,会给用电安全、经济建设及电气市场发展带来直接影响。及时、快速、准确地对电气事故进行分类,对后续检修、防治及用电线路升级都具有重要意义。居民用电过程中的电气事故主要包括漏电、短路、过压、断相等,传统电气事故诊断分类方法是基于知识驱动的,其应用时依赖故障诊断知识库、专家知识库、故障诊断推理机等,通过将监视的物理征兆导入故障诊断推理机,并由故障诊断推理机与专家知识库交互,获得物理征兆下的事故类型,从而完成分类。该方法简单易行,但存在较大的主观性,不能做到对电网监测数据的实时充分利用和准确的故障分析分类。
[0003]近年来,诸如神经网络、支持向量机等快速发展的数据驱动方式为事故分类提供了新的手段,其具备坚实的数学基础,无需先验知识,可仅利用原始的数据特征就完成事故分类任务。然而,这些方法的数据驱动方式对数据的数量及质量都有着较高的要求,数据量不足将导致网络架构无法拟合,过差的数据质量将使得网络的推广能力下降,对于居民用电事故分类来说,缺乏大量真实事故数据,需仿真产生大量的模拟事故数据片段,不具有较强的推广能力。同时这些方法无法明确地表征数据特征,仅在架构内部进行学习,没有充分完整地对数据属性及特征进行分析和利用,造成了数据资源的浪费。

技术实现思路

[0004]本专利技术的目的在于克服现有技术的不足,提供了一种基于双重加权朴素贝叶斯的电气事故分类方法,其将属性加权和实例加权有机结合在朴素贝叶斯统一框架内,能实现对电气事故快速、准确和动态的分类。
[0005]本专利技术的目的主要通过以下技术方案实现:
[0006]基于双重加权朴素贝叶斯的电气事故分类方法,包括:
[0007]获取用户用电数据作为原始数据集,所述原始数据集包括用户用电数据的属性和实例;
[0008]将原始数据集拆分为训练集和测试集,所述训练集包括属性和训练实例,所述测试集包括属性和测试实例;
[0009]采用训练集对朴素贝叶斯分类器进行实例加权和属性加权训练,得到双重加权的朴素贝叶斯架构;
[0010]采用双重加权的朴素贝叶斯架构对测试集进行测试,得到电气事故类别。
[0011]朴素贝叶斯将贝叶斯概率、统计学理论和特征条件独立假设相结合,对样本的数据信息进行了严密的推理计算,形成了稳固的理论体系与方法,可以解决数据分析不确定
性和不完整性问题。同时为降低属性条件独立假设所带来的负面影响,改进朴素贝叶斯网络分类算法引起了越来越多学者的广泛关注,并由此产生了许多改进的分类模型和学习算法,其中效果较优的为属性加权朴素贝叶斯和实例加权朴素贝叶斯。属性加权是根据属性对分类预测的影响力来为不同的属性分配不同的权值,然后在加权以后的实例样本集上构建贝叶斯分类器。实例加权则根据实例分布情况对训练实例赋予不同的权重,然后在加权的训练集上构建分类器。加权方式可以科学严谨地表征数据特征,并且能够充分对其进行计算与分析,使得输入算法框架内的特征信息浓度更高,较充分地提升算法性能表现。然而,目前的研究局限于仅采用一种加权方法,未将属性加权与实例加权有机结合在朴素贝叶斯框架内,本专利技术充分考虑不同属性应具有不同重要性,不同实例应具有不同可靠性,在朴素贝叶斯框架内采用双重加权,解决数据分析不确定性和数据不完整性问题,增加对数据片段特征的捕捉和利用,提高算法的实用性和鲁棒性,完成对电气事故高效准确的分类,并可推广至其他分类情形。
[0012]进一步的,采用训练集对朴素贝叶斯分类器进行实例加权和属性加权训练得到的双重加权的朴素贝叶斯架构为:
[0013][0014]其中,a
i
为属性变量A
i
的取值,A
i
为训练集D={A1,A2,

,A
m
}中的属性变量,i=1,2,

,m,m为属性变量的个数,c
J
为类别集C={c1,c2,

,c
q
}中的类别,J=1,2,

,q,q为类别变量总数,为第i个属性的权重,为第j个训练实例的权重,为先验概率,为条件概率。
[0015]进一步的,采用训练集对朴素贝叶斯分类器进行实例加权训练时,按照训练实例与测试实例之间的距离为训练实例来分配不同的权值,权值大小与距离呈负相关。
[0016]进一步的,采用训练集对朴素贝叶斯分类器进行实例加权训练时采用积极实例进行权值设置,其基于属性值频度的实例加权滤波器来学习每个实例的权重,每个属性值的频率的计算公式为:
[0017][0018]其中,a
ji
为第j个实例第i个属性值,f
ji
为a
ji
的频率,n为训练实例的数量,a
rj
为第j个实例第r个属性值。
[0019]令n
i
为第i个属性的值的数量,并且可表示为<n1,n2,...,n
m
>,然后将第j个实例的权重定义为属性值频率向量与属性值个数向量的内积,公式如下:
[0020][0021]进一步的,采用训练集对朴素贝叶斯分类器进行实例加权训练时采用消极实例进行权值设置,其测试实例x与第j个训练实例y
j
间的相似性定义为:
[0022][0023]第j个训练实例的权重定义为:
[0024][0025]进一步的,获取用户用电数据作为原始数据集时还包括对异常数据进行清洗,以及通过在事故数据段内的每个属性叠加随机高斯噪声增加数据片段,叠加随机高斯噪声的公式如下:
[0026][0027]其中,Gauss(x)为按照设定的均值及标注差产生的高斯噪声,μ为高斯噪声的均值,δ为高斯噪声的标准差。
[0028]进一步的,将原始数据集拆分为训练集和测试集后,还包括采用min

max归一化方法对训练集与测试集进行归一化。
[0029]进一步的,采用训练集对朴素贝叶斯分类器进行属性加权训练时,根据属性在预测分类时的重要性分配权重,属性权重大小与其重要性高低成正比。
[0030]进一步的,所述属性权重设置时利用互信息来度量属性

类之间、属性

属性之间的相关性,计算得到类关联度和属性间的相互关联度,每个属性的权重通过对归一化后的类关联度与平均相互关联度之间的差值进行Sigmoid变换后获取。
[0031]综上所述,本专利技术与现有技术相比具有以下有益效果:本专利技术有机结合实例和属性加权的朴素贝叶斯进行电气事故分类,朴素贝叶斯分类中的先验概率和条件概率采用两种实例加权方式加以改进,积极实例权值取决于各属性值频度的统本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于双重加权朴素贝叶斯的电气事故分类方法,其特征在于,包括:获取用户用电数据作为原始数据集,所述原始数据集包括用户用电数据的属性和实例;将原始数据集拆分为训练集和测试集,所述训练集包括属性和训练实例,所述测试集包括属性和测试实例;采用训练集对朴素贝叶斯分类器进行实例加权和属性加权训练,得到双重加权的朴素贝叶斯架构;采用双重加权的朴素贝叶斯架构对测试集进行测试,得到电气事故类别。2.根据权利要求1所述的基于双重加权朴素贝叶斯的电气事故分类方法,其特征在于,采用训练集对朴素贝叶斯分类器进行实例加权和属性加权训练得到的双重加权的朴素贝叶斯架构为:其中,a
i
为属性变量A
i
的取值,A
i
为训练集D={A1,A2,

,A
m
}中的属性变量,i=1,2,

,m,m为属性变量的个数,c
J
为类别集C={c1,c2,

,c
q
}中的类别,J=1,2,

,q,q为类别变量总数,为第i个属性的权重,为第j个训练实例的权重,为先验概率,为条件概率。3.根据权利要求2所述的基于双重加权朴素贝叶斯的电气事故分类方法,其特征在于,采用训练集对朴素贝叶斯分类器进行实例加权训练时,按照训练实例与测试实例之间的距离为训练实例来分配不同的权值,权值大小与距离呈负相关。4.根据权利要求3所述的基于双重加权朴素贝叶斯的电气事故分类方法,其特征在于,采用训练集对朴素贝叶斯分类器进行实例加权训练时采用积极实例进行权值设置,其基于属性值频度的实例加权滤波器来学习每个实例的权重,每个属性值的频率的计算公式为:其中,a
ji
为第j个实例第i个属性值,f
ji
为a
ji
...

【专利技术属性】
技术研发人员:舒一飞郭汶昇樊博康洁滢许诗雨王登峰
申请(专利权)人:国网宁夏电力有限公司营销服务中心国网宁夏电力有限公司计量中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1