本发明专利技术公开了一种基于频繁项集的配电设备故障因素关联性挖掘方法,包括以下步骤:将配电设备故障信息库中的各种故障因素转换为“0,1”矩阵文件;采用Apriori算法对不同故障因素的频繁项集进行挖掘,构建涵盖不同故障因素个数的频繁候选项集;查找大小为1的频繁项集,即含有minSup的所有项目的列表,查找大小大于等于2的频繁项集,并从中找出带有minConf的规则;根据置信度或支持度按降序对规则进行排序。本发明专利技术提供的基于频繁项集的配电设备故障因素关联性挖掘方法,基于频繁项集理论分析配网设备自身及运行环境影响的各类因素和故障事件及故障特征之间的关联,解决配网设备数据冲突,促进配网设备实现健康模式。
【技术实现步骤摘要】
一种基于频繁项集的配电设备故障因素关联性挖掘方法
本专利技术涉及电力系统
,特别是涉及一种基于频繁项集的配电设备故障因素关联性挖掘方法。
技术介绍
配电网是由架空线路、环网柜、电缆、配电变压器、隔离开关以及一些附属设备组成的,在电能的分配中起重要的作用。多年来由于检测设备以及诊断技术的限制,我国对配网设备一直采用定期检修的制度,这既缺少合理性和科学性,又存在很大的盲目性,许多配网设备应修而没有及时整修,轻则影响其使用寿命和技术性能,重则会造成设备的损毁甚至造成重大事故;也有很多的设备不该修而却依照计划进行整修,从而造成人力和财力的浪费,甚至还会导致设备因检修不当影响其正常运行。在配网设备在线监测与状态评估方面,传统的配电设备侧重于设备故障诊断及故障原因分析,而对设备风险预警关注较少。且配网设备状态评价依据通常来自多维度信息,不同来源的信息可能存在冲突和矛盾。如绝缘电阻和过载累计时长两个状态变量单独评价设备状态可能得到不同的结果,此时不能单独考虑一种状态变量的结果。在已有的工作中,大部分检测分析体系只是将不同的变量所表征的结果单一打分或是简单加权,没有很好地解决不同来源证据之间的冲突性与冗余性,只是针对配电设备影响因素开展粗略的数值分析与专家推理,且由于配网设备众多,在监测、记录的过程中可能会出现数据缺失的情况。目前已有的检测分析体系往往需要确定的变量作为检测分析条件,当数据缺失时往往无法进行检测分析或是检测分析结果不全面。因此,需要有针对性的对每起配网设备故障事件追根溯源,对配网故障信息进行汇总和深度挖据,分析配网设备自身及运行环境影响的各类因素和故障事件及故障特征之间的关联。通过对配网故障数据整合分析、深入挖掘,为今后配网设备的状态预警和运维检修提供前瞻性预防措施,形成配电设备多模态信息融合的状态诊断方法,对配电设备健康状况进行全方位、多视角的诊断、评价及风险预警。目前最简单的相关性分析是分析两个变量是否线性相关,常见的方法有画散点图、方差分析、相关系数分析、线性回归分析,但是这些方法也有许多弊端,在处理多元、非线性、高维的大数据时所得到的结果不够全面,且运行过程速度太慢,采用频繁项集理论可以解决上述问题。
技术实现思路
本专利技术的目的是提供一种基于频繁项集的配电设备故障因素关联性挖掘方法,基于频繁项集理论分析配网设备自身及运行环境影响的各类因素和故障事件及故障特征之间的关联,解决配网设备数据冲突,促进配网设备实现健康模式。为实现上述目的,本专利技术提供了如下方案:一种基于频繁项集的配电设备故障因素关联性挖掘方法,包括以下步骤:S1,建立含有多故障因素的配电设备故障信息库;S2,将配电设备故障信息库中的各种故障因素转换为“0,1”矩阵文件,并设置最小支持度minSup、最小置信度minConf和输出最大规则数,按照支持度排序后,规则输出文件;S3,采用Apriori算法对不同故障因素的频繁项集进行挖掘,构建涵盖不同故障因素个数的频繁候选项集;S4,分别为规则和大小为1、2的频繁候选项集的单元数组预分配内存;S5,查找大小为1的频繁项集,即含有minSup的所有项目的列表,查找大小大于等于2的频繁项集,并从中找出带有minConf的规则,基于先验原理通过支持度对候选项集进行剪枝;S6,根据置信度或支持度按降序对规则进行排序,将规则保存在文本文件中并在显示屏上显示,得到配电设备多种故障因素的关联性。优选的,所述步骤S1中,建立含有多故障因素的配电设备故障信息库,具体包括:配网设备属性、运行环境、地区属性、设备故障类型频发性、设备故障发生可能性和设备故障严重程度中的一种或多种。优选的,所述步骤S2中,支持度公式为Support(A,B)=P(A,B),置信度公式为Confidence(A,B)=P(B|A);引入二进制值sortFlag,指示规则是否应按支持度或置信度排序,当sortFlag=1,表示规则按支持度大小排序,当sortFlag=2表示规则按置信度大小排序。优选的,所述步骤S3中,进行不同故障因素的频繁项集挖掘,构建涵盖不同故障因素个数的频繁候选项集,具体包括:如果输入因素个数nargin<7,则保存规则的可选文件名为默认;如果输入因素个数nargin<6,则labels=cellfun(@(x){num2str(x)},num2cell(1:N)),其中数据集中的案例数量M=size(cases,1);数据集中的属性数N=size(cases,2);如果输入因素个数nargin<5,则sortFlag=1;如果输入因素个数nargin<4,则标量值nRules=100;如果输入因素个数nargin<3,则最小置信度minConf=0.5;如果输入因素个数nargin<2,则最小支持度minSup=0.5;如果输入因素个数nargin=0,则显示错误。优选的,所述步骤S5中,所述先验原理为:如果一个集合是频繁项集,则它的所有子集都是频繁项集;如果一个集合不是频繁项集,则它的所有超集都不是频繁项集。优选的,所述步骤S5还包括存储频繁项集,删除由于预分配而产生的不需要的行。根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果:本专利技术提供的基于频繁项集的配电设备故障因素关联性挖掘方法,在频繁项集的基础上分析不同参量(配网设备属性、运行环境、地区属性)组合情况下与设备故障类型频发性、设备故障发生可能性和设备故障严重程度等故障信息的关联程度,进行多项因素与故障信息的关联分析;有针对性的对每起配网设备故障事件追根溯源,对配网故障信息进行汇总和深度挖据,分析配网设备自身及运行环境影响的各类因素和故障事件及故障特征之间的关联,解决配网设备数据冲突,对配网设备运行维护决策起到了重大的作;利用先验原理对项集进行基于支持度的剪枝,不用计算支持度就能删除掉某些非频繁项集,系统地控制候选项集指数增长,一定程度上提升了效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术基于频繁项集的配电设备故障因素关联性挖掘方法流程图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术的目的是提供一种基于频繁项集的配电设备故障因素关联性挖掘方法,基于频繁项集理论分析配网设备自身及运行环境影响的各类因素和故障事件及故障特征之间的关联,解决配网设备数据冲突,促进配网设备实现健康模式。为使本文档来自技高网...
【技术保护点】
1.一种基于频繁项集的配电设备故障因素关联性挖掘方法,其特征在于,包括以下步骤:/nS1,建立含有多故障因素的配电设备故障信息库;/nS2,将配电设备故障信息库中的各种故障因素转换为“0,1”矩阵文件,并设置最小支持度minSup、最小置信度minConf和输出最大规则数,按照支持度排序后,规则输出文件;/nS3,采用Apriori算法对不同故障因素的频繁项集进行挖掘,构建涵盖不同故障因素个数的频繁候选项集;/nS4,分别为规则和大小为1、2的频繁候选项集的单元数组预分配内存;/nS5,查找大小为1的频繁项集,即含有minSup的所有项目的列表,查找大小大于等于2的频繁项集,并从中找出带有minConf的规则,基于先验原理通过支持度对候选项集进行剪枝;/nS6,根据置信度或支持度按降序对规则进行排序,将规则保存在文本文件中并在显示屏上显示,得到配电设备多种故障因素的关联性。/n
【技术特征摘要】
1.一种基于频繁项集的配电设备故障因素关联性挖掘方法,其特征在于,包括以下步骤:
S1,建立含有多故障因素的配电设备故障信息库;
S2,将配电设备故障信息库中的各种故障因素转换为“0,1”矩阵文件,并设置最小支持度minSup、最小置信度minConf和输出最大规则数,按照支持度排序后,规则输出文件;
S3,采用Apriori算法对不同故障因素的频繁项集进行挖掘,构建涵盖不同故障因素个数的频繁候选项集;
S4,分别为规则和大小为1、2的频繁候选项集的单元数组预分配内存;
S5,查找大小为1的频繁项集,即含有minSup的所有项目的列表,查找大小大于等于2的频繁项集,并从中找出带有minConf的规则,基于先验原理通过支持度对候选项集进行剪枝;
S6,根据置信度或支持度按降序对规则进行排序,将规则保存在文本文件中并在显示屏上显示,得到配电设备多种故障因素的关联性。
2.根据权利要求1所述的基于频繁项集的配电设备故障因素关联性挖掘方法,其特征在于,所述步骤S1中,建立含有多故障因素的配电设备故障信息库,具体包括:配网设备属性、运行环境、地区属性、设备故障类型频发性、设备故障发生可能性和设备故障严重程度中的一种或多种。
3.根据权利要求2所述的基于频繁项集的配电设备故障因素关联性挖掘方法,其特征在于,所述步骤S2中,支持度公式为Support(A,B)=P(A,B),置信度公式为Confidence(A,B)=P(B|A);
引入二进制值sortFlag,指示规则是否应按支持度...
【专利技术属性】
技术研发人员:李元,王怡静,徐尧宇,邓军波,张冠军,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。