一种配电网二次设备类型识别方法及系统技术方案

技术编号:13905350 阅读:123 留言:0更新日期:2016-10-26 07:22
本发明专利技术涉及一种配电网二次设备类型识别方法及系统,所述方法包括:对运行监控数据进行预处理;对预处理后的运行监控数据进行分词和词频统计,获取候选1‑项集;用Apriori算法处理所述候选1‑项集,获取强关联规则;根据所述强关联规则识别配电网二次设备的类型;本发明专利技术提供的方案,应用频繁模式挖掘方法对大规模指定范围的配电网运行监控数据进行关联规则挖掘,产生二次设备分类规则,利用此规则对设备进行明确归类,实现海量种类繁多的配电网二次设备的归类统计,为配电网设备运行状态监视评估奠定基础。

【技术实现步骤摘要】

本专利技术涉及电力系统自动化分析
,具体涉及一种配电网二次设备类型识别方法及系统
技术介绍
电网规模不断扩大,各配电网采用不同厂家、不同类型的电气二次设备,使配电网中二次设备种类繁多且数量巨大,在实际应用中,二次设备类型信息往往缺失,使二次设备类别区分不明确。这使得目前电网信息化以及能源互联网构建过程中所要求的电网设备运行状态监视评估遇到很大困难,包括设备的分类统计、设备仿真等实际需求。经调研,目前还未存在一种基于实际运行监控数据的专门针对配电网二次设备类型的智能识别方法。频繁模式挖掘是数据挖掘领域的一种典型的关联规则产生方法,将大量数据作为候选项集,通过特定的自学习算法发现频繁项集并产生关联规则。针对配电网二次设备识别与分类工作,通过对运行监控数据进行频繁模式挖掘,产生设备与其类型的关联规则,从而利用此规则进行设备智能识别与分类。采用此种自学习的方式进行配电网设备识别,可以依据不同地区的运行监控数据集产生具有该地区特色的设备类型关联规则,从而实现地区个性化设备智能识别分类。
技术实现思路
本专利技术提供一种配电网二次设备类型识别方法及系统,其目的是应用频繁模式挖掘方法对大规模指定范围的配电网运行监控数据进行关联规则挖掘,产生二次设备分类规则,利用此规则对设备进行明确归类,实现海量种类繁多的配电网二次设备的归类统计,为配电网设备运行状态监视评估奠定基础。本专利技术的目的是采用下述技术方案实现的:一种配电网二次设备类型识别方法,其改进之处在于,包括:对运行监控数据进行预处理;对预处理后的运行监控数据进行分词和词频统计,获取候选1-项集;用Apriori算法处理所述候选1-项集,获取强关联规则;根据所述强关联规则识别配电网二次设备的类型。优选的,所述对运行监控数据进行预处理包括:应用CEP引擎,对所述运行监控数据的名称和格式进行关键词提取和与所述运行监控数据无关信息的剔除;应用CEP引擎,对所述运行监控数据的各信号进行信号内关键词剔除、信号内含有的装置名称剔除、信号内关键词的替换和关键词组的模糊匹配。优选的,所述对处理后运行监控数据进行分词和词频统计包括:配置ElasticSearch,将预处理后的运行监控数据加载入ElasticSearch,获取运行监控信号的分词集合和词频统计数,并将所述分词集合作为候选1-项集。优选的,所述用Apriori算法处理所述候选1-项集,获取强关联规则包括步骤:a.根据最小支持度对当前候选i-项集进行剪枝,剪掉小于所述最小支持度的项集,获取频繁i-项集,并判断所述频繁i-项集是否为空集,若是,则执行步骤c,若否,则执行步骤b;b.将所述频繁i-项集进行自然连接,获取候选(i+1)-项集,扫描信号分词集合,统计所述候选(i+1)-项集的词频统计数,并返回步骤a,其中,所述自然连接为任意两项进行组合;c.设置最小置信度阈值,将上述步骤生成的全部频繁项集进行置信度验证,获取强关联规则。优选的,所述根据所述强关联规则识别配电网二次设备的类型包括:遍历所述配电网二次设备的运行监控数据,将所述配电网二次设备的运行监控数据与所述强关联规则进行匹配,获取所述配电网二次设备的类型。一种配电网二次设备类型识别系统,其改进之处在于,所述系统包括:预处理模块,用于对运行监控数据进行预处理;分词模块,用于对预处理后的运行监控数据进行分词和词频统计,获取候选1-项集;Apriori算法处理模块,用于用Apriori算法处理所述候选1-项集,获取强关联规则;识别模块,用于根据所述强关联规则识别配电网二次设备的类型。优选的,所述预处理模块包括:第一预处理单元,用于应用CEP引擎,对所述运行监控数据的名称和格式进行关键词提取和与所述运行监控数据无关信息的剔除;第二预处理单元,用于应用CEP引擎,对所述运行监控数据的各信号进行信号内关键词剔除、信号内含有的装置名称剔除、信号内关键词的替换和关键词组的模糊匹配。优选的,所述分词模块包括:分词单元,用于配置ElasticSearch,将预处理后的运行监控数据加载入ElasticSearch,获取运行监控信号的分词集合和词频统计数,并将所述分词集合作为候选1-项集。优选的,所述Apriori算法处理模块包括:第一处理单元,用于根据最小支持度对当前候选i-项集进行剪枝,剪掉小于所述最小支持度的项集,获取频繁i-项集,并判断所述频繁i-项集是否为空集,若是,则执行第三处理单元,若否,则执行第二处理单元;第二处理单元,用于将所述频繁i-项集进行自然连接,获取候选(i+1)-项集,扫描信号分词集合,统计所述候选(i+1)-项集的词频统计数,并返回步骤a,其中,所述自然连接为任意两项进行组合;第三处理单元,用于设置最小置信度阈值,将上述步骤生成的全部频繁项集进行置信度验证,获取强关联规则。优选的,所述识别模块包括:识别单元,用于遍历所述配电网二次设备的运行监控数据,将所述配电网二次设备的运行监控数据与所述强关联规则进行匹配,获取所述配电网二次设备的类型。本专利技术的有益效果:本专利技术提供的一种配电网二次设备类型识别方法及系统,提出了一种针对不同地区的大规模配电网运行监控数据频繁模式挖掘的电网设备智能识别方法,利用CEP数据预处理技术、ElasticSearch分词技术和Apriori频繁项集挖掘技术进行数据处理及规则自学习,从而利用关联规则进行设备识别和类型匹配。可以自动将指定范围的海量杂乱的配电网设备及运行监控信号进行有效的归类处理,是配电网设备运行状态监视评估必要的数据准备,为配电网二次设备运行状态监视系统及其他基于设备分析的应用系统奠定了数据基础。附图说明图1是本专利技术一种配电网二次设备类型识别方法的流程图;图2是本专利技术实施例中Apriori算法的实现过程流程图;图3是本专利技术一种配电网二次设备类型识别系统的结构示意图。具体实施方式下面结合附图对本专利技术的具体实施方式作详细说明。为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。本专利技术提供的一种配电网二次设备类型识别方法,如图1所示,包括:101.对运行监控数据进行预处理;102.对预处理后的运行监控数据进行分词和词频统计,获取候选1-项集;103.用Apriori算法处理所述候选1-项集,获取强关联规则;104.根据所述强关联规则识别配电网二次设备的类型。具体的,配电网运行监控数据的预处理方法。采用复杂事件处理引擎,将输入的原始数据通过既定的规则库(包括切分、提取、替换、匹配等)进行预处理,产生所需格式的熟数据,所述步骤101包括:应用CEP引擎,对所述运行监控数据的名称和格式进行关键词提取和与所述运行监控数据无关信息的剔除;应用CEP引擎,对所述运行监控数据的各信号进行信号内关键词剔除、信号内含有的装置名称剔除、信号内关键词的替换和关键词组的模糊匹配。例如,取清洗后的运行监控信号样本为:{直流电源空开投非电量投非全相投检修态重瓦斯有载瓦斯油温1油温2绕组温高压力释放压力突本文档来自技高网...

【技术保护点】
一种配电网二次设备类型识别方法,其特征在于,所述方法包括:对运行监控数据进行预处理;对预处理后的运行监控数据进行分词和词频统计,获取候选1‑项集;用Apriori算法处理所述候选1‑项集,获取强关联规则;根据所述强关联规则识别配电网二次设备的类型。

【技术特征摘要】
1.一种配电网二次设备类型识别方法,其特征在于,所述方法包括:对运行监控数据进行预处理;对预处理后的运行监控数据进行分词和词频统计,获取候选1-项集;用Apriori算法处理所述候选1-项集,获取强关联规则;根据所述强关联规则识别配电网二次设备的类型。2.如权利要求1所述的方法,其特征在于,所述对运行监控数据进行预处理包括:应用CEP引擎,对所述运行监控数据的名称和格式进行关键词提取和与所述运行监控数据无关信息的剔除;应用CEP引擎,对所述运行监控数据的各信号进行信号内关键词剔除、信号内含有的装置名称剔除、信号内关键词的替换和关键词组的模糊匹配。3.如权利要求1所述的方法,其特征在于,所述对处理后运行监控数据进行分词和词频统计包括:配置ElasticSearch,将预处理后的运行监控数据加载入ElasticSearch,获取运行监控信号的分词集合和词频统计数,并将所述分词集合作为候选1-项集。4.如权利要求1所述的方法,其特征在于,所述用Apriori算法处理所述候选1-项集,获取强关联规则包括步骤:a.根据最小支持度对当前候选i-项集进行剪枝,剪掉小于所述最小支持度的项集,获取频繁i-项集,并判断所述频繁i-项集是否为空集,若是,则执行步骤c,若否,则执行步骤b;b.将所述频繁i-项集进行自然连接,获取候选(i+1)-项集,扫描信号分词集合,统计所述候选(i+1)-项集的词频统计数,并返回步骤a,其中,所述自然连接为任意两项进行组合;c.设置最小置信度阈值,将上述步骤生成的全部频繁项集进行置信度验证,获取强关联规则。5.如权利要求1所述的方法,其特征在于,所述根据所述强关联规则识别配电网二次设备的类型包括:遍历所述配电网二次设备的运行监控数据,将所述配电网二次设备的运行监控数据与所述强关联规则进行匹配,获取所述配电网二次设备的类型。6.一种配电网二次设备类型识别系统,其特征在...

【专利技术属性】
技术研发人员:艾明浩葛贤军李志宏付云琦赵立强于建成陈乃仕吴磊
申请(专利权)人:中国电力科学研究院国家电网公司国网天津市电力公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1