一种基于改进的Apriori算法的电网数据挖掘方法技术

技术编号:33632756 阅读:17 留言:0更新日期:2022-06-02 01:39
本发明专利技术公开了一种基于改进的Apriori算法的电网数据挖掘方法,通过限制候选产生发现频繁项集,再由频繁项集产生关联规则,产生关联规则为:1、扫描所有频繁项集L,并计算置信度、效率度、兴趣度;2、与置信度阈值比较,去除不满足条件的频繁项集,得到频繁项集L

【技术实现步骤摘要】
一种基于改进的Apriori算法的电网数据挖掘方法


[0001]本专利技术涉及电网数据挖掘
,尤其是一种基于改进的Apriori算法的电网数据挖掘方法。

技术介绍

[0002]对于电网来说,电网系统的安全运行至关重要。在电网系统数据库中,存储着海量的电网数据,可以依据这些电网数据,推断及预测系统存在的安全问题。传统数据库仅提供基础的增、删、查、改功能,无法挖掘海量数据包含的更多信息,纯粹依靠人工找寻电网系统数据库中海量电网数据之间的内在联系,也已经不切实际。
[0003]随着数据挖掘算法的不断发展,逐步应用于各个领域,当然也包括电网数据的挖掘。Apriori算法是一种用于关联规则挖掘的代表性算法,关联规则挖掘是数据挖掘中的一个非常重要的研究方向,它的主要任务就是设法发现事物之间的内在联系。
[0004]现有的Apriori算法通过限制候选产生发现频繁项集,再由频繁项集产生关联规则,而产生关联规则主要通过扫描频繁项集,计算置信度,根据置信度阈值确定满足要求的规则并输出。电网系统数据库中的电网数据的数量极为庞大,基于现有的Ap本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于改进的Apriori算法的电网数据挖掘方法,通过限制候选产生发现频繁项集,再由频繁项集产生关联规则,假设全项集X={x1,x2,x3,...,x
n
},事务数据库D=(X1,X2,X3,...,X
m
)包含m个事务,其中第i个事务X
i
由k(k≥1)项x组成,即为k候选项集C
k
={x1,x2,x3,...,x
k
},其特征在于,产生关联规则包括以下步骤:步骤A1,扫描所有频繁项集L,并计算置信度、效率度、兴趣度,置信度计算公式效率度计算公式兴趣度的计算公式其中,A为前项集,B为后项集,表示A、B的关联规则,为的支持度,|*|表示集合*中所有事务的数量;步骤A2,与置信度阈值比较,去除不满足条件的频繁项集,得到频繁项集L

;步骤A3,与效率度阈值比较,去除不满足条件的频繁项集,得到频繁项集L
″<...

【专利技术属性】
技术研发人员:马永周明徐敏张靖张子健王俊
申请(专利权)人:国网安徽省电力有限公司信息通信分公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1