告警事件关联规则挖掘方法技术

技术编号:11048954 阅读:75 留言:0更新日期:2015-02-18 14:16
本发明专利技术涉及网络管理技术领域,是一种告警事件关联规则挖掘方法,基于分支筛选优化策略和Apriori算法:依次读取数据库里的每个事务项,并生成与每个事务项相对应的支持度计算支撑数组;在Apriori算法的基础上,执行分支筛选优化策略,生成频繁项集;在频繁项集和支持度计算支撑数组的基础上,执行关联规则的置信度计算,在最小置信度约束下,得到有效的关联规则。本发明专利技术通过构建支持度计算支撑数组,简化了支持度的计算,大大减少了读取数据库的次数,提高了算法效率;通过构建邻接字典链表,可以动态发现满足支持度要求的二项频繁集,提供了分支筛选优化策略的执行基础;动态删除无效分支,快速生成二项频繁集,提高了算法效率。

【技术实现步骤摘要】

本专利技术涉及网络管理
,是一种告警事件关联规则挖掘方法
技术介绍
网络告警事件的关联规则技术作为现代网络管理中的标志性技术,在网络故障管理和数据挖掘中占据着重要地位。随着网络规模的不断扩张,网络告警事件频发,但大部分网络告警事件是无用的。如何在这些事件中找到可用的部分,如何对可用部分进行分析,这是近年来的研究热点。因此,网络告警事件的管理规则挖掘在网络管理中得到了大量应用和进一步发展。算法是一种可用于网络告警事件关联规则挖掘的优秀算法,在实践中得到了广泛应用,很多专家学者对其进行了深入研究并做了大量改进。Apriori算法通过迭代计算Ck和Lk来寻找候选集,消耗在C1、L1、C2、L2生成上的时间太多,效率比较低(随着K的增大,Ck和LK减少的很快,特别是当支持度比较大的时候);此外,Apriori算法在执行过程中,需要频繁读取数据库,这也极大地影响了计算效率。
技术实现思路
本专利技术提供了一种告警事件关联规则挖掘方法,克服了上述现有技术之不足,其能有效解决现有Apriori算法中存在的通过迭代计算Ck和Lk来寻找候选集,消耗在C1、L1、C2、L2生成上的时间太多,效率比较低的问题,以及Apriori算法在执行过程中,需要频繁读取数据库,极大地影响计算效率的问题。本专利技术的技术方案是通过以下措施来实现的:一种告警事件关联规则挖掘方法,基于分支筛选优化策略和Apriori算法,具体按照以下步骤进行:步骤101,依次读取数据库中的每个事务项,并生成与每个事务项相对应的支持度计算支撑数组;步骤102,在Apriori算法的基础上,执行分支筛选优化策略,生成频繁项集;步骤103,在频繁项集和支持度计算支撑数组的基础上,执行关联规则的置信度计算,在最小置信度约束下,得到关联规则。下面是对上述专利技术技术方案的进一步优化或/和改进:上述在步骤101中,所述支持度计算支撑数组的构建方式为其中,令t代表数据库中的事务项的数量,则支持度计算支撑数组的数量为t,i的取值范围为1至t;n代表数据项的数量,当某个数据项在事务中存在时,设置相应的数组元素为1,否则设置相应的数组元素为0。上述在步骤102中,对第一个事务项所属的数据项集执行笛卡尔乘积,得到二项频繁集候选集,并建立邻接字典链表,将二项频繁集与邻接字典链表一一对应;迭代地生成第2至第t个事务项的二项频繁集候选集;分支筛选优化策略为:根据支持度计算支撑数组来计算相应二项频繁集的支持度,并动态的根据最小支持度,剔除掉无用的数据项;基于Apriori算法,在二项频繁集候选集的基础上依次生成三项频繁集候选集和三项以上的频繁集候选集,直到完成候选集的计算。上述根据支持度计算支撑数组计算相应二项频繁集的支持度的算法为:其中,p、q、r为数据项。上述建立邻接字典链表的方式为:计算邻接字典链表中母节点的数量其中为二项频繁项集中二项频繁集的个数,为确保大于的最小次幂;确定二项频繁集候选集中所有数据项的位置:其中代表二项频繁集中第一项的索引,代表二项频繁集中第二项的索引。本专利技术在Apriori算法的基础上,采用分支筛选优化策略,来对告警事件的关联规则进行挖掘。本专利技术通过构建支持度计算支撑数组,简化了支持度的计算,并且大大减少了读取数据库的次数,提高了算法效率;通过构建邻接字典链表,可以动态发现满足支持度要求的二项频繁集,提供了分支筛选优化策略的执行基础;采用了分支筛选优化策略,动态删除无效分支,快速生成二项频繁集,大大提高了算法效率。附图说明附图1为本专利技术告警事件关联规则挖掘方法的示意图。附图2为为邻接字典链表示意图。附图3为本专利技术告警事件关联规则挖掘方法的逻辑判断流程示意图。具体实施方式本专利技术不受下述实施例的限制,可根据本专利技术的技术方案与实际情况来确定具体的实施方式。下面结合实施例及附图对本专利技术作进一步描述:如附图1所示,该告警事件关联规则挖掘方法,基于分支筛选优化策略和Apriori算法,具体按照以下步骤进行:步骤101,依次读取数据库中的每个事务项,并生成与每个事务项相对应的支持度计算支撑数组;步骤102,在Apriori算法的基础上,执行分支筛选优化策略,生成频繁项集;步骤103,在频繁项集和支持度计算支撑数组的基础上,执行关联规则的置信度计算,在最小置信度约束下,得到关联规则。如附图2所示,本专利技术方法构建的邻接字典链表中母节点有N项,N的计算公式为:其中为二项频繁项集中二项频繁集的个数,为确保大于的最小次幂。确定二项频繁集候选集中所有数据项的位置:其中Im代表二项频繁集中第一项的索引,In代表二项频繁集中第二项的索引。每个母节点对应着一个节点{ N1,N2,Number,Flag本文档来自技高网...
告警事件关联规则挖掘方法

【技术保护点】
一种告警事件关联规则挖掘方法,其特征在于基于分支筛选优化策略和Apriori算法,具体按照以下步骤进行:步骤101,依次读取数据库中的每个事务项,并生成与每个事务项相对应的支持度计算支撑数组;步骤102,在Apriori算法的基础上,执行分支筛选优化策略,生成频繁项集;步骤103,在频繁项集和支持度计算支撑数组的基础上,执行关联规则的置信度计算,在最小置信度约束下,得到关联规则。

【技术特征摘要】
1.一种告警事件关联规则挖掘方法,其特征在于基于分支筛选优化策略和Apriori算法,具体按照以下步骤进行:
步骤101,依次读取数据库中的每个事务项,并生成与每个事务项相对应的支持度计算支撑数组;
步骤102,在Apriori算法的基础上,执行分支筛选优化策略,生成频繁项集;
步骤103,在频繁项集和支持度计算支撑数组的基础上,执行关联规则的置信度计算,在最小置信度约束下,得到关联规则。
2.根据权利要求1所述的告警事件关联规则挖掘方法,其特征在于在步骤101中,所述支持度计算支撑数组的构建方式为
其中,令t代表数据库中的事务项的数量,则支持度计算支撑数组的数量为t,i的取值范围为1至t;n代表数据项的数量,当某个数据项在事务中存在时,设置相应的数组元素为1,否则设置相应的数组元素为0。
3.根据权利要求2所述的告警事件关联规则挖掘方法,其特征在于在步骤102中,对第一个事务项所属的数据项集执行笛卡尔乘积,得到二项频繁集候...

【专利技术属性】
技术研发人员:周文婷安文燕刘嘉华于勇陈龙
申请(专利权)人:国家电网公司国网新疆电力公司信息通信公司南京南瑞集团公司南京南瑞集团公司信息通信技术分公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1