高效用事件序列模式挖掘算法制造技术

技术编号:19934176 阅读:32 留言:0更新日期:2018-12-29 04:32
本发明专利技术提供了一种高效用事件序列模式挖掘算法,包括以下步骤:S1、安全事件的定义;S2、事务数据库的划分;S3、增量式高效用安全事件序列挖掘;S4、并行化增量式高效用安全事件序列挖掘。本发明专利技术的有益效果是:可以采用并行化来加快挖掘的时间,更好地利用硬件资源,实现了高效用事件序列模式的挖掘,加快了数据挖掘的速度。

【技术实现步骤摘要】
高效用事件序列模式挖掘算法
本专利技术涉及数据挖掘,尤其涉及一种高效用事件序列模式挖掘算法。
技术介绍
当前的网络安全事件关联分析技术主要包括基于安全事件之间概率相似度的分析方法、基于时间行为结果和先决条件之间因果关系的关联分析方法、基于攻击图的方法、基于数据挖掘和机器学习的方法等,其中基于数据挖掘和机器学习的方法是最根本也是最有效地关联分析方法。关联规则挖掘作为一种典型的数据挖掘方法,在网络安全事件的关联分析模型中得到了广泛地应用,但是随着大数据时代的来临,传统的关联规则挖掘方法的应用领域越来越窄,于是大批学者提出了对关联规则挖掘算法的改进算法。目前的一些对传统关联规则挖掘算法的改进,大都是针对传统关联规则挖掘算法的用途进行改进,打破传统只针对交易数据商品集合的规则挖掘,将其运用于条件更为复杂的应用中。在时间序列的关联规则算法研究领域,R.J.Povinelli等人提出了基于时间序列的数据挖掘框架(TSDM,TimeSeriesDataMiningframework),他称之为时间序列数据挖掘(TimeSeriesDataMining)。曾海泉基于互关联后继树模型,提出时间序列挖掘本文档来自技高网...

【技术保护点】
1.一种高效用事件序列模式挖掘算法,其特征在于,包括以下步骤:S1、安全事件的定义;S2、事务数据库的划分;S3、增量式高效用安全事件序列挖掘;S4、并行化增量式高效用安全事件序列挖掘。

【技术特征摘要】
1.一种高效用事件序列模式挖掘算法,其特征在于,包括以下步骤:S1、安全事件的定义;S2、事务数据库的划分;S3、增量式高效用安全事件序列挖掘;S4、并行化增量式高效用安全事件序列挖掘。2.根据权利要求1所述的高效用事件序列模式挖掘算法,其特征在于:在步骤S1中,不同的事件以攻击类型标号作为标志,为了考虑剩余属性对事件的影响,通过对于属性值计算出其效用值,然后将各个属性的效用值累加作为最终的事件的效用值;属性值所对应的效用值由人工给出,这样就可以通过改变效用值来对不同位置,不同IP的事件赋予不同的重要程度。3.根据权利要求1所述的高效用事件序列模式挖掘算法,其特征在于:在步骤S2中,采用滑动窗口的方式将事件集划分为事务集合,窗口表示从ts到te的一段时间,每个窗口的时间跨度相同,即(te-ts)相同。4.根据权利要求1所述的高效用事件序列模式挖掘算法,其特征在于:在步骤S2中,按照时间排序后的事件,采用时间间隔相同的滑动窗口来对原始的事件进行划分;在同一个窗口内的事件将组成一个事务序列,窗口每次将滑动至下一个时间的时间点,若几次事件相隔较近,将其认为是同时发生的事件,即对其不考虑先后次序;当合并的事件位于当前窗口的第一项时,为了弥补事件合并产生的影响,将原有的效用值乘以合并的个数作为新的效用值。5.根据权利要求1所述的高效用事件序列模式挖掘算法,其特征在于:在步骤S3中,设原始数据集为D1,新增数据集为D2,原始数据集D1中的高效用安全事件序列模式集合为HUSEP1,新增数据集D2中高效用安全时间序列模式集合为HUSEP2;按照定义:HUSEP1的最小效用值大于等于用户定义的最小阈值δ×u(D1),HUSEP2的最小效用值大于等于用户定义的最小阈值δ×u(D2);原始数据集D1与新增数据集D2合并形成的数据库记做D3,原始数据集D1与新增数据集D2合并形成的数据库D3的高效用安全事件序列模式集合为HUSEP3,显然HUSEP3的最小效用值大于等于用户定义的最小阈值δ×u(D3)=δ×u(D1)+δ×u(D2)。6.根据权利要求5所述的高效用事件序列模式挖掘算法,其特征在于:在步骤S3中,对于HUSEP3是HUSEP1∪HUSEP2的一个子集,显然,HUSEP3至少在HUSEP1或者HUSEP2中出现过,如果原HUSEP3在HUSEP1和HUSEP2...

【专利技术属性】
技术研发人员:张春慨
申请(专利权)人:哈尔滨工业大学深圳
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1