当前位置: 首页 > 专利查询>东北大学专利>正文

基于相同结点链和哈希链的事件序列频繁情节挖掘方法技术

技术编号:6025193 阅读:302 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种事件序列上挖掘最小发生频繁情节的方法,通过对低阶频繁情节进行逐级的延伸直接生成高阶频繁情节。本发明专利技术提供的发现情节的最小发生并对其进行计数的方法,通过建立情节矩阵并在矩阵元素上设置相应的修改状态发现2-情节的最小发生并实现计数,通过对频繁的2-情节进行基于时间戳队列的延伸来发现k-情节(k>2)的最小发生并实现计数。本发明专利技术提供的基于相同结点链和哈希链建立情节树的情节挖掘方法,节省了情节延伸的时间和所占用的内存空间,在挖掘过程中,只需扫描数据一次,无需生成候选情节集合,挖掘效率高,占用内存空间少,并具有挖掘时间成本不随频繁数阈值明显变化的良好特性,可被扩展到事件流上的情节挖掘。

【技术实现步骤摘要】

本专利技术属于时态数据挖掘技术,具体涉及一种基于相同结点链和哈希链的事件序 列频繁情节挖掘的方法及系统。
技术介绍
随着传感器和无线射频识别(feidio Frequency Identification, RFID)等电子数 据采集设备(Electronic Data Gathering Equipment, EDGE)在供应链管理、环境监控及 物联网等诸多领域中被广泛使用,产生了大量的事件类型的数据,复杂事件处理(Complex Event Processing, CEP)技术越来越受到关注和重视,逐渐成为数据库领域继数据流之后 新的研究热点。频繁情节挖掘是CEP的重要研究内容,其方法和技术可以应用在很多方面, 如网络入侵检测、财政事件和股票趋势分析、电信网络报警和物联网等,通过挖掘事件序列 中的频繁情节,可以建立相应的关联规则,从而挖掘出隐藏在事件数据中的有价值的信息。 例如,在物联网的各种监控应用中,由传感器和RFID设备可以产生大量的监控数据,这些 监控数据形成一个事件序列。序列中的事件并不是独立的,在某些时间点发生的事件可能 与另一些时间点上事件的发生有着必然的联系,也本文档来自技高网...

【技术保护点】
一种基于相同结点链和哈希链的事件序列频繁情节挖掘方法,包括以下步骤:(1)对相关数据结构进行初始化,包括:①将事件序列中包含的事件类型按照自然数递增的顺序进行编码;②对包含1-情节信息的结构数组epi_1中的count和time域进行初始化;③对包含2-情节信息的情节矩阵进行初始化;(2)判断事件序列是否已扫描完,若已扫描完,则转入步骤(6);否则进入步骤(3);(3)在事件序列上读取扫描事件(e,t);(4)将事件类型e的发生计数加1,发生的时间戳t记录在相应的epi_1数组元素中;(5)调用函数GenMinOcc(e,t),生成与事件(e,t)相关的2-情节的最小发生信息并记录在情节矩阵中...

【技术特征摘要】

【专利技术属性】
技术研发人员:林树宽乔建忠
申请(专利权)人:东北大学
类型:发明
国别省市:89

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1