基于混合型事件日志的过程挖掘方法技术

技术编号:19263439 阅读:57 留言:0更新日期:2018-10-27 02:22
本发明专利技术公开了一种基于混合型事件日志的过程挖掘方法,以包含点事件和区间事件的混合型事件日志为输入,以挖掘出的正确的过程模型作为输出;首先从日志中的每条事件序列中挖掘低层次的事件关系;之后,基于所有的低层次事件关系推导出整个日志层面上的事件关系;最后,调用α算法中基于日志层事件关系的模型生成算法获得Petri网过程。本发明专利技术能从局部完备的混合型事件日志中有效挖掘出正确的过程模型,相对于已有挖掘方法,本发明专利技术适用范围广,普遍适用于点事件日志、区间事件日志以及混合型事件日志。

Process mining method based on mixed event log

The invention discloses a process mining method based on mixed event log, which takes the mixed event log containing point event and interval event as input and the correct process model as output; firstly, the low-level event relationship is mined from each event sequence in the log; secondly, the low-level event relationship is mined based on all the low-level events; The hierarchical event relation deduces the event relation on the whole log level. Finally, Petri net process is obtained by calling the model generation algorithm based on the log level event relation in alpha algorithm. The invention can effectively mine the correct process model from the partially complete mixed event log. Compared with the existing mining methods, the invention has a wide application range and is generally applicable to point event log, interval event log and mixed event log.

【技术实现步骤摘要】
基于混合型事件日志的过程挖掘方法
本专利技术属于数据挖掘领域,具体涉及一种基于混合型事件日志的过程挖掘方法。
技术介绍
随着互联网和大数据应用的不断发展,业务过程模型在如今的信息系统中扮演着越来越重要的角色,从传统的自动化办公系统、组织业务管理系统到服务组合和云环境下的大数据应用等,很多应用的业务逻辑都可以被抽象成过程。与此同时,业务过程也变得空前的复杂,因此,如何挖掘出高质量的过程模型成为一项重要挑战。事件日志,作为计算机信息系统的重要的一部分,记录了系统执行中发生的事件,及事件对应的时间、操作者和生命周期等相关信息,对理解复杂系统的活动至关重要,具有很大的价值。事件日志由多条事件序列组成,每条事件序列记录了一次系统执行的相关信息,具有真实性和客观性的特点。现实中的事件主要有两大类,包括瞬时完成的点事件和需要消耗一定时间的区间事件,对应的事件日志有仅包含点事件的事件日志、仅包含区间事件的事件日志以及包含这两种事件的混合型事件日志。通过挖掘事件日志产生过程模型能够更加贴近实际业务事件执行的先后次序。作为手工建模的一种补充,过程挖掘技术在过去几年收到了越来越多的关注。它的目标是从信息系统产生的事件日志中自动的挖掘出有用的过程知识,产生对应的过程模型。这种挖掘技术产生的过程模型更加的贴近实际业务过程,能够为业务过程重构、优化提供重要参考意见,推动了如软件回归测试等计算机相关技术的发展。现有的过程挖掘技术多数基于仅包含点事件或仅包含区间事件的事件日志进行挖掘,然而现实中的事件日志大多是混合型的,现有过程挖掘技术应用到混合型事件日志需要对日志进行预处理,将点事件扩充为区间事件,或删除区间事件的开始事件或结束事件,无法保证挖掘出正确的过程模型。
技术实现思路
本专利技术的目的在于提供一种基于混合型事件日志的过程挖掘方法,在事件日志为包含点事件和区间事件的混合型日志的情况下,挖掘出事件日志对应的正确的过程模型。实现本专利技术目的的技术解决方案为:一种基于混合型事件日志的过程挖掘方法,用于挖掘混合型事件日志的过程模型,以包含点事件和区间事件的混合型事件日志为输入,以挖掘出的过程模型为输出结果,具体步骤如下:步骤1,基于事件序列挖掘序列级事件关系,扫描混合型事件日志的每一条事件序列,获取基于事件序列的序列级事件关系,包括直接优先关系和相交关系;步骤2,推导基于事件日志的日志层事件关系,对序列级事件关系进行整合判断,从中推导出整个日志层面的事件关系,包括因果关系、并发关系、和独立关系;步骤3,获取过程模型,调用α算法中基于日志层事件关系的模型生成算法,获得最终的过程模型。本专利技术与现有技术相比,其显著优点为:现有技术多数基于仅包含点事件或仅包含区间事件的事件日志进行挖掘,本专利技术所提方法普遍适用于点事件日志、区间事件日志以及混合型事件日志,相较于传统方法,本专利技术所提方法适用范围最广,挖掘出的过程模型具有完备性和可靠性的特点。附图说明图1是本专利技术的基于混合型事件日志的过程挖掘方法流程图。图2是以XES格式描述的混合型事件日志文件示意图。图3是最终挖掘出的过程模型图。具体实施方式本专利技术基于混合型事件日志的过程挖掘方法,其整体流程如图1所示。首先,解析混合型事件日志,求出基于事件序列的序列级事件关系;然后,根据序列级事件关系推导出整个日志层面的事件关系;最后,调用α算法中基于日志层事件关系的模型生成算法获得Petri网过程。具体步骤如下:第一步,基于事件序列挖掘序列级事件关系,扫描混合型事件日志的每一条事件序列,获取基于事件序列的序列级事件关系,包括直接优先关系和相交关系。混合型事件序列的类型如σ={t1,t2,t3,…tn}包含n个事件,t1…tn表示n个事件,其中ti=c表示事件ti是点事件c,ti=ds表示事件ti是区间事件d的开始,ti=de表示ti是区间事件d的结束,求解序列级事件关系具体过程如下:(1)解析混合型事件日志,获取日志中所有的事件序列的集合,所述事件序列集合是指日志中事件可能发生的先后顺序的排序组合;(2)扫描集合中的每一条序列,获得每条序列中包含的事件间的关系。对于任意一条混合型事件序列σ={t1,t2,t3,…tn},其中包含两个事件x和y,根据事件发生的先后顺序,求解x和y之间的关系,具体包括:a.直接优先关系,符号表示为>:当序列内两个事件ti和tj同时满足以下五个条件:①ti=x或ti=xe;②ti=y或ti=ys;③不存在p,i<p<j,tp=z;④不存在k,i<k<j,tk=zs;⑤不存在p,i<l<j,tl=ze;则x>y;b.相交关系,符号表示为︱:当序列内几个事件ti,tj,tp,tq满足以下两个条件中的任意一个:①ti=xs,tj=xe,tp=ys,tq=ye,且p<i<q或i<p<j;②ti=ys,tj=ye,tp=x,且i<k<j.则x︱y,y︱x;第二步,推导基于事件日志的日志层事件关系,对序列级事件关系进行整合判断,从中推导出整个日志层面的事件关系,包括因果关系、并发关系和独立关系;具体步骤如下:(1)整合所有序列级事件关系,推导整个日志层面的事件关系;(2)对于任意事件x和y,根据第一步求得的所有序列级关系,判断整个事件日志层面的事件间的高层次关系,具体关系如下:a.因果关系,符号表示为→:对于事件x和y,若x>y,y≯x,且则x→y;b.并发关系,符号表示为||:对于事件x和y,若x︱y,或x>y且y>x,则x||y,表示事件x和y是并发的关系;c.独立关系,符号表示为#:对于事件x和y,若x≯y,且y≯x,则x#y,表示事件x和事件y之间是相互独立的关系。第三步,根据第二步求得的日志层事件关系,调用α算法基于日志层事件关系的模型生成算法,获取最终模型中事件关系,并在事件间添加库所,产生最终的Petri网模型。实施例本专利技术为基于混合型事件日志的过程挖掘方法。通过对事件日志进行挖掘,生成对应的过程模型,具体挖掘流程如图1所示。首先挖掘基于事件序列的序列级事件关系,然后根据序列级事件关系推导出基于整个日志层面的事件间高层次关系,最后调用α算法中基于日志层事件关系的模型生成算法,获取模型最终对应的事件的并发、直接优先、和独立关系,并在事件间添加库所,生成过程模型。结合实例,该方法包括:步骤1,求序列级事件关系:解析事件日志、获取事件日志中每条事件序列的事件间的关系,具体步骤如下:步骤1-1,解析事件日志。如图2为某一事件日志的部分展示,该事件日志为XES格式文件,可通过解析标签获取所需的信息,其中log标签表示事件日志,trace标签表示事件序列,event代表事件,每个log中可包含多条trace,每条trace可包含多个event。该实例对应事件日志共含2条事件序列(trace),对应的集合为{{t1,t2s,t2e,t3,t5s,t4s,t5e,t4e,t6s,t6e,t8},{t1,t2s,t2e,t7,t8}}。步骤1-2,遍历事件序列本文档来自技高网
...

【技术保护点】
1.一种基于混合型事件日志的过程挖掘方法,用于挖掘混合型事件日志的过程模型,以包含点事件和区间事件的混合型事件日志为输入,以挖掘出的过程模型为输出结果,其特征在于,具体步骤如下:步骤1,基于事件序列挖掘序列级事件关系,扫描混合型事件日志的每一条事件序列,获取基于事件序列的序列级事件关系,包括直接优先关系和相交关系;步骤2,推导基于事件日志的日志层事件关系,对序列级事件关系进行整合判断,从中推导出整个日志层面的事件关系,包括因果关系、并发关系和独立关系;步骤3,获取过程模型,调用α算法中基于日志层事件关系的模型生成算法,获得最终的过程模型。

【技术特征摘要】
1.一种基于混合型事件日志的过程挖掘方法,用于挖掘混合型事件日志的过程模型,以包含点事件和区间事件的混合型事件日志为输入,以挖掘出的过程模型为输出结果,其特征在于,具体步骤如下:步骤1,基于事件序列挖掘序列级事件关系,扫描混合型事件日志的每一条事件序列,获取基于事件序列的序列级事件关系,包括直接优先关系和相交关系;步骤2,推导基于事件日志的日志层事件关系,对序列级事件关系进行整合判断,从中推导出整个日志层面的事件关系,包括因果关系、并发关系和独立关系;步骤3,获取过程模型,调用α算法中基于日志层事件关系的模型生成算法,获得最终的过程模型。2.根据权利要求1所述的基于混合型事件日志过程挖掘方法,其特征在于:步骤1中,混合型事件序列的类型如σ={t1,t2,t3,…tn}包含n个事件,t1…tn表示n个事件,其中ti=c表示事件ti是点事件c,ti=ds表示事件ti是区间事件d的开始,ti=de表示ti是区间事件d的结束,求序列级事件关系的具体过程如下:步骤1-1,解析混合型事件日志,获取日志中所有的事件序列的集合,所述事件序列集合是指日志中事件可能发生的先后顺序的排序组合;步骤1-2,扫描集合中的每一条序列,获得每条序列中事件间的关系;对于任意一条混合型事件序列σ={t1,t2,t3,…tn},其中包含两个事件x和y,根据事件发生的先后顺序,求解x和y之间的关系,具体包括:(1)直接优先关系,符号表示为>:当序列内两个事件ti和tj同时满足以下五个条件,则x>y,五个条件为:①ti=x或ti...

【专利技术属性】
技术研发人员:宋巍尚庆民戴汪洋常震
申请(专利权)人:南京理工大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1