The invention discloses a mining algorithm for workflow with time constraints, which takes event logs with time stamps as input and outputs the correct workflow model with time constraints mined; firstly, the relationship between events is mined from the logs; and then, according to the relationship mined, the time of events is deduced and calculated. Finally, the model generation algorithm of event relations in the alpha algorithm is called to generate a workflow model without time constraints, and the time constraints are appended to the corresponding events to obtain the time constrained workflow model. The time-constrained workflow model excavated by the invention has better completeness, accuracy and reliability, is closer to the actual workflow process, and is generally applicable to point event log, interval event log and mixed event log.
【技术实现步骤摘要】
一种含时间约束工作流的挖掘算法
本专利技术属于数据挖掘领域,具体涉及一种含时间约束工作流的挖掘算法。
技术介绍
随着互联网技术和云计算的不断发展,工作流相关的技术在如今的信息系统中扮演着越来越重要的角色。从传统的自动化办公系统、组织业务管理系统到最近的服务组合和云环境下的大数据应用等,都有大量的工作流产生,如何挖掘出高质量的工作流模型成为一项也成为一项重要的技术。事件日志,是计算机信息系统的重要组成部分,记录了系统执行中发生的事件,及事件对应的时间、操作者和生命周期等相关信息,对理解复杂系统的活动至关重要,具有很大的价值。事件日志由多条事件序列组成,每条事件序列记录了一次系统执行的相关信息,具有真实性和客观性的特点。通过挖掘事件日志生成工作流模型能够更加贴近实际业务事件执行的先后次序,推断实际业务流程执行所需要的时间。工作流挖掘,是一种从工作流日志中提取有用信息的一种技术,通过对系统运行产生的日志进行分析,能够重现业务流程的真实过程,可以为业务过程重构、优化提供重要参考意见,推动了如软件回归测试等计算机相关技术的发展。现有的过程挖掘技术多数基于仅包含点事件或仅包含区间事件的事件日志进行挖掘,然而现实中的事件日志大多是混合型的,现有过程挖掘技术应用到混合型事件日志需要对日志进行预处理,将点事件扩充为区间事件,或删除区间事件的开始事件或结束事件,无法保证挖掘出正确的过程模型。
技术实现思路
本专利技术的目的在于提供一种含时间约束工作流的挖掘算法,在事件日志为包含时间戳的日志的情况下,挖掘出事件日志对应的正确的时间约束工作流模型。实现本专利技术目的的技术解决方案为: ...
【技术保护点】
1.一种含时间约束的工作流挖掘算法,用于挖掘含时间戳的事件日志的工作流模型,以包含时间戳的事件日志为输入,以挖掘出的时间约束工作流模型为输出结果,其特征在于,步骤如下:步骤1,基于事件序列挖掘事件关系,扫描混合型事件日志的每一条事件序列,获取基于事件序列的事件关系,之后推导出整个日志层面的事件关系;步骤2,挖掘事件日志中每个事件对应的时间约束,根据事件的时间戳和求得的日志层面的事件关系,计算事件从使能到开始发生和到完成分别需要的时间,通过不断读取事件序列对时间约束不断更新获得整个日志层面的时间约束;步骤3,调用α算法中基于日志层面事件关系的模型生成算法生成不含时间约束的工作流模型,之后将事件的时间约束附加到模型的事件,获得最终的时间约束工作流模型。
【技术特征摘要】
1.一种含时间约束的工作流挖掘算法,用于挖掘含时间戳的事件日志的工作流模型,以包含时间戳的事件日志为输入,以挖掘出的时间约束工作流模型为输出结果,其特征在于,步骤如下:步骤1,基于事件序列挖掘事件关系,扫描混合型事件日志的每一条事件序列,获取基于事件序列的事件关系,之后推导出整个日志层面的事件关系;步骤2,挖掘事件日志中每个事件对应的时间约束,根据事件的时间戳和求得的日志层面的事件关系,计算事件从使能到开始发生和到完成分别需要的时间,通过不断读取事件序列对时间约束不断更新获得整个日志层面的时间约束;步骤3,调用α算法中基于日志层面事件关系的模型生成算法生成不含时间约束的工作流模型,之后将事件的时间约束附加到模型的事件,获得最终的时间约束工作流模型。2.根据权利要求1所述的含时间约束工作流的挖掘方法,其特征在于:步骤1中,事件序列σ={t1,t2,t3,…tn}包含n个事件,t1…tn表示n个事件,其中ti=c表示事件ti是点事件c,ti=ds表示事件ti是区间事件d的开始,ti=de表示ti是区间事件d的结束,求日志层面事件关系的具体过程如下:步骤1-1,解析事件日志,获取日志中所有的事件序列的集合,所述事件序列集合是指日志中事件可能发生的先后顺序的排序组合;步骤1-2,扫描集合中的每一条序列,获得每条序列中事件间的关系。对于任意一条事件序列σ={t1,t2,t3,…tn},其中包含两个事件x和y,根据事件发生的先后顺序,求解x和y之间的关系,具体包括:(1)直接优先关系,符号表示为>:当序列内两个事件ti和tj同时满足以下五个条件,则x>y;五个条件为:①ti=x或ti=xe;②tj=y或tj=ys;③不存在p,i<p<j,tp=z;④不存在k,i<k<j,tk=zs;⑤不存在p,i<l<j,tl=ze;(2)相交关系,符号表示为︱:当序列内几个事件ti,tj,tp,tq满足以下两个条件中的任意一个,则x︱y,y︱x;两个条件为:①ti=xs,tj=xe,tp=ys,tq=ye,且p<i<q或i<p<j;②ti=ys,tj=ye,tp=x,且i<...
【专利技术属性】
技术研发人员:宋巍,尚庆民,常震,戴汪洋,
申请(专利权)人:南京理工大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。