一种含时间约束工作流的挖掘算法制造技术

技术编号:19140165 阅读:26 留言:0更新日期:2018-10-13 08:40
本发明专利技术公开了一种含时间约束工作流的挖掘算法,以含时间戳的事件日志作为输入,以挖掘出的正确的含时间约束的工作流模型作为输出;首先从日志中挖掘出事件之间的关系;之后,根据挖掘出的关系推导计算出事件的时间约束;最后,调用α算法中事件关系的模型生成算法生成不含时间约束的工作流模型,并将时间约束附加到相应的事件上获得时间约束工作流模型。本发明专利技术挖掘的时间约束工作流模型具有更好的完备性、准确性和可靠性,更接近实际的工作流过程,普遍适用于点事件日志、区间事件日志以及混合型事件日志。

A mining algorithm with time constrained workflow

The invention discloses a mining algorithm for workflow with time constraints, which takes event logs with time stamps as input and outputs the correct workflow model with time constraints mined; firstly, the relationship between events is mined from the logs; and then, according to the relationship mined, the time of events is deduced and calculated. Finally, the model generation algorithm of event relations in the alpha algorithm is called to generate a workflow model without time constraints, and the time constraints are appended to the corresponding events to obtain the time constrained workflow model. The time-constrained workflow model excavated by the invention has better completeness, accuracy and reliability, is closer to the actual workflow process, and is generally applicable to point event log, interval event log and mixed event log.

【技术实现步骤摘要】
一种含时间约束工作流的挖掘算法
本专利技术属于数据挖掘领域,具体涉及一种含时间约束工作流的挖掘算法。
技术介绍
随着互联网技术和云计算的不断发展,工作流相关的技术在如今的信息系统中扮演着越来越重要的角色。从传统的自动化办公系统、组织业务管理系统到最近的服务组合和云环境下的大数据应用等,都有大量的工作流产生,如何挖掘出高质量的工作流模型成为一项也成为一项重要的技术。事件日志,是计算机信息系统的重要组成部分,记录了系统执行中发生的事件,及事件对应的时间、操作者和生命周期等相关信息,对理解复杂系统的活动至关重要,具有很大的价值。事件日志由多条事件序列组成,每条事件序列记录了一次系统执行的相关信息,具有真实性和客观性的特点。通过挖掘事件日志生成工作流模型能够更加贴近实际业务事件执行的先后次序,推断实际业务流程执行所需要的时间。工作流挖掘,是一种从工作流日志中提取有用信息的一种技术,通过对系统运行产生的日志进行分析,能够重现业务流程的真实过程,可以为业务过程重构、优化提供重要参考意见,推动了如软件回归测试等计算机相关技术的发展。现有的过程挖掘技术多数基于仅包含点事件或仅包含区间事件的事件日志进行挖掘,然而现实中的事件日志大多是混合型的,现有过程挖掘技术应用到混合型事件日志需要对日志进行预处理,将点事件扩充为区间事件,或删除区间事件的开始事件或结束事件,无法保证挖掘出正确的过程模型。
技术实现思路
本专利技术的目的在于提供一种含时间约束工作流的挖掘算法,在事件日志为包含时间戳的日志的情况下,挖掘出事件日志对应的正确的时间约束工作流模型。实现本专利技术目的的技术解决方案为:一种含时间约束工作流的挖掘方法,用于挖掘含时间戳的事件日志的工作流模型,以包含时间戳的事件日志为输入,以挖掘出的时间约束工作流模型为输出结果,挖掘方法步骤如下:步骤1,基于事件序列挖掘事件关系,扫描混合型事件日志的每一条事件序列,获取基于事件序列的事件关系,之后推导出整个日志层面的事件关系;步骤2,挖掘事件日志中每个事件对应的时间约束,根据事件的时间戳和求得的日志层面的事件关系,计算事件从使能到开始发生和到完成分别需要的时间,通过不断读取事件序列对时间约束不断更新获得整个日志层面的时间约束;步骤3,调用α算法中基于日志层面事件关系的模型生成算法生成不含时间约束的工作流模型,之后将事件的时间约束附加到模型的事件,获得最终的时间约束工作流模型。本专利技术与现有技术相比,其显著优点为:本专利技术所提方法普遍适用于点事件日志、区间事件日志以及混合型事件日志;相较于传统方法,本专利技术适用范围最广,挖掘出的时间约束工作流模型具有更好的完备性和可靠性,更加贴近实际业务流程。附图说明图1是本专利技术提供的含时间约束工作流的挖掘算法的流程图。图2是以XES格式描述的事件日志文件示意图。图3是最终挖掘出的过程模型图。具体实施方式本专利技术提出的含时间约束工作流的挖掘算法,其整体流程如图1所示。首先,解析事件日志,求出整个日志层面的事件关系;然后,基于求出的日志层事件关系,获取每个事件对应的时间约束;最后,调用α算法中基于日志层事件关系的模型生成算法生成不含时间约束工作流模型,将求得的时间约束附加到模型的事件上,获得最终的时间约束工作流模型。具体方法步骤为:第一步,基于事件序列挖掘事件关系,扫描混合型事件日志的每一条事件序列,获取基于事件序列的事件关系,之后推导出整个日志层面的事件关系。事件序列的类型如σ={t1,t2,t3,…tn}包含n个事件,t1…tn表示n个事件,其中ti=c表示事件ti是点事件z,ti=ds表示事件ti是区间事件d的开始,ti=de表示ti是区间事件d的结束,求解日志层面事件关系具体过程如下:(1)解析混合型事件日志,获取日志中所有的事件序列的集合,所述事件序列集合是指日志中事件可能发生的先后顺序的排序组合;(2)扫描集合中的每一条序列,获得每条序列中包含的事件间的关系。对于任意一条事件序列σ={t1,t2,t3,…tn},其中包含两个事件x和y,根据事件发生的先后顺序,求解x和y之间的关系,具体包括:a.直接优先关系,符号表示为>:当序列内两个事件ti和tj同时满足以下五个条件:①ti=x或ti=xe;②ti=y或ti=ys;③不存在p,i<p<j,tp=z;④不存在k,i<k<j,tk=zs;⑤不存在p,i<l<j,tl=ze;则x>y;b.相交关系,符号表示为︱:当序列内几个事件ti,tj,tp,tq满足以下两个条件中的任意一个:①ti=xs,tj=xe,tp=ys,tq=ye,且p<i<q或i<p<j;②ti=ys,tj=ye,tp=x,且i<k<j.则x︱y,y︱x;(3)整合所有的序列级事件关系,判断日志包含的所有事件之间的关系,具体包括:a.因果关系,符号表示为→:对于事件x和y,若y≯x,且x>y,则x→y;b.并发关系,符号表示为||:对于事件x和y,若x︱y,或x>y且y>x,则x||y,表示事件x和y是并发的关系;c.独立关系,符号表示为#:对于事件x和y,若y≯x,且x≯y,则x#y,表示事件x和事件y之间是相互独立的关系。第二步,挖掘事件日志中每个事件对应的时间约束,根据事件的时间戳和求得的日志层面的事件关系,计算事件从使能到开始发生和到完成分别需要的时间,通过不断读取事件序列对时间约束不断更新获得整个日志层面的时间约束。事件序列σ={t1,t2,t3,…tn}包含n个事件,ts(σ[p])表示记录的事件tp的时间,ts(σ)表示记录的当前序列使能的时间,SEFT(x)和SLFT(y)分别表示事件y从使能到开始发生和到完成需要的时间,求解事件时间约束的过程具体包括以下步骤:(1)初始化日志中包含的每个事件的时间约束,包括将事件的最早开始时间SEFT初始化为最大值∞,将事件的最晚完成时间SLFT初始化为最小值0;(2)计算序列中事件的时间约束,具体包括:a.对于事件y,y为序列的起始事件,若序列中的事件tp=y或ys,tq=y或ye,则根据此序列求得的事件y对应的时间约束为:SEFT(y)=ts(σ[p])-ts(σ);SLFT(y)=ts(σ[q])-ts(σ)。b.对于事件x和y,存在关系x→y,若序列中的事件ti=x或xe,tj=y或ys,tk=y或ye,不存在l满足i<l<j,σ[l]=z或ze,z→y,则求得事件y的时间约束为:SEFT(y)=ts(σ[j])-ts(σ[i]);SLFT(y)=ts(σ[k])-ts(σ[i])。(3)对日志的每一条序列的事件求时间约束,若当前序列求得的事件y的最早开始时间<已有的SEFT(y),则SEFT(y)=当前y最早开始时间;若当前序列求得的事件y的最晚结束时间>已有的SLFT(y),则SLFT(y)=当前最晚完成时间。第三步,根据第一步求得的日志层面事件关系,调用α算法基于日志层事件关系的模型生成本文档来自技高网...

【技术保护点】
1.一种含时间约束的工作流挖掘算法,用于挖掘含时间戳的事件日志的工作流模型,以包含时间戳的事件日志为输入,以挖掘出的时间约束工作流模型为输出结果,其特征在于,步骤如下:步骤1,基于事件序列挖掘事件关系,扫描混合型事件日志的每一条事件序列,获取基于事件序列的事件关系,之后推导出整个日志层面的事件关系;步骤2,挖掘事件日志中每个事件对应的时间约束,根据事件的时间戳和求得的日志层面的事件关系,计算事件从使能到开始发生和到完成分别需要的时间,通过不断读取事件序列对时间约束不断更新获得整个日志层面的时间约束;步骤3,调用α算法中基于日志层面事件关系的模型生成算法生成不含时间约束的工作流模型,之后将事件的时间约束附加到模型的事件,获得最终的时间约束工作流模型。

【技术特征摘要】
1.一种含时间约束的工作流挖掘算法,用于挖掘含时间戳的事件日志的工作流模型,以包含时间戳的事件日志为输入,以挖掘出的时间约束工作流模型为输出结果,其特征在于,步骤如下:步骤1,基于事件序列挖掘事件关系,扫描混合型事件日志的每一条事件序列,获取基于事件序列的事件关系,之后推导出整个日志层面的事件关系;步骤2,挖掘事件日志中每个事件对应的时间约束,根据事件的时间戳和求得的日志层面的事件关系,计算事件从使能到开始发生和到完成分别需要的时间,通过不断读取事件序列对时间约束不断更新获得整个日志层面的时间约束;步骤3,调用α算法中基于日志层面事件关系的模型生成算法生成不含时间约束的工作流模型,之后将事件的时间约束附加到模型的事件,获得最终的时间约束工作流模型。2.根据权利要求1所述的含时间约束工作流的挖掘方法,其特征在于:步骤1中,事件序列σ={t1,t2,t3,…tn}包含n个事件,t1…tn表示n个事件,其中ti=c表示事件ti是点事件c,ti=ds表示事件ti是区间事件d的开始,ti=de表示ti是区间事件d的结束,求日志层面事件关系的具体过程如下:步骤1-1,解析事件日志,获取日志中所有的事件序列的集合,所述事件序列集合是指日志中事件可能发生的先后顺序的排序组合;步骤1-2,扫描集合中的每一条序列,获得每条序列中事件间的关系。对于任意一条事件序列σ={t1,t2,t3,…tn},其中包含两个事件x和y,根据事件发生的先后顺序,求解x和y之间的关系,具体包括:(1)直接优先关系,符号表示为>:当序列内两个事件ti和tj同时满足以下五个条件,则x>y;五个条件为:①ti=x或ti=xe;②tj=y或tj=ys;③不存在p,i<p<j,tp=z;④不存在k,i<k<j,tk=zs;⑤不存在p,i<l<j,tl=ze;(2)相交关系,符号表示为︱:当序列内几个事件ti,tj,tp,tq满足以下两个条件中的任意一个,则x︱y,y︱x;两个条件为:①ti=xs,tj=xe,tp=ys,tq=ye,且p<i<q或i<p<j;②ti=ys,tj=ye,tp=x,且i&lt...

【专利技术属性】
技术研发人员:宋巍尚庆民常震戴汪洋
申请(专利权)人:南京理工大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1