【技术实现步骤摘要】
一种无标记业务流程事件日志案例识别方法与系统
[0001]本专利技术涉及流程挖掘的
,尤其是指一种无标记业务流程事件日志案例识别方法与系统,主要针对当前流程挖掘技术难以有效地从无标记业务流程事件日志中挖掘流程模型的问题。
技术介绍
[0002]流程挖掘是业务流程管理领域的一个新的研究热点,目标是从业务流程事件日志中提取相关流程信息,来为企业业务流程的理解、改进和重构提供事实依据。IEEE流程挖掘工作组将事件日志从高到低划分为五个级别来表示日志的成熟度,最高级别的事件日志是可信的和完备的,并且事件定义良好,记录的事件及其属性有清晰的语义,例如BPM系统的语义标注日志;最低级别的事件日志质量很差,记录的事件日志可能与事实不符,并且可能会丢失某些事件,例如组织内部路由的纸质文档流转记录、纸质病历卡等事件日志。因此IEEE流程挖掘工作组将清洗事件数据定义为流程挖掘中的挑战之一。流程挖掘需要标准的事件日志,即每一个事件对应一个流程实例,然而在记录和收集数据时可能无法将特定流程实例关联起来,此时案例属性可能不存在或者丢失,日志成为无标记的事件日志。在无标记业务流程事件日志中,两个事件是否相关变得不确定,并且流程实例的数量未知,因此从无标记业务流程事件日志中设计和建模流程模型是一项极其复杂、耗时耗力且极具挑战性的工作。
技术实现思路
[0003]本专利技术的第一目的在于克服现有技术的缺点与不足,提供了一种无标记业务流程事件日志案例识别方法,解决了传统流程挖掘技术无法从无标记业务流程事件日志中挖掘流程模型的问题 ...
【技术保护点】
【技术特征摘要】
1.一种无标记业务流程事件日志案例识别方法,其特征在于,包括以下步骤:1)获取基础数据,即为无标记业务流程事件日志;2)根据步骤1)获得的基础数据,挖掘活动间的依赖关系和依赖程度值;3)根据步骤2)挖掘的活动间的依赖程度值,挖掘活动间并发关系并构造依赖关系图;4)根据步骤3)挖掘的活动间并发关系和依赖关系图,挖掘活动间互斥活动和循环活动;5)根据步骤3)挖掘的活动间并发关系和依赖关系图及步骤4)挖掘的活动间互斥活动和循环活动,构造案例树对无标记业务流程事件日志中的活动进行案例识别,得到有案例标识的事件日志。2.根据权利要求1所述的一种无标记业务流程事件日志案例识别方法,其特征在于:在步骤1)中,所述无标记业务流程事件日志是缺少案例的事件日志,表示为一条带有时间戳信息的事件序列;所述事件日志是流程执行过程中产生的数据,事件日志是案例的多集,一个案例是事件日志中的事件所对应的一个流程实例,即流程模型的一次执行。3.根据权利要求2所述的一种无标记业务流程事件日志案例识别方法,其特征在于:在步骤2)中,所述活动间的依赖关系是指在无标记业务流程事件日志UL中,活动b依赖活动a需满足当在UL中第i个位置是活动a时,第i+1个位置是b,其中i满足:1≤i≤|UL|
‑
1,活动b依赖活动a的依赖程度值计算方式如下:式中,R(a
→
b)表示活动b依赖活动a的依赖程度值,a
→
b表示活动b依赖活动a,|a
→
b|表示在无标记业务流程事件日志UL中活动b依赖活动a的频次,|UL|表示无标记业务流程事件日志中活动的总数,|a|表示在无标记业务流程事件日志UL中活动a的频次,|b|表示在无标记业务流程事件日志UL中活动b的频次,a是被依赖活动,b是依赖活动。4.根据权利要求3所述的一种无标记业务流程事件日志案例识别方法,其特征在于:在步骤3)中,所述活动间并发关系是在无标记业务流程事件日志中,活动c和活动b是并发关系,即c||d,需满足:
①
R(c
→
d)>ω∨R(d
→
c)>ω
②
式中,ω、θ为输入的阈值,R(c
→
d)表示活动d依赖活动c的依赖程度值,R(d
→
c)表示活动c依赖活动d的依赖程度值;条件
①
指活动c依赖活动d或者活动d依赖活动c的依赖程度值大于阈值ω,即用来筛选依赖程度高的活动对;条件
②
指活动c依赖活动d和活动d依赖活动c的依赖程度值接近;根据活动间的依赖程度值构造并发活动集的具体步骤如下:3.1)输入无标记业务流程事件日志UL,获得活动间的依赖程度值;3.2)将满足活动间并发关系的活动加入到并发活动集ParallelSet;3.3)循环迭代步骤3.2),直至遍历完所有的活动对,输出并发活动集ParallelSet;所述依赖关系图为一个二元组DG=(N,E),其中,为顶点集,为无标记业务流程
事件日志UL的活动集;表示结点间的依赖关系边集,对于任意的(e,f)∈E,满足:(1)R(e
→
f)≥ω,即活动f依赖活动e的依赖程度值大于或等于阈值ω;(2)活动e和活动f不存在并发关系;(3)|R(e
→
f)
‑
R(f
→
e)|/(R(e
→
f)+R(f
→
e))<θ,即活动f依赖活动e与活动e依赖活动f的依赖程度值接近;(4)当e为开始活动startAct时,f不是结束活动endAct,或者当f是结束活动endAct时,e不是开始活动startAct;上述提到的ω和θ为输入的阈值,R(e
→
f)表示活动f依赖活动e的依赖程度值,R(f
→
e)表示活动e依赖活动f的依赖程度值;开始活动startAct为无标记业务流程事件日志的第一个活动,结束活动endAct为无标记业务流程事件日志的最后一个活动。5.根据权利要求4所述的一种无标记业务流程事件日志案例识别方法,其特征在于:在步骤4)中,所述互斥活动定义为若活动a与活动b是互斥活动,需满足:(1)在依赖关系图中从活动a到结束活动endAct的一条路径上不存在活动b;(2)在依赖关系图中从活动b到结束活动endAct的路径上不存在活动a;(3)活动a和活动b不存在并发关系;上述提到的路径指在依赖关系图DG=(N,E),对于任意两个结点c和d,若存在结点c1,c2,
…
,c
j
,
…
,c
k
,
…
,c
n
并且满足当1≤j<k≤n时,c
j
≠c
k
,若...
【专利技术属性】
技术研发人员:刘聪,王颖,陆婷,郭娜,李彩虹,张冬梅,郑凯,
申请(专利权)人:山东理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。