一种基于精简过程结构树分解的过程发现方法技术

技术编号:34331794 阅读:21 留言:0更新日期:2022-07-31 02:13
本发明专利技术公开了一种基于精简过程结构树分解的过程发现方法,定义了基于SESE片段的轨迹投影,提出了一种日志投影方法,通过将投影得到的每一个入口活动到出口活动间的片段作为子日志的轨迹,解决了现有的RPST(精简过程结构树)技术在过程模型挖掘中存在的日志投影问题,对提高模型精确性,降低模型复杂性有很大帮助;针对边界活动分支结构中不可见变迁的处理问题,本发明专利技术提供了一种子模型合并方法,增加框架可扩展性和解决边界活动分支结构挖掘问题。问题。问题。

A process discovery method based on reduced process structure tree decomposition

【技术实现步骤摘要】
一种基于精简过程结构树分解的过程发现方法


[0001]本专利技术涉及过程模型挖掘领域,具体涉及一种基于精简过程结构树分解的过程发现方法。

技术介绍

[0002]现有支持并行过程挖掘的日志分割方法有两类:垂直分割和水平分割。可以将日志分解为若干子日志,使子日志可以分布式处理,从而实现并行化。垂直分割基于日志中案例分组划分,即:根据案例某些特定标准划分案例。案例长度,案例包含的活动集合,客户类型,案例起始时间,持续时间等都可以作为案例划分依据。例如,使用案例开始时间进行日志划分,可以分析挖掘模型随时间推移的变化情况。轨迹聚类是基于日志中案例分组的划分方法,目前已被用于改进过程挖掘的结果。例如,基于向量空间模型的聚类方法,基于上下文感知的轨迹聚类方法,基于模型的序列聚类方法等。目前用于并行化过程挖掘的垂直分割方法较少。
[0003]现有分解并行过程挖掘主要是事件日志的水平划分。水平分割最常见的是基于事件划分。日志案例由事件组成,最终转化为事件所对应活动集合的划分问题。目前划分活动集合的较好方法是首先构造出因果结构,对因果依赖图进行划分得到重叠活动子集。
[0004]Passage技术将因果结构划分为多个passage片段,其中,passage片段是一个非空节点集(X,Y),其中集合X中顶点是集合Y中顶点的直接前驱,而集合Y中顶点的直接前驱是X中的顶点。然而,Passage技术不以“高内聚”,“低耦合”为目标,且存在活动划分不均匀的问题,总挖掘时间取决于最大passage对应的子日志上的挖掘时间。
[0005]最大划分技术基于边划分,最初目的是分解Petri网,该技术将连接同一库所,连接同一内部变迁,连接同名变迁的边划分为同一集合,且最大划分对应重叠活动划分。有的文章中最大划分被应用于划分因果结构。事实上,最大划分是更细粒度的Passage划分,因为最大划分过于精细,现有文章中提出最大划分扩展,提出了旨在衡量活动分组质量的指标,如内聚度和耦合度,以便预先评价分解质量。
[0006]目前精简过程结构树(Refined Process Structure Tree)技术被应用于分解并行挖掘,将有向图划分为树状层次结构,树中每一个节点都对应一个单入口和单出口片段。不同活动集合之间只在入口节点和出口节点处存在重叠,因此可以得到比Passage技术和最大划分技术更高内聚,低耦合的活动划分。目前,RPST(精简过程结构树)技术在过程模型挖掘中存在的问题是:(1)日志投影问题,日志投影算法没有充分结合RPST技术,使得子日志中活动之间关系与原始日志不符,导致挖掘的子模型精确性低,且可能导致模型复杂性高。(2)边界活动分支结构中不可见变迁的处理问题,基于边界活动分支结构挖掘的子模型合并算法中边界活动判断只关注当下节点,忽略了当前节点与其他节点之间的联系,破环模型的流关系,可能会使最终模型质量较差,同时该算法没有考虑存在不可见变迁的情况。

技术实现思路

[0007]针对现有技术存在的问题,本专利技术提供了一种基于精简过程结构树分解的过程发现方法。
[0008]本专利技术采用以下的技术方案:
[0009]一种基于精简过程结构树分解的过程发现方法,包括以下步骤:
[0010]定义SESE片段轨迹投影
[0011]假设A
i
是通过精简过程结构树划分得到的活动子集,A
i.Entry
和A
i.Exit
分别表示活动子集Ai的入口活动和出口活动,σ(i)表示轨迹第i个位置上的事件,|σ|表示轨迹长度,当且仅当:
[0012](1)σ(1)=A
i.Entry
∧σ(|σ|)=A
i.Exit

[0013](2)
[0014]则称S
SESE
为基于SESE片段的轨迹投影;
[0015]生成子日志
[0016]输入:事件日志L,基于精简过程结构树分解得到的重叠活动划分集合DA={A1,A2,

,A
n
};
[0017]输出:子日志集合L


[0018]步骤1.1:将子日志集合L

初始化为空;
[0019]步骤1.2:遍历重叠活动划分集合DA中的每一个元A
i

[0020]步骤1.3:每一个元A
i
都创建一个对应的事件日志L
i

[0021]步骤1.4:遍历事件日志L中的每一条轨迹;
[0022]步骤1.5:如果A
i
的入口活动在出口活动前,则对入口活动和出口活动之间的序列在A
i
上投影,如果A
i
的入口活动和出口活动之间不存在因果关系,则将投影序列中的每一条基于SESE片段的投影作为对应的事件日志L
i
的一条轨迹;如果A
i
的入口活动和出口活动之间存在因果关系,则将投影序列作为对应的事件日志L
i
的一条轨迹;
[0023]步骤1.6:将对应的事件日志L
i
加入子日志集合L

中;
[0024]步骤1.7:如果A
i
≠A
n
则执行步骤1.2,否则执行步骤1.8;
[0025]步骤1.8:返回子日志集合L


[0026]在得到子日志集合L

后,在每个子日志上使用过程发现算法得到子模型集合M
sib

[0027]子模型合并
[0028]定义子模型合并为mergeSubModels(s,R,DA)
[0029]输入:精简过程结构树的根节点s,精简过程结构树中边的集合R,基于精简过程结构树分解得到的重叠活动划分集合DA={A1,A2,

,A
n
};
[0030]输出:合并后的模型M;
[0031]步骤2.1:如果根节点s属于重叠活动划分集合DA,则返回根节点s对应的模型Ms,否则将子模型集合M
sib
初始化为空,执行步骤2.2;
[0032]步骤2.2:遍历精简过程结构树中的每一个节点s

,其中任意(s,s

)属于边集R;
[0033]步骤2.3:递归调用mergeSubModels找到节点s

对应的子模型Ms


[0034]步骤2.4:将子模型Ms

加入子模型集合M
sib

[0035]步骤2.5:调用合并兄弟模型mergeSiblings且重新挖掘模型边界活动分支结构,
返回合并后的模型M。
[0036]优选地,步骤2.5中合并兄弟模型mergeSiblings包括:...

【技术保护点】

【技术特征摘要】
1.一种基于精简过程结构树分解的过程发现方法,其特征在于,包括以下步骤:定义SESE片段轨迹投影假设A
i
是通过精简过程结构树划分得到的活动子集,A
i.Entry
和A
i.Exit
分别表示活动子集Ai的入口活动和出口活动,σ(i)表示轨迹第i个位置上的事件,|σ|表示轨迹长度,当且仅当:(1)σ(1)=A
i.Entry
∧σ(|σ|)=A
i.Exit
;(2)则称S
SESE
为基于SESE片段的轨迹投影;生成子日志输入:事件日志L,基于精简过程结构树分解得到的重叠活动划分集合DA={A1,A2,

,A
n
};输出:子日志集合L

;步骤1.1:将子日志集合L

初始化为空;步骤1.2:遍历重叠活动划分集合DA中的每一个元A
i
;步骤1.3:每一个元A
i
都创建一个对应的事件日志L
i
;步骤1.4:遍历事件日志L中的每一条轨迹;步骤1.5:如果A
i
的入口活动在出口活动前,则对入口活动和出口活动之间的序列在A
i
上投影,如果A
i
的入口活动和出口活动之间不存在因果关系,则将投影序列中的每一条基于SESE片段的投影作为对应的事件日志L
i
的一条轨迹;如果A
i
的入口活动和出口活动之间存在因果关系,则将投影序列作为对应的事件日志L
i
的一条轨迹;步骤1.6:将对应的事件日志L
i
加入子日志集合L

中;步骤1.7:如果A
i
≠A
n
则执行步骤1.2,否则执行步骤1.8;步骤1.8:返回子日志集合L

;在得到子日志集合L

后,在每个子日志上使用过程发现算法得到子模型集合M
sib
;子模型合并定义子模型合并为mergeSubModels(s,R,DA)输入:精简过程结构树的根节点s,精简过程结构树中边的集合R,基于精简过程结构树分解得到的重叠活动划分集合DA...

【专利技术属性】
技术研发人员:王路王康刘聪韩晓沈晓林曾庆田
申请(专利权)人:山东科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1