【技术实现步骤摘要】
一种基于精简过程结构树分解的过程发现方法
[0001]本专利技术涉及过程模型挖掘领域,具体涉及一种基于精简过程结构树分解的过程发现方法。
技术介绍
[0002]现有支持并行过程挖掘的日志分割方法有两类:垂直分割和水平分割。可以将日志分解为若干子日志,使子日志可以分布式处理,从而实现并行化。垂直分割基于日志中案例分组划分,即:根据案例某些特定标准划分案例。案例长度,案例包含的活动集合,客户类型,案例起始时间,持续时间等都可以作为案例划分依据。例如,使用案例开始时间进行日志划分,可以分析挖掘模型随时间推移的变化情况。轨迹聚类是基于日志中案例分组的划分方法,目前已被用于改进过程挖掘的结果。例如,基于向量空间模型的聚类方法,基于上下文感知的轨迹聚类方法,基于模型的序列聚类方法等。目前用于并行化过程挖掘的垂直分割方法较少。
[0003]现有分解并行过程挖掘主要是事件日志的水平划分。水平分割最常见的是基于事件划分。日志案例由事件组成,最终转化为事件所对应活动集合的划分问题。目前划分活动集合的较好方法是首先构造出因果结构,对因果依赖图进行划分得到重叠活动子集。
[0004]Passage技术将因果结构划分为多个passage片段,其中,passage片段是一个非空节点集(X,Y),其中集合X中顶点是集合Y中顶点的直接前驱,而集合Y中顶点的直接前驱是X中的顶点。然而,Passage技术不以“高内聚”,“低耦合”为目标,且存在活动划分不均匀的问题,总挖掘时间取决于最大passage对应的子日志上的挖掘时间。
[
【技术保护点】
【技术特征摘要】
1.一种基于精简过程结构树分解的过程发现方法,其特征在于,包括以下步骤:定义SESE片段轨迹投影假设A
i
是通过精简过程结构树划分得到的活动子集,A
i.Entry
和A
i.Exit
分别表示活动子集Ai的入口活动和出口活动,σ(i)表示轨迹第i个位置上的事件,|σ|表示轨迹长度,当且仅当:(1)σ(1)=A
i.Entry
∧σ(|σ|)=A
i.Exit
;(2)则称S
SESE
为基于SESE片段的轨迹投影;生成子日志输入:事件日志L,基于精简过程结构树分解得到的重叠活动划分集合DA={A1,A2,
…
,A
n
};输出:子日志集合L
′
;步骤1.1:将子日志集合L
′
初始化为空;步骤1.2:遍历重叠活动划分集合DA中的每一个元A
i
;步骤1.3:每一个元A
i
都创建一个对应的事件日志L
i
;步骤1.4:遍历事件日志L中的每一条轨迹;步骤1.5:如果A
i
的入口活动在出口活动前,则对入口活动和出口活动之间的序列在A
i
上投影,如果A
i
的入口活动和出口活动之间不存在因果关系,则将投影序列中的每一条基于SESE片段的投影作为对应的事件日志L
i
的一条轨迹;如果A
i
的入口活动和出口活动之间存在因果关系,则将投影序列作为对应的事件日志L
i
的一条轨迹;步骤1.6:将对应的事件日志L
i
加入子日志集合L
′
中;步骤1.7:如果A
i
≠A
n
则执行步骤1.2,否则执行步骤1.8;步骤1.8:返回子日志集合L
′
;在得到子日志集合L
′
后,在每个子日志上使用过程发现算法得到子模型集合M
sib
;子模型合并定义子模型合并为mergeSubModels(s,R,DA)输入:精简过程结构树的根节点s,精简过程结构树中边的集合R,基于精简过程结构树分解得到的重叠活动划分集合DA...
【专利技术属性】
技术研发人员:王路,王康,刘聪,韩晓,沈晓林,曾庆田,
申请(专利权)人:山东科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。