【技术实现步骤摘要】
针对并发导致的不完备事件日志的块结构过程挖掘方法
[0001]本专利技术属于业务过程领域,具体涉及一种针对并发导致的不完备事件日志的块结构过程挖掘方法。
技术介绍
[0002]在大数据和数字化时代,许多企业都部署了信息系统来更好地管理企业资源,提升运营效率。企业的信息系统在日常运行中,收集记录了大量的事件数据,例如,企业财务审计日志,供应链采购事件数据等。由于企业的业务需求可能会发生变化,导致业务过程可能也会发生变化,管理者要想对当前的业务过程进行改进就需要企业当前真实的业务过程。而企业最近一段时间的事件日志便能体现企业当前真实的业务过程。过程挖掘技术可以这些事件日志中挖掘出业务过程模型,企业管理者可以通过分析过程模型找到“瓶颈”并改进业务过程,从而达到降低运营成本,提高运营效率的目的。
[0003]事件日志包含了许多事件序列,而事件又包括活动名称、发生时间、操作者、动作等信息。目前主流的过程挖掘算法都依赖于高质量的事件日志,比如要求事件日志满足其定义的完备性,才能够保证挖掘出质量较高的过程模型。但是,真实的业务过程中往往包含并发活动,包含并发活动的事件日志往往很难满足过程挖掘算法所需要的完备性,导致挖掘出的过程模型质量较差。
技术实现思路
[0004]本专利技术的目的在于提供一种针对并发导致的不完备事件日志的块结构过程挖掘方法。
[0005]实现本专利技术目的的技术解决方案为:一种针对并发导致的不完备事件日志的块结构过程挖掘方法,根据事件日志信息,挖掘块结构过程模型;以XES格式的事 ...
【技术保护点】
【技术特征摘要】
1.一种针对并发导致的不完备事件日志的块结构过程挖掘方法,其特征在于,根据事件日志信息,挖掘块结构过程模型;以XES格式的事件日志作为输入,以PTML格式的过程模型作为输出,过程模型为一棵过程树,是一种块结构的过程模型,叶子结点为事件日志中的事件,非叶子结点为选择、顺序、循环和并发中的一种,过程树的每一个子树都是一个块结构;该方法具体步骤为:步骤1,对于一个事件日志,利用Inductive Miner中基于直接在前关系的切分操作对其包含的事件进行切分,切分操作的结果是若干事件集合,根据事件集合从原事件日志中根据投影拆分出其对应的子日志;此时可得到一棵初步的过程树,切分操作的类型对应于根结点,拆分出的子日志为其孩子结点;继续对子日志重复以上操作进行拆分,直到子日志中只包含一个事件为止;对于无法正常进行拆分的子事件日志,判断其每一条事件序列中是否存在重复和互斥出现的事件,若存在则对于该事件日志返回一个可以产生任何事件序列的块结构鲜花模型,否则进入步骤2;步骤2,对步骤1中未能正确处理的子日志,遍历其中的事件序列获取事件之间的传递在前关系,并生成对应的0
‑
1矩阵,矩阵中的元素1表示存在传递在前关系,0表示不存在传递在前关系,其余表示不确定;使用协同过滤对0
‑
1矩阵中不确定的元素进行推断确定其是否存在传递在前关系;随后根据推断结果生成传递在前图,使用应用在传递在前图上的选择切、顺序切或并发切进行切分操作,并根据拆分结果对事件日志进行拆分;如果可以正常拆分则可获得该子日志对应的块结构,否则返回一个该事件日志对应的鲜花模型;步骤3,根据嵌套关系,将所有块结构组合成一个过程树表示的块结构过程模型。2.根据权利要求1所述的针对并发导致的不完备事件日志的块结构过程挖掘方法,其特征在于,所述步骤1具体为:步骤1
‑
1,对不完备事件日志使用Inductive Miner中定义的基于直接在前关系的切分操作进行拆分以确定不同的块结构与其之间的嵌套关系,直到子日志中只含有一个事件,对于无法正常拆分的子日志需进一步处理;步骤1
‑
2,对于步骤1
‑
1中无法正常处理的子日志,判断其包含的每一个事件序列中是否存在重复事件或互斥出现的事件,如果是则对该事件日志返回一个块结构的鲜花模型,否则需进一步处理。3.根据权利要求1所述的针对并发导致的不完备事件日志的块结构过程挖掘方法,其特征在于,步骤1中所述的切分操作包括选择切、顺序切、循环切和并发切。4.根据权利要求1所述的针对并发导致的不完备事件日志的块结构过程挖掘方法,其特征在于,所述步骤2具体为:步骤2
‑
1,对步骤1中未能处理的子日志遍历所有事件序列,获取所有存在传递在前关系的事件对;具体包括:任意一条事件序列{a1,a2,a3,
……
,a
n
‑1,a
n
},包含n个事件,其中a
i
表示事件i,这n个事件按照发生先后顺序排列,可获得N*(N
‑
1)/2组的传递在前关系对:a1>a2,a1>a3,
…
,a1>a
n
,a2>a3,a2>a4,
…
,a2>a
n
,
…
,a
n
‑1>a
n
;其中,a
i
>a
j
代表事件a
i
传递发生在事件a
j
之前;根据事件之间的传递在前关系生成传递在前0
‑
1矩阵,矩阵中的第一行、第一列均为事件名称,其余元素若为1表示该元素对应的事件对之间存在传递在前关系,为0表示不存在传递在前关系,其他表示不确定是否存在传递在前关系;步骤2
‑
2,对于0
‑
1矩阵中不确定的元素所对应的事件对<a
i
,a
j
>,记a
i
所在行向量[a1,
a2,
……
,a
i
‑1,a
i...
【专利技术属性】
技术研发人员:瞿鹏,杨帅豪,谭泽亚,肖芳雄,宋巍,
申请(专利权)人:南京理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。