针对并发导致的不完备事件日志的块结构过程挖掘方法技术

技术编号:32742831 阅读:9 留言:0更新日期:2022-03-20 08:49
本发明专利技术公开了一种针对并发导致的不完备事件日志的块结构过程挖掘方法,以XES格式描述的事件日志作为输入,以PTML格式描述的过程模型文件作为输出结果;首先使用类似Inductive Miner的方法对不完备的事件日志进行拆分以确定不同块结构与其之间的嵌套关系,对于不能正确拆分的由并发导致的不完备子日志需进一步处理;其次对于子日志使用协同过滤推断可能丢失的传递在前关系,并使用应用在传递在前图上的切分操作进行切分操作;最后根据嵌套关系将所有块结构组合成一个过程树表示的块结构过程模型。本发明专利技术能够处理由并发导致的不完备事件日志,尽可能挖掘出接近于实际的过程模型。过程模型。过程模型。

【技术实现步骤摘要】
针对并发导致的不完备事件日志的块结构过程挖掘方法


[0001]本专利技术属于业务过程领域,具体涉及一种针对并发导致的不完备事件日志的块结构过程挖掘方法。

技术介绍

[0002]在大数据和数字化时代,许多企业都部署了信息系统来更好地管理企业资源,提升运营效率。企业的信息系统在日常运行中,收集记录了大量的事件数据,例如,企业财务审计日志,供应链采购事件数据等。由于企业的业务需求可能会发生变化,导致业务过程可能也会发生变化,管理者要想对当前的业务过程进行改进就需要企业当前真实的业务过程。而企业最近一段时间的事件日志便能体现企业当前真实的业务过程。过程挖掘技术可以这些事件日志中挖掘出业务过程模型,企业管理者可以通过分析过程模型找到“瓶颈”并改进业务过程,从而达到降低运营成本,提高运营效率的目的。
[0003]事件日志包含了许多事件序列,而事件又包括活动名称、发生时间、操作者、动作等信息。目前主流的过程挖掘算法都依赖于高质量的事件日志,比如要求事件日志满足其定义的完备性,才能够保证挖掘出质量较高的过程模型。但是,真实的业务过程中往往包含并发活动,包含并发活动的事件日志往往很难满足过程挖掘算法所需要的完备性,导致挖掘出的过程模型质量较差。

技术实现思路

[0004]本专利技术的目的在于提供一种针对并发导致的不完备事件日志的块结构过程挖掘方法。
[0005]实现本专利技术目的的技术解决方案为:一种针对并发导致的不完备事件日志的块结构过程挖掘方法,根据事件日志信息,挖掘块结构过程模型;以XES格式的事件日志作为输入,以PTML格式的过程模型作为输出,过程模型为一棵过程树,是一种块结构的过程模型,叶子结点为事件日志中的事件,非叶子结点为选择、顺序、循环和并发中的一种,过程树的每一个子树都是一个块结构;该方法具体步骤为:
[0006]步骤1,对于一个事件日志,利用Inductive Miner中基于直接在前关系的切分操作对其包含的事件进行切分,切分操作的结果是若干事件集合,根据事件集合从原事件日志中根据投影拆分出其对应的子日志;此时可得到一棵初步的过程树,切分操作的类型对应于根结点,拆分出的子日志为其孩子结点;继续对子日志重复以上操作进行拆分,直到子日志中只包含一个事件为止;对于无法正常进行拆分的子事件日志,判断其每一条事件序列中是否存在重复和互斥出现的事件,若存在则对于该事件日志返回一个可以产生任何事件序列的块结构鲜花模型,否则进入步骤2;
[0007]步骤2,对步骤1中未能正确处理的子日志,遍历其中的事件序列获取事件之间的传递在前关系,并生成对应的0

1矩阵,矩阵中的元素1表示存在传递在前关系,0表示不存在传递在前关系,其余表示不确定;使用协同过滤对0

1矩阵中不确定的元素进行推断确定
其是否存在传递在前关系;随后根据推断结果生成传递在前图,使用应用在传递在前图上的选择切、顺序切或并发切进行切分操作,并根据拆分结果对事件日志进行拆分;如果可以正常拆分则可获得该子日志对应的块结构,否则返回一个该事件日志对应的鲜花模型;
[0008]步骤3,根据嵌套关系,将所有块结构组合成一个过程树表示的块结构过程模型。
[0009]一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的针对并发导致的不完备事件日志的块结构过程挖掘方法。
[0010]一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的针对并发导致的不完备事件日志的块结构过程挖掘方法。
[0011]相较于Inductive Miner及其衍生算法以及主流的过程挖掘算法Alpha算法,本专利技术可以更好地处理由并发导致的不完备事件日志,挖掘出准确性更高的过程模型,并且所发现的块结构过程模型更容易分析与理解。
附图说明
[0012]图1是本专利技术针对并发导致的不完备事件日志的块结构过程挖掘方法流程图。
[0013]图2是过程树形式展示的过程模型示意图。
[0014]图3是以XES格式描述的事件日志文件示意图。
[0015]图4是解析XES格式的事件日志文件得到的事件序列集合S示意图。
[0016]图5是从事件日志中提取的传递在前矩阵示意图。
[0017]图6是在传递在前图上应用并发切的过程示意图。
具体实施方式
[0018]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0019]本专利技术公开了一种针对并发导致的不完备事件日志的块结构过程挖掘方法,所谓事件日志,是多条事件序列的集合,事件包含了活动名称、时间戳、资源等信息,若只考虑事件名称和时间戳,事件序列可简化为一系列具有先后发生顺序的事件名序列。本专利技术以XES格式描述的事件日志作为输入,以PTML格式描述的过程模型作为输出,具体流程如附图1所示,具体步骤如下:
[0020]步骤1,对于一个事件日志,利用Inductive Miner中基于直接在前关系的切分操作(选择切、顺序切、循环切和并发切)对其包含的事件进行切分,并根据切分结果对事件日志进行拆分,直到子日志中仅包含一个事件为止,具体步骤如下:
[0021]步骤1

1,对不完备事件日志使用Inductive Miner中定义的基于直接在前关系的切分操作进行拆分以确定不同的块结构与其之间的嵌套关系,直到子日志中只含有一个事件(即无法继续拆分),对于无法正常拆分的子日志需进一步处理;
[0022]步骤1

2,对于步骤1

1中无法正常处理的子日志,判断其包含的每一个事件序列
中是否存在重复事件或互斥出现的事件(即是否对应于一个循环或选择结构),如果是则对该事件日志返回一个块结构的鲜花模型,否则需进一步处理;
[0023]步骤2,对步骤1中未能正确处理的子日志,遍历其中的事件序列获取事件之间的传递在前关系,并生成对应的0

1矩阵,矩阵中的元素1表示存在传递在前关系,0表示不存在传递在前关系,其余表示不确定;使用协同过滤对0

1矩阵中不确定的元素进行预测确定其是否存在传递在前关系;随后根据预测结果生成传递在前图,使用应用在传递在前图上的选择切、顺序切或并发切进行切分操作,并根据切分结果对事件日志进行拆分;如果可以正常拆分则可以获得该子日志对应的块结构,否则返回一个该事件日志对应的鲜花模型,具体步骤如下:
[0024]步骤2

1,对步骤1中未能处理的子日志遍历所有事件序列,获取所有存在传递在前关系的事件对。具体包括:任意一条事件序列{a1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种针对并发导致的不完备事件日志的块结构过程挖掘方法,其特征在于,根据事件日志信息,挖掘块结构过程模型;以XES格式的事件日志作为输入,以PTML格式的过程模型作为输出,过程模型为一棵过程树,是一种块结构的过程模型,叶子结点为事件日志中的事件,非叶子结点为选择、顺序、循环和并发中的一种,过程树的每一个子树都是一个块结构;该方法具体步骤为:步骤1,对于一个事件日志,利用Inductive Miner中基于直接在前关系的切分操作对其包含的事件进行切分,切分操作的结果是若干事件集合,根据事件集合从原事件日志中根据投影拆分出其对应的子日志;此时可得到一棵初步的过程树,切分操作的类型对应于根结点,拆分出的子日志为其孩子结点;继续对子日志重复以上操作进行拆分,直到子日志中只包含一个事件为止;对于无法正常进行拆分的子事件日志,判断其每一条事件序列中是否存在重复和互斥出现的事件,若存在则对于该事件日志返回一个可以产生任何事件序列的块结构鲜花模型,否则进入步骤2;步骤2,对步骤1中未能正确处理的子日志,遍历其中的事件序列获取事件之间的传递在前关系,并生成对应的0

1矩阵,矩阵中的元素1表示存在传递在前关系,0表示不存在传递在前关系,其余表示不确定;使用协同过滤对0

1矩阵中不确定的元素进行推断确定其是否存在传递在前关系;随后根据推断结果生成传递在前图,使用应用在传递在前图上的选择切、顺序切或并发切进行切分操作,并根据拆分结果对事件日志进行拆分;如果可以正常拆分则可获得该子日志对应的块结构,否则返回一个该事件日志对应的鲜花模型;步骤3,根据嵌套关系,将所有块结构组合成一个过程树表示的块结构过程模型。2.根据权利要求1所述的针对并发导致的不完备事件日志的块结构过程挖掘方法,其特征在于,所述步骤1具体为:步骤1

1,对不完备事件日志使用Inductive Miner中定义的基于直接在前关系的切分操作进行拆分以确定不同的块结构与其之间的嵌套关系,直到子日志中只含有一个事件,对于无法正常拆分的子日志需进一步处理;步骤1

2,对于步骤1

1中无法正常处理的子日志,判断其包含的每一个事件序列中是否存在重复事件或互斥出现的事件,如果是则对该事件日志返回一个块结构的鲜花模型,否则需进一步处理。3.根据权利要求1所述的针对并发导致的不完备事件日志的块结构过程挖掘方法,其特征在于,步骤1中所述的切分操作包括选择切、顺序切、循环切和并发切。4.根据权利要求1所述的针对并发导致的不完备事件日志的块结构过程挖掘方法,其特征在于,所述步骤2具体为:步骤2

1,对步骤1中未能处理的子日志遍历所有事件序列,获取所有存在传递在前关系的事件对;具体包括:任意一条事件序列{a1,a2,a3,
……
,a
n
‑1,a
n
},包含n个事件,其中a
i
表示事件i,这n个事件按照发生先后顺序排列,可获得N*(N

1)/2组的传递在前关系对:a1>a2,a1>a3,

,a1>a
n
,a2>a3,a2>a4,

,a2>a
n
,

,a
n
‑1>a
n
;其中,a
i
>a
j
代表事件a
i
传递发生在事件a
j
之前;根据事件之间的传递在前关系生成传递在前0

1矩阵,矩阵中的第一行、第一列均为事件名称,其余元素若为1表示该元素对应的事件对之间存在传递在前关系,为0表示不存在传递在前关系,其他表示不确定是否存在传递在前关系;步骤2

2,对于0

1矩阵中不确定的元素所对应的事件对<a
i
,a
j
>,记a
i
所在行向量[a1,
a2,
……
,a
i
‑1,a
i...

【专利技术属性】
技术研发人员:瞿鹏杨帅豪谭泽亚肖芳雄宋巍
申请(专利权)人:南京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1