【技术实现步骤摘要】
基于流程树分解和轨迹匹配策略的合规性检测方法与系统
[0001]本专利技术涉及流程挖掘中合规性检测的
,尤其是指一种基于流程树分解和轨迹匹配策略的合规性检测方法、系统、存储介质及计算设备。
技术介绍
[0002]实际的流程执行行为和建模行为可能不匹配,合规性检测可以检测、定位和解释建模行为和观察行为之间的偏差和共性,在评估流程发现算法的质量,改进和修复流程模型,监控实际流程方面发挥了重要作用。基于A
*
的对齐方法提供了细致准确的合规性分析,可以在事件级别精确定位观察到的行为和建模行为之间的偏差。随着信息系统中数据规模的增长,记录的事件数据越来越多,流程模型变得更大更复杂,计算对齐需要搜索的状态空间会随着流程模型复杂度的增加呈指数增长,基于A
*
的对齐方法的性能难以满足实际要求。将流程模型分解可以减小对齐问题的搜索空间,从而提高对齐的计算效率,但当前的分解方法几乎都只关注在某种特定建模语言表示的流程模型的分解,而不适用于各种类型的流程模型。另外,目前的方法主要关注在独立机器上的对齐,计
【技术保护点】
【技术特征摘要】
1.基于流程树分解和轨迹匹配策略的合规性检测方法,其特征在于,包括以下步骤:1)获取基础数据,即事件日志和流程模型,用流程树作为流程模型的建模表示;2)将从步骤1)中所得的流程树分解为子流程树;3)在分布式平台Spark上为事件日志中的轨迹从步骤2)中得到的子流程树中匹配最优子模型;4)进行轨迹和最优子模型的合规性检测;5)重复步骤3)
‑
4),直到完成所有轨迹和其最优子模型的合规性检测,收集合规性检测结果,合并生成整个事件日志的合规性检测结果。2.根据权利要求1所述的基于流程树分解和轨迹匹配策略的合规性检测方法,其特征在于:在步骤1)中,获取事件日志L和流程模型M,所述事件日志是一个有限事件序列的集合,每一个有限事件序列被称为一条轨迹;若流程模型的流程建模表示不是流程树,将之转化为流程树PT,所述流程树是由内部结点和叶结点组成的,其内部结点是操作符结点,操作符结点指定如何从控制流角度组合流程树的子树,叶结点代表活动。3.根据权利要求2所述的基于流程树分解和轨迹匹配策略的合规性检测方法,其特征在于:在步骤2)中,将从步骤1)中所得的流程树分解为子流程树,具体包括以下步骤:2.1)设定分解参数DM,分解选择结点数量的阈值X_CUT是步骤1)中所得流程树PT中根节点为顺序结点、并发结点或选择结点的子树中的选择结点的总数量除以DM,根据X_CUT得到分解流程树的最大层数ML,用公式(1)计算流程树的最大分解层数中能分解选择结点的数目;所述选择结点是流程树的操作符结点,指定执行其子树中的一个子树;所述顺序结点指定按照从左往右的顺序以此执行它的子树;所述并发结点指定其所有子树能够以任意顺序同时执行;N
ML
=X_CUT
‑
N
ML
‑1ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)式中,N
ML
是流程树的最大分解层数ML中分解选择结点的数目,X_CUT是分解选择结点数量的阈值,N
ML
‑1是前ML
‑
1层中选择结点的数量;2.2)初始化设定当前流程树T为PT,设定当前访问结点C_N为流程树PT的根结点,当前层数Layer=1,已分解选择结点数目X_C=0;2.3)首先进行层数判定,Layer>ML时,直接将当前流程树放入子树列表S_T中;Layer=ML时,若最大层已分解选择结点数目X_C大于N
ML
则将当前流程树放入子树列表S_T中,返回子树列表S_T;Layer<ML时,进行下列步骤2.4)
‑
2.7);2.4)判断当前访问结点C_N的类型:
①
若为顺序结点、并发结点或选择结点,则获取当前访问结点C_N的所有子树和子结点,并判断子结点类型进行相应操作:a、若当前结点的子结点全为叶结点和循环结点,不再向下遍历分解子树,此时:若当前结点C_N为顺序操作符或并发操作符,则将当前流程树T放入子树列表S_T中;若当前结点C_N为选择操作符,则将当前结点下的所有子流程树放入子树列表S_T中,并且当L=ML最大层已分解选择结点数目X_C加一;返回子树列表S_T;b、若当前结点的子结点中有顺序结点、并发结点和选择结点,按从左到右的顺序对以这些结点为根节点的所有子树进行遍历分解,设置当前层树Layer=Layer+1,当前流程树T
为子树,当前访问结点C_N为子树根结点;
②
若当前访问结点C_N为循环结点,不再遍历分解,将当前流程树放入子树列表S_T中并返回子树列表S_T;2.5)用列表T_S_T存储返回的子树列表S_T,判断当前结点的类型:
①
若当前结点为选择操作符,将当前结点的所有子树分解得到的列表T_S_T中所有的子树放入子树列表S_T中,返回子树列表S_T;
②
若当前结点为顺序操作符或并发操作符,获取到当前结点的所有子树分解得到的列表T_S_T并放入临时列表temp中,对临时列表temp中所有的子树列表中的子树进行排列组合,获得子树组合的集合COM;2.6)每次从步骤2.5)中获得的COM中取出一个子树组合,将组合中的每棵子树按照其在当前流程树T的当前结点C_N中的位置进行重组:删除流程树T中此位置原来的子树,并将组合中的子树设为当前结点的子树,获得一棵重组流程树放入列表G_T中,遍历COM,直到处理完COM中所有的组合,得到重组流程树的列表G_T,将G_T中所有子树放入子树列表S_T中并返回子树列表S_T;2.7)迭代向下进行步骤2.3)
‑
2.4),直到遍历到叶结点或若最大层已分解选择结点数目X_C大于N
M
;迭代向上进行步骤2.5)
‑
2.6),直到返回流程树PT根结点的子树列表S_T,即为分解流程树P_T得到的所有子流程模型。4.根据权利要求3所述的基于流程树分解和轨迹匹配策略的合规性检测方法,其特征在于,在步骤3)中,在分布式平台Spark上为事件日志中的轨迹从步骤2)中得到的子流程树中匹配最优子模型,具体包括以下步骤:3.1)从Hadoop分布式文件系统中以弹性分布数据集的形式读取步骤1)中...
【专利技术属性】
技术研发人员:刘聪,沈晓林,李会玲,郑凯,李彩虹,王雷,王志强,
申请(专利权)人:山东理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。