【技术实现步骤摘要】
基于因果推断的流程时间异常根因追溯分析方法与系统
[0001]本专利技术涉及业务流程挖掘的
,尤其是指一种基于因果推断的流程时间异常根因追溯分析方法与系统
。
技术介绍
[0002]流程挖掘是一系列可以从历史事件数据中提取有价值信息的技术,经典的流程挖掘技术是指从现有事件日志中挖掘知识以发现
、
监控和改进实际流程
。
这些技术能够帮助企业提高生产效率和产品质量,增强企业的竞争力
。
然而随着企业对于业务流程的监管和效率越发重视,对于业务流程瓶颈
、
异常或超时原因的洞察得到了广泛的关注,并开展了相关研究
。
对于问题背后原因的探究工作称之为根本原因分析,简称根因分析
。
[0003]根因分析的目的是找到某现象
(
风险
)
背后的原因及其可控的相关原因,针对可变原因提出解决和优化方案以避免或缓解风险
。
根因分析通常结合领域知识,即该现象
(
风险
)
是已知的,是基于流程发现
、
合规性检查和预测性监控等技术中发现的问题或实际流程执行过程中常遇到的问题
。
通过建模
、
信息提取等技术分析具体问题,提出对应的解决方案
。
目前对于流程中现象
(
风险
)
的根因分析应用的方法主要包含日志信息丰富方法
、
决策树算法<
【技术保护点】
【技术特征摘要】
1.
基于因果推断的流程时间异常根因追溯分析方法,其特征在于,包括以下步骤:
1)
业务理解与事件日志预处理:理解真实业务流程,区分事件日志的案例与事件级别属性,删除重复属性,扩展时间信息,添加工作负载,离散化数值属性;
2)
生成案例超时因果假设,确定潜在原因:生成基于时间性能的案例超时因果假设,从步骤
1)
预处理的日志中选取案例级别属性
、
案例开始时间
、
同时期案例的工作负载,生成案例变体
、
捆绑活动及其执行时间共同作为案例超时的潜在原因;
3)
案例超时原因检验:将步骤
2)
中确定的潜在原因应用
Kleinberg
的因果推断方法进行原因检验,删除未增加超时发生概率的初步原因,计算候选原因的
epsilon
值;
4)
因果关系假设检验:将步骤
3)
的候选原因进行假设检验,采用误发现率
FDR
作为评估指标,若某候选原因的
FDR
小于给定阈值则说明其为根本原因;
5)
生成事件超时因果假设,确定潜在原因,检验因果关系:若步骤
4)
中根本原因为事件超时,则生成基于时间性能的事件超时因果假设,从步骤
1)
预处理的日志中选取事件级别属性
、
事件开始时间
、
同时期事件的工作负载
、
资源同时期处理事件的工作负载,生成的流程轨迹前缀
、
捆绑前缀事件的活动与资源共同作为潜在原因,采用步骤
3)、4)
的检验方法得到事件超时的根本原因;
6)
超时根本原因分析:将步骤
4)、5)
得到的超时原因进行可视化,并根据
epsilon
值的排序展示其它相关原因,方便用户直观了解导致超时的根本原因和其它相关原因
。2.
根据权利要求1所述的基于因果推断的流程时间异常根因追溯分析方法,其特征在于,所述步骤
1)
包括以下步骤:
1.1)
根据事件日志和业务背景,了解其具体的业务流程;
1.2)
对步骤
1.1)
中的事件日志进行预处理,区分事件日志的案例与事件级别属性,删除无关
、
重复属性,将时间戳扩展为5个数值属性,包括执行时间
、
总执行时间
、
月份
、
日期和星期,计算案例
、
事件及同一类型事件中资源的工作负载,并将所有的数值属性进行离散化处理,即根据四分之一分位数
、
四分之三分位数划分为三类
。3.
根据权利要求2所述的基于因果推断的流程时间异常根因追溯分析方法,其特征在于,所述步骤
2)
包括以下步骤:
2.1)
生成基于时间性能的案例超时因果假设的结果,统计步骤
1)
预处理后的案例执行时间,以最大案例的执行时间乘以一个给定阈值作为超时案例的判断标准,或用户制定具体的案例执行所需时长,根据确定时长将所有超时案例进行筛选并标记其为“案例超时”;
2.2)
确定案例超时因果假设的潜在原因,从步骤
1)
预处理的事件日志中选择可能为案例超时原因的属性,包括案例级别属性
、
案例开始时间
、
同时期案例的工作负载,以及生成的案例变体
、
活动与其执行时间的捆绑属性共同作为潜在原因;所述案例级别属性是指在案例的整个生命周期中不会变化的属性;所述案例开始时间包含案例开始时间戳中的月
、
星期
、
日期;所述同时期案例的工作负载是指在某案例的生命
周期中,与其执行时间有重叠的案例个数
。4.
根据权利要求3所述的基于因果推断的流程时间异常根因追溯分析方法,其特征在于,在步骤
3)
中,将步骤
2)
中确定的潜在原因应用
Kleinberg
的因果推断方法进行原因检验,具体检验方法如下:
3.1)
初步原因筛选,删除未增加超时发生概率的潜在原因,判断方法如下:式中,
e
表示超时案例,
c
表示某潜在原因,
cases
表示所有案例,
P(e)
为超时案例发生的概率,
P(e|c)
为在潜在原因
c
发生的案例中案例超时的概率,若
P(e|c)>P(e)
,则说明潜在原因
c
增加了超时案例
e
发生的概率,保留该原因,否则删除该原因,经过初步筛选后的潜在原因集合称为候选原因;
3.2)
计算候选原因的
epsilon
值,由于步骤
3.1)
筛选出的候选原因中存在虚假原因,为了将虚假原因与真实原因进行区分,采用
epsilon
值作为因果关系的衡量标准,为后续进行假设检验,
epsilon
值的计算方法由
Kleinberg
提出,记为
ε
avg
,其计算公式如下:,其计算公式如下:,其计算公式如下:,其计算公式如下:式中,
x
表示除
c
以外的某候选原因,
X
为所有除
c
以外的候选原因集合,
P(e|c∧x)
表示在候选原因
c
和
x
共同发生的案例中案例超时的概率,表示在候选原因
c
不发生和
x
发生的案例中案例超时的概率,
ε
x
(c,e)
表示在候选原因
x
发生的情况下
c
是否发生对于超时案例发生的概率变化,
ε
avg
(c,e)
为在所有其它候选原因的影响下
c
是否发生对于超时案例发生的概率变化平均值,即表示
c
的发生对于超时案例发生的影响,所有候选原因都计算一个
epsilon
值
。5.
根据权利要求4所述的基于因果推断的流程时间异常根因追溯分析方法,其特征在于,在步骤
4)
中,将步骤
3)
所有候选原因的
epsilon
值作为假设检验的基础,采用误发现率
FDR
进行评估,得到影响案例超时的根本原因,包括以下步骤:
4.1)
计算候选原因
epsilon
值的
z
‑
value
值,计算...
【专利技术属性】
技术研发人员:刘聪,郭娜,陆婷,李彩虹,孟晓亮,李静,王志强,
申请(专利权)人:山东理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。