一种基于轨迹聚类的流程漂移定位方法及系统技术方案

技术编号：40225540 阅读：4 留言：0更新日期：2024-02-02 22:29

本发明专利技术提供S1：获取业务流程系统中第w段事件日志流的轨迹，将轨迹放入轨迹窗口，获得轨迹集合T<subgt;w</subgt;；w为事件日志流的段编号；S2：对轨迹集合T<subgt;w</subgt;内的各轨迹进行编码，获得轨迹特征向量集合F<subgt;w</subgt;；S3：对轨迹特征向量集合F<subgt;w</subgt;进行聚类获得集群G<subgt;w</subgt;；计算获得集群G<subgt;w</subgt;的轮廓系数M<subgt;w</subgt;；S4：对轮廓系数M<subgt;w</subgt;进行边界判断；若M<subgt;w</subgt;没有超出边界，则令w=w+1，返回步骤S1；否则进入步骤S5；S5：通过集群G<subgt;w</subgt;和G<subgt;w‑1</subgt;计算获得流程漂移的定位结果，令w=w+1，返回步骤S1。本发明专利技术通过轮廓系数的边界判断可以精确的判定是否发生流程漂移，再通过前后两段事件日志流的集群计算获得流程漂移的定位结果，实现业务流程在运行时自动的流程漂移精确定位。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及流程漂移检测领域，尤其涉及一种基于轨迹聚类的流程漂移定位方法及系统。

技术介绍

1、业务流程是组织为了实现特定的业务目标，根据先验知识设计的一系列相互关联的任务活动。业务流程通常是结构化和规范化的，以确保高效、可控和可重复的工作流程。

2、流程发现可以分析业务数据，特别是事件日志，来自动地识别组织内部的工作流程的实际执行过程，提取业务流程模型。

3、然而，由于需求增加、人员变动、环境变化、设备故障等不可预知的问题，业务流程的结构和流程中不同活动的参数、输入或输出可能发生变化，业务流程的运行状况会偏离预期，发生不可预测的漂移，而现有技术缺少对于流程漂移精确的定位方法，无法在发生漂移后及时根据漂移定位结果进行模型调整，导致已建立的业务流程模型性能下降或失效。

技术实现思路

1、为解决上述技术问题，本专利技术提供一种基于轨迹聚类的流程漂移定位方法，包括：

2、s1：获取业务流程系统中第w段事件日志流的轨迹，将轨迹放入轨迹窗口，获得轨迹集合tw；w为事件日志流的段编号；

3、s2：对轨迹集合tw内的各轨迹进行编码，获得轨迹特征向量集合fw；

4、s3：对轨迹特征向量集合fw进行聚类获得集群gw；计算获得集群gw的轮廓系数mw；

5、s4：对轮廓系数mw进行边界判断；若mw没有超出边界，则令w=w+1，返回步骤s1；否则进入步骤s5；

6、s5：通过集群gw和gw-1计算获得流程漂移的定位结果，令w=w+1，返回步骤s1。

7、优选的，步骤s1具体为：

8、s11：获取第w段事件日志流lw=<e1, e2, e3, …,ek>，其中ek=(x, ak, k)为第k个事件，x为轨迹标识，ak为活动类型；

9、s12：按照时间依次遍历事件日志流lw，当事件日志流lw中出现活动类型为结束活动的事件er时，提取与事件er具有相同轨迹标识的所有事件，r为事件的编号；按照时间顺序将事件进行排列获得一条轨迹，将该轨迹放入轨迹窗口；

10、s13：重复步骤s12直至轨迹窗口内轨迹的数量等于固定窗口大小n，此时获得轨迹集合tw=<t1, t2, …, tn>，其中，tn表示第n个轨迹。

11、优选的，步骤s2具体为：

12、s21：获取业务流程系统中包含的活动类型集合a={a1, a2, …, am}，其中，m为活动类型的总数，am为第m个活动类型；

13、s22：在轨迹集合tw中提取轨迹ti，i为轨迹的编号；生成轨迹ti的活动转换矩阵tran(ti)∈nm×m，其中，n为自然数集，tran(ti)为m行m列的矩阵，tran(ti)的第p行第q列表示轨迹ti中执行活动转换ap→aq的次数，其中1≤p≤m, 1≤q≤m；

14、s23：将活动转换矩阵tran(ti)平铺，获得轨迹ti的轨迹特征向量；

15、s24：重复步骤s22-s23，获得轨迹特征向量集合fw={f1, f2, …, fn}，n为轨迹窗口的大小。

16、优选的，步骤s3具体为：

17、s31：设定聚类质心个数为u，对轨迹特征向量集合fw={f1, f2, …, fn}进行聚类，获得集群gw={c1w, c2w, .., cuw}，其中，n为轨迹窗口的大小，fn为第n个轨迹特征向量，cuw表示集群gw中第u个簇；

18、s32：计算获得集群gw的轮廓系数mw，计算公式为：

19、

20、其中，i为轨迹的编号，fi为第i个轨迹特征向量，表示轨迹特征向量fi在集群gw中的内聚度，表示轨迹特征向量fi在集群gw中的分离度。

21、优选的，步骤s4具体为：

22、s41：获取历史轮廓系数集合hw=<mw-h, mw-h+1, …, mw-1>，其中h为事件日志流的历史段数量；

23、s42：计算获得轮廓系数mw的下边界bd和上边界bu，计算公式为：

24、bd=(1-λ)×mean(hw)

25、bu=(1+λ)×mean(hw)

26、其中，λ为波动容忍阈值，mean(hw)表示历史轮廓系数集合的均值；

27、s43：若bd＜mw＜bu，则判断第w段事件日志流内没有发生流程漂移，令w=w+1，返回步骤s1；否则判断第w段事件日志流内发生了流程漂移，进入步骤s5。

28、优选的，步骤s5具体为：

29、s51：对于轨迹特征向量的每一维度d，计算获得集群gw和gw-1中每对匹配簇cvw和cvw-1的质心cvw和cvw-1在维度d上的位置变化mse(d)，计算公式如下：

30、

31、其中，d表示轨迹特征向量的维度编号，v表示簇的编号，cv,dw和cv,dw-1分别表示质心cvw和cvw-1在维度d上的取值；1≤v≤u，1≤d≤m2，u为聚类质心个数，m2为活动转换矩阵的大小；

32、s52：重复步骤s51，获得位置变化最大的维度d’，即；

33、s53：计算获得流程漂移的定位行p’=d’//m和流程漂移的定位列q’=d’%m，其中//为取整，%为取余；

34、s54：将活动转换ap’→aq’作为流程漂移的定位结果；其中，ap’表示第p’个活动类型，aq’表示第q’个活动类型；令w=w+1，返回步骤s1。

35、一种存储设备，所述存储设备存储指令及数据用于实现所述的基于轨迹聚类的流程漂移定位方法。

36、一种基于轨迹聚类的流程漂移定位系统，包括：处理器及存储设备；所述处理器加载并执行所述存储设备中的指令及数据用于实现所述的基于轨迹聚类的流程漂移定位方法。

37、本专利技术具有以下有益效果：

38、通过事件日志流中的轨迹集合计算获得轨迹特征向量集合，通过轨迹特征向量集合可计算获得每段事件日志流的集群的轮廓系数，通过轮廓系数的边界判断可以精确的判定是否发生流程漂移，再通过前后两段事件日志流的集群计算获得流程漂移的定位结果，实现业务流程在运行时自动的流程漂移精确定位，有助于更好地理解流程行为。

本文档来自技高网...

【技术保护点】

1.一种基于轨迹聚类的流程漂移定位方法，其特征在于，包括：

2.根据权利要求1所述的基于轨迹聚类的流程漂移定位方法，其特征在于，步骤S1具体为：

3.根据权利要求1所述的基于轨迹聚类的流程漂移定位方法，其特征在于，步骤S2具体为：

4.根据权利要求1所述的基于轨迹聚类的流程漂移定位方法，其特征在于，步骤S3具体为：

5.根据权利要求1所述的基于轨迹聚类的流程漂移定位方法，其特征在于，步骤S4具体为：

6.根据权利要求1所述的基于轨迹聚类的流程漂移定位方法，其特征在于，步骤S5具体为：

7.一种存储设备，其特征在于：所述存储设备存储指令及数据用于实现权利要求1~6任一项所述的基于轨迹聚类的流程漂移定位方法。

8.一种基于轨迹聚类的流程漂移定位系统，其特征在于：包括：处理器及存储设备；所述处理器加载并执行所述存储设备中的指令及数据用于实现权利要求1~6任一项所述的基于轨迹聚类的流程漂移定位方法。

【技术特征摘要】

1.一种基于轨迹聚类的流程漂移定位方法，其特征在于，包括：

2.根据权利要求1所述的基于轨迹聚类的流程漂移定位方法，其特征在于，步骤s1具体为：

3.根据权利要求1所述的基于轨迹聚类的流程漂移定位方法，其特征在于，步骤s2具体为：

4.根据权利要求1所述的基于轨迹聚类的流程漂移定位方法，其特征在于，步骤s3具体为：

5.根据权利要求1所述的基于轨迹聚类的流程漂移定位方法，其特征在于，步骤s4具...

【专利技术属性】
技术研发人员：裴学良，袁水平，蔡汝坚，郑超，王健，
申请(专利权)人：安徽思高智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人