【技术实现步骤摘要】
一种数据驱动下基于人工智能的活动时序在线预测方法
[0001]本专利技术涉及业务流程监控领域,尤其涉及一种数据驱动下基于人工智能的活动时序在线预测方法。
技术介绍
[0002]业务流程是为达到特定的价值目标而由不同的人分别完成的一系列活动。业务流程挖掘作为数据挖掘在业务流程管理上的应用,旨在通过分析业务流程的事件日志,实现对业务流程的发现、建模、监控和改进。近年来,业务流程挖掘的重点不再局限于提供事件日志的脱机分析,而转向为业务流程优化提供在线支持,即实现预测性业务流程监控(Predictive Process Monitoring,PPM)。
[0003]准确预测正在执行的流程实例的剩余活动时序是PPM研究中最直观的一种问题,有利于及时发现流程执行中的违规行为。Lakshmanan等人在2013年提出一种特定于实例的概率过程模型,通过学习每个节点的决策树来计算模型中各个边的单步转移概率并将模型映射为空间马尔科夫链,实现对未来执行任务的预测,该方法思路新颖,但其预测仅基于当前状态而与前面状态无关,并不符合业务流程的实 ...
【技术保护点】
【技术特征摘要】
1.一种数据驱动下基于人工智能的活动时序在线预测方法,其特征在于包括以下步骤:S1.输入原始日志文件其中由条流程轨迹σ=<e1,e2,e3,...,e
|σ|
>组成,每条流程轨迹σ由|σ|个事件e=(CaseID,Activity,Resource,StartTime,CompleteTime,attr1,attr2,...attr
N
)组成,其中CaseID代表事件所属的实例,Activity代表事件执行的活动,Resource代表事件执行所需的资源,StartTime和CompleteTime分别代表该事件的开始时间和结束时间,attr1,attr2,...attr
N
代表该事件的其余N个属性,日志的活动集合被记为A;S2.扩充日志中事件的时间属性;S3.根据CompleteTime对中的流程轨迹排序后得到训练数据;S4.将训练数据中的流程轨迹拆分为前缀轨迹和对应的后缀轨迹,前缀轨迹pt=<e1,e2,...,e
k
>为轨迹σ的前k个事件,而其对应的后缀轨迹st为轨迹σ的后|σ|
‑
k个事件;S5.使用过程挖掘算法从训练数据中挖掘Petri网PN;S6.使用重演技术将训练数据中的每个前缀轨迹pt在S5挖掘得到的Petri网上进行重演,并获取其行为上下文信息BehavContext(pt);S7.使用LSTM模型挖掘已执行信息与未来执行信息之间的关系,进而预测训练数据中每个前缀轨迹pt的数据上下文信息DataContext(pt),具体包括以下子步骤:S71.将训练数据中的前缀轨迹与其后缀轨迹进行特征编码,得到前缀编码矩阵与后缀编码矩阵;S72.将前缀编码矩阵与后缀编码矩阵统一扩充至维度L*m,即对前缀编码矩阵采用后向零填充法,对后缀编码矩阵采用前向零填充法,其中L表示日志中最长轨迹的事件数,m表示编码之后的属性维度,将扩充后的前缀编码矩阵记为EM(pt),将扩充后的后缀编码矩阵记为EM(st);S73.使用降维技术对后缀编码矩阵进行降维处理,经过降维之后后缀轨迹st的编码矩阵被记为EM
′
(st);S74.将训练数据中的前缀编码矩阵EM(pt)与经过降维之后的后缀编码矩阵EM
′
(st)分别作为LSTM模型的输入与输出进行参数学习,训练得到预测模型S75.将待预测轨迹进行编码之后输入S74训练得到的模型输出后缀编码矩阵作为其数据上下文pt为待预测轨迹;S8.将训练数据中的轨迹视为历史轨迹,通过双重计算相似度实现对待预测轨迹的剩余活动时序预测,具体包含以下子步骤:S81.利用S6中的重演技术获取待预测轨迹pt
′
的行为上下文BehavContext(pt
′
),计算其与训练数据中所有前缀轨迹的行为相似度TBS(σ1,σ2),然后从中选取TBS(σ1,σ2)最大的候选前缀轨迹集合S
pt
′
,其计算公式如下所示:
其中,Eq
ij
表示两条轨迹σ1,σ2在执行第i个活动之后在第j个库所的托肯数量的等价性,BehavContext(σ1)
ij
表示σ1在执行第i个活动之后在第j个库所的托肯数量,BehavContext(σ2)
ij
表示σ2在执行第i个活动之后在第j个库所的托肯数量,|σ1|和|σ2|分别代表轨迹σ1和σ2的事件数,|P|代表Petri网中库所的数量;S82.根据步骤S7为待预测轨迹的前缀轨迹pt得到其数据上下文DataContext(pt
′
),计算其与步骤S81中得到的候选前缀轨迹集合S
pt
′
中所有前缀轨迹的欧式距离,从中筛选出欧式距离最小的前缀轨迹记为pt
sim
,其计算公式如下:pt
sim
=Argmin ED(pt,pt
i
),pt
i
∈S
pt
其中,ED()表示求解两条轨迹间的欧式距离的函数;S83.将pt
sim
的剩余活动时序赋给待预测序列pt
′
作为其预测的剩余活动时序。2.根据权利要求3所述的一种数据驱动下基于人工智能的活动时...
【专利技术属性】
技术研发人员:孙笑笑,叶春毅,应钰柯,俞东进,
申请(专利权)人:杭州电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。