【技术实现步骤摘要】
基于深度学习的业务流程完成时间区间预测方法和系统
[0001]本专利技术涉及业务流程预测性监控
,具体地,涉及一种基于深度学习的业务流程完成时间区间预测方法和系统。
技术介绍
[0002]预测性业务流程监控是指基于事件日志和业务流程的历史数据,生成有关业务流程的实时运行案例相关指标的预测。完成时间是业务流程的一项重要指标,业务流程有着时序性,在一定程度上可以理解为词汇表很小的语言模型,因此基于循环神经网络的业务流程时间预测模型被提出。然而,以往的模型预测的都是一个时间“点”值,考虑到业务流程执行过程中的不确定性,业务流程的完成时间实际上也有不确定性,单单用一个时间点来表征预计完成时间通常是不准确的。另外,时间点值不能为用户提供最好和最坏情况的估计,使得预测性监控缺失了很多实用性。
[0003]专利文献CN110209467A(申请号:CN201910437262.7)公开了一种基于机器学习的弹性资源扩展方法和系统,属于云计算
与深度学习领域,包括:在已知待运行任务的运行截止时限t
d
和任 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度学习的业务流程完成时间区间预测方法,其特征在于,包括:步骤1:基于窗口长度进行前缀特征提取;步骤2:基于长短期记忆网络构建上下界预测模型;步骤3:基于越界惩罚建立损失函数;步骤4:对区间预测模型进行评价。2.根据权利要求1所述的基于深度学习的业务流程完成时间区间预测方法,其特征在于,所述步骤1包括:将每个事件定义为一个含有事件属性的元组e:e=(a,c,t,(d1,v1),...,(d
m
,v
m
))其中,a代表活动名称,c代表案例ID,t代表事件发生的时间戳,(d1,v1)表示第一个额外属性名称和额外属性值,m为额外属性的总个数;对每个事件按发生的时间顺序排序组成一个包含流程信息的非空序列被称为轨迹σ:上式表示该轨迹中共有n个事件,根据事件发生的时间顺序进行由1到n的下标编号,对于其中任意下标为i,j的事件,它们的案例ID属性相同;对实时进行的案例,预测模型获取的信息全部来自于已发生的事件,将长度为l(l<n)的轨迹前缀定义为:prefix(σ,l)=[e1,...,e
l
]整理得到固定窗口长度内的所有事件轨迹前缀集L
*
:L
*
={prefix(σ,k):σ∈L,1≤k≤|σ|}由一个轨迹提取出长度由1到轨迹总长度|σ|不等的前缀,上式中用k表示前缀的取值长度;对数值型变量进行Min
‑
Max归一化,对状态型变量进行一位有效编码,用张量形式存储所有前缀信息以适应循环神经网络的训练和测试,用n
×
t
×
p的三维形式存储输入的前缀信息,其中n为训练集实例个数,t为每个前缀的事件个数,p为事件属性的个数。3.根据权利要求1所述的基于深度学习的业务流程完成时间区间预测方法,其特征在于,所述步骤2包括:使用LSTM网络处理事件日志的时序信息,进行剩余时间的预测,并在输出端增加预测的不确定性,通过增加模型的输出,分别预测时间区间的上界和下界,模型结构以案例前缀特征信息作为输入,包含带有若干共享层和独立层的LSTM网络,输出端为上界和下界,在每层LSTM网络后加入批量标准化层以避免梯度消失。4.根据权利要求1所述的基于深度学习的业务流程完成时间区间预测方法,其特征在于,所述步骤3包括:使用relu函数对上下届进行越界惩罚的计算,公式为:使用relu函数对上下届进行越界惩罚的计算,公式为:
通过设置预期的区间宽度并对超过预期宽度的预测结果做惩罚,保证区间宽度不会太宽而使得预测结果失去意义,公式为:其中,n为训练集实例个数,对于每一个案例i,t
i
为真实值,y
ui
和y
li
为预测上界和下界,w
exp
为期望的区间宽度;对预测的时间点值取区间上界和下界的中值,通过比较其与真实值的绝对误差来提高预测精度,公式为:将三者按权重相加结合,构建用来优化上下界预测神经网络的损失函数:loss=β1*MAE+β2*upper_loss+β3*lower_loss+β4*width_loss其中,β1、β2、β3、β4分别表示平均绝对误差、上界惩罚、下界惩罚、宽度惩罚所占的权重。5.根据权利要求1所述的基于深度学习的业务流程完成时间区间预测方法,其特征在于,所述步骤4包括:根据区间质量的要求,使用相应的区间质量衡量方法:统计区间覆盖率、计算标准化区间平均宽度、计算平均绝对误差,公式为:其中其中其中通过以上三个指标对模型预测结果进行综合评价,将其进行指数运算来评估预测结果,公式为:Criterion=β1*PINAW+γ(PICP)e
η(μ
‑
PICP)
+β2*MAE,其中,μ为目标覆盖率,β1、β2、η为比例系数。6.一种基于深度学习的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。