【技术实现步骤摘要】
一种基于多层机器学习的业务流程剩余时间预测方法
本专利技术涉及流程监控预测领域,尤其涉及一种基于多层机器学习的业务流程剩余时间预测方法。
技术介绍
业务流程的预测性监测是流程挖掘的子领域之一,其目的是通过生成预测模型来预测正在执行的流程实例的可量化指标,旨在为相关人员提供及时的信息,以便能够采取主动的纠正措施,提高流程性能并降低流程风险。流程预测方法的预测对象也是非常多样化的,不同的预测目标能为业务中不同的相关人员提供有用的信息。例如对于流程剩余时间的预测可以调整流程实例执行的优先级,避免有些流程实例的执行超过其截止时间。同时业务流程的预测结果可以帮助企业提高相关业务的绩效指标也可以帮助其评估流程风险或预测可能出现的服务级别协议(SLA)冲突。业务流程剩余时间预测可以有效的帮助相关人员洞察业务的走向,根据预测时间调整相应的策略。Polato等人和Aalst等人都选择了带注释的过渡系统来描述业务流程结构,进而实现剩余执行时间的预测工作。但是,Aalst等人仅考虑了事件日志中的控制流属性,而没有考虑其他属性(如资源属性) ...
【技术保护点】
1.一种基于多层机器学习的业务流程剩余时间预测方法,其特征在于包括以下步骤:/nS1.数据特征提取:输入原始日志,提取出其中每个事件的特征属性,所属特征属性包括基本特征属性、实例间特征属性、剩余关键活动数特征属性三类,具体包含以下子步骤:/nS11.基本特征属性提取:提取日志中有直接记录的事件特征属性,包括活动名、事件Id、活动开始时间、活动结束时间;/nS12.实例间特征属性提取:提取日志中表征资源间竞争关系的实例间特征属性,包括反映未来时间段t内被执行的实例数的区间实例数ExecCaseNum(t),反映未来时间段t内活动a
【技术特征摘要】
1.一种基于多层机器学习的业务流程剩余时间预测方法,其特征在于包括以下步骤:
S1.数据特征提取:输入原始日志,提取出其中每个事件的特征属性,所属特征属性包括基本特征属性、实例间特征属性、剩余关键活动数特征属性三类,具体包含以下子步骤:
S11.基本特征属性提取:提取日志中有直接记录的事件特征属性,包括活动名、事件Id、活动开始时间、活动结束时间;
S12.实例间特征属性提取:提取日志中表征资源间竞争关系的实例间特征属性,包括反映未来时间段t内被执行的实例数的区间实例数ExecCaseNum(t),反映未来时间段t内活动ai被执行的次数的区间事件数ExecEventNum(ai,t),反映未来时间段t内与活动ai具有竞争关系的其他活动被执行的次数之和的区间事件加权数WeightEventNum(ai,t),其计算公式如下:
ExecCaseNum(t)=|{σ|(σ.startTime>tpoint-t)∧(σ.startTime<tpoint)}|
ExecEventNum(ai,t)=|{e|(e.startTime>tpoint-t)∧(e.startTime<tpoint)∧(e.actvity=ai)}|
其中σ是发生事件所在的流程实例对应的轨迹,t是采样的时间窗口大小即区间,σ.startTime是当前流程实例的开始时间,tpoint表示预测发生的时间点,ai表示执行当前事件的活动名,e.startTime表示事件开始的时间点,为流程的活动集合,prefR(ai)是可以执行活动ai的所有资源的集合,|prefR(ai)|是可以执行活动ai的资源的种类数,I(prefR(ai),prefR(aj))是既能执行活动ai又能执行活动aj的所有资源的集合,|I(prefR(ai),prefR(aj))|是既能执行活动ai又能执行活动aj的资源的种类数;
S13.剩余关键活动数特征属性提取:首先从历史日志中找出关键活动,并统计历史日志中全部前缀轨迹的剩余关键活动数;然后对于当前要预测的前缀轨迹,从历史日志中找到与其最相似的轨迹序列,将该轨迹序列对应的剩余关键活动数作为当前轨迹的近似剩余关键活动数,具体包含以下子步骤:
S131.对历史日志中的每个流程实例,将实例中执行的活动按照其执行时间长短从大到小排序,并为其标记排序值,其中排首位的活动即执行时间最长的活动排序值为1,后面的活动的排序值依次递增;
S132.统计整个历史日志中不同活动在不同实例中的排序值,并计算出每类活动的平均排序值;
S133.按照每类活动的平均排序值对活动进行升序排序,选取排名前k%的活动作为关键活动;
S134.对给定的前缀轨迹PTr进行序列转换得到其对应的活动序列Seq,活动序列Seq的长度为l;
S135.对历史日志中的每个流程实例,分别统计该实例中不同前缀轨迹对应的剩余活动序列所包含的关键活动数量,并对历史日志中全部的前缀轨迹进行序列转换得到活动序列集historySeqSet;
S136.选取historySeqSet中长度等于l的活动序列构成子集subSeqSet,依次计算subSeqSet中的活动序列与当Seq的相似度,活动序列之间的相似度使用Damerau-Levenshtein...
【专利技术属性】
技术研发人员:俞东进,侯文杰,孙笑笑,应钰柯,
申请(专利权)人:杭州电子科技大学,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。