噪声环境下确定工作流轨迹中循环执行次数的方法技术

技术编号:14642359 阅读:167 留言:0更新日期:2017-02-15 22:23
本发明专利技术公开了一种噪声环境下确定工作流轨迹中循环执行次数的方法,包括:输入由带有循环的Petri网表示的工作流模型和工作流轨迹日志,根据工作流模型计算其结构信息;解析工作流轨迹日志得到事件序列,将事件序列中的每个事件加入多重集中,计算多重集中每个元素的重数,判断工作流模型中循环是否嵌套;对于不带嵌套的循环,运用启发式规则计算工作流轨迹的循环次数;对于带嵌套的循环,先运用启发式规则计算外层循环次数,再将工作流轨迹分段,最后利用启发式规则计算每个分段的内层循环次数。本发明专利技术提出了确定工作流轨迹中循环执行次数的新思路,可用于日志恢复等进一步工作。

【技术实现步骤摘要】

本专利技术属于过程挖掘领域,具体涉及一种噪声环境下确定工作流轨迹中循环执行次数的方法。技术背景从传统的信息系统如企业办公自动化或科学工作流到最近的webservice及联机事务,大量的工作流轨迹被生成。然而手动记录时忘记提交、系统宕机、异构执行环境的工作流轨迹混杂等一系列原因都会导致工作流轨迹日志记录含有噪声,这些噪声包括缺失、冗余、乱序等。噪声是拉低工作流轨迹质量的重要原因。若不修复这些含有噪声的工作流轨迹,基于这些含有噪声的工作流轨迹进行的应用和挖掘是不可信的。工作流轨迹的质量严重影响了商业智能功能的分析,复杂的事件挖掘,信源分析,过程挖掘等一系列以工作流轨迹日志为基石的应用。因此,修复丢失的事件变得尤为重要。现有的一些修复算法如基于分支限界的修复算法能解决缺失情况下的修复,基于A星算法的修复算法能解决大多数情况下的修复,然而当工作流中存在循环结构时,A星算法趋于穷举法,会计算法出各种等价修复。在云计算、大数据时代,工作流轨迹以流的形式产生,如何实时高效的确定其中循环发生的次数进而修复日志变得尤为重要。
技术实现思路
本专利技术的目的在于提供一种噪声环境下确定工作流轨迹中循环执行次数的方法。实现本专利技术目的的技术方案为:一种噪声环境下确定工作流轨迹中循环执行次数的方法,步骤如下:输入由带有循环的Petri网表示的工作流模型和工作流轨迹日志,根据工作流模型计算其结构信息;解析工作流轨迹日志得到事件序列,将事件序列中的每个事件加入多重集中,计算多重集中每个元素的重数,判断工作流模型中循环是否嵌套;对于不带嵌套的循环,运用启发式规则计算工作流轨迹的循环次数;对于带嵌套的循环,先运用启发式规则计算外层循环次数,再将工作流轨迹分段,最后利用启发式规则计算每个分段的内层循环次数。与现有技术相比,本专利技术的显著优点为:(1)本专利技术运用启发式规则,确定工作流轨迹中循环执行次数的速度更快;(2)本专利技术将工作流轨迹进行分段处理,解决嵌套循环的循环次数。附图说明图1为本专利技术噪声环境下确定工作流轨迹中循环执行次数的方法流程图。图2为基本循环的F1和F2结构示意图。图3为循环不带嵌套的Petri网实例示意图。图4为循环有嵌套的Petri网实例示意图。具体实施方法结合图1,本专利技术的一种噪声环境下确定工作流轨迹中循环执行次数的方法,步骤如下:输入由带有循环的Petri网表示的工作流模型和工作流轨迹日志,根据工作流模型计算其结构信息;解析工作流轨迹日志得到事件序列,将事件序列中的每个事件加入多重集中,计算多重集中每个元素的重数,判断工作流模型中循环是否嵌套;对于不带嵌套的循环,运用启发式规则计算工作流轨迹的循环次数;对于带嵌套的循环,先运用启发式规则计算外层循环次数,再将工作流轨迹分段,最后利用启发式规则计算每个分段的内层循环次数。进一步的,所述由带有循环的Petri网表示的工作流模型为一个三元组PN=(P,T,F),其中P为库所的有限集,T为变迁的有限集,F为Petri网的有向边,如图2所示,结构信息中循环体为有向图中的环路,F1为循环体中至少执行一次的结构块,F2为循环体中执行次数比F1执行次数少一次的结构块;计算结构信息的具体过程为:使用有向图中寻找所有环路的算法得到所有循环体;对于每一个循环体,计算循环体中每一个元素在PN中的入度和出度,取循环体中从入度大于1的元素到出度大于1的元素的部分作为该循环体的F1,取循环体中除F1之外的剩余部分作为该循环体的F2;对于PN,将每一个循环体中的F1和F2结构分别加入F1和F2的集合F1s和F2s中。进一步的,解析工作流轨迹日志得到事件序列,将事件序列中的每个事件加入多重集中,计算多重集中每个元素的重数,判断工作流模型中循环是否嵌套的具体过程为:工作流轨迹日志中事件为event1,event2......,事件序列为σ=event1event2event3......;多重集em={event1,event2,event3,......本文档来自技高网...
噪声环境下确定工作流轨迹中循环执行次数的方法

【技术保护点】
一种噪声环境下确定工作流轨迹中循环执行次数的方法,其特征在于,步骤如下:输入由带有循环的Petri网表示的工作流模型和工作流轨迹日志,根据工作流模型计算其结构信息;解析工作流轨迹日志得到事件序列,将事件序列中的每个事件加入多重集中,计算多重集中每个元素的重数,判断工作流模型中循环是否嵌套;对于不带嵌套的循环,运用启发式规则计算工作流轨迹的循环次数;对于带嵌套的循环,先运用启发式规则计算外层循环次数,再将工作流轨迹分段,最后利用启发式规则计算每个分段的内层循环次数。

【技术特征摘要】
1.一种噪声环境下确定工作流轨迹中循环执行次数的方法,其特征在于,步骤如下:输入由带有循环的Petri网表示的工作流模型和工作流轨迹日志,根据工作流模型计算其结构信息;解析工作流轨迹日志得到事件序列,将事件序列中的每个事件加入多重集中,计算多重集中每个元素的重数,判断工作流模型中循环是否嵌套;对于不带嵌套的循环,运用启发式规则计算工作流轨迹的循环次数;对于带嵌套的循环,先运用启发式规则计算外层循环次数,再将工作流轨迹分段,最后利用启发式规则计算每个分段的内层循环次数。2.根据权利要求1所述的噪声环境下确定工作流轨迹中循环执行次数的方法,其特征在于,所述由带有循环的Petri网表示的工作流模型为一个三元组PN=(P,T,F),其中P为库所的有限集,T为变迁的有限集,F为Petri网的有向边,结构信息中循环体为有向图中的环路,F1为循环体中至少执行一次的结构块,F2为循环体中执行...

【专利技术属性】
技术研发人员:宋巍夏小旭陈芳菲张成震
申请(专利权)人:南京理工大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1