当前位置: 首页 > 专利查询>浙江大学专利>正文

基于图挖掘和图距离的流程推荐方法技术

技术编号:9357031 阅读:74 留言:0更新日期:2013-11-21 00:17
本发明专利技术涉及流程自动化领域,公开了一种基于图挖掘和图距离的流程推荐方法,具体步骤如下:预处理步骤:将输入的流程集抽象标号为有向图的形式,得到流程子图;模式发现步骤:子图挖据和分解模块对所述预处理步骤输出的合集进行分解,得到上游子图、候选节点集以及置信度,将所得上游子图、候选节点集以及置信度注册为模式表中的数据条目;流程推荐步骤:推荐模块获取参考流程,将参考流程与模式表中的上游子图进行比较,选出最匹配数据条目,将最匹配数据条目所对应的候选节点集输出为推荐流程。本发明专利技术的优点在于,推荐效率高,算法的计算复杂度更小,推荐精度高,支持复杂结构流程的处理,具有较高的应用价值。

【技术实现步骤摘要】
基于图挖掘和图距离的流程推荐方法
本专利技术涉及流程自动化领域,特别涉及一种基于图挖掘和图距离的流程推荐方法。
技术介绍
快速高效的业务流程建模是衡量现代企业能否应对多变企业环境的重要标准。然而,业务流程建模是一项极为复杂且耗时的工作,它要求建模人员不仅具备专业的领域知识,还需要熟悉各业务活动的执行过程、执行顺序以及异常处理情况。目前,基于商业智能(businessintelligence,BI)的技术,如流程挖掘和流程检索,被用来协助流程建模。流程挖掘技术通过数据挖掘技术从流程库或者事件日志中发现流程作为建模参考;流程检索技术则是从工作流仓库中检索相似的流程片段并以此协助建模。但这些技术自动化程度低,仍需要较多人工参与,建模效率降不高,且建模准确度也不能满足要求。流程推荐技术基于已有的流程模式和建模片段,可自动为建模人员推荐建模片段后续可能的流程结构,因此作为流程建模过程的重要辅助手段而备受关注。目前大多数业务流程均是以图结构的形式进行建模,如Petri网、事件驱动的过程链(Event-drivenProcessChains,EPC)、业务流程建模与标注(BusinessProcessModelandNotation,BPMN)等,因此,现有流程推荐方法均在图挖掘、图匹配的算法上发展而来。基于图的流程推荐方法可分三步进行:首先用图挖掘算法gSpan对流程库进行处理,得到频繁子图;然后分解子图得到模式表(包括上游子路径和对应活动节点),并将其存储于数据库中;最后通过比较当前流程片段和模式表中的上游子图,推荐出最合适的活动节点。然后,现有的流程推荐方法未能支持循环结构的流程,其实用性受到极大限制。为了支持包含循环结构在内的复杂流程,同时提高推荐系统的高效性和有效性,我们构建了一个采用改进的匹配算法的推荐系统,可以有效支持包括循环等复杂结构的流程并在效率和推荐准确度上有更好的表现。
技术实现思路
本专利技术针对现有的流程推荐方法的实用性限制较大,无法支持包含循环结构在内的复杂流程等缺点,提供了一种新型基于图挖掘和图距离的流程推荐方法。为实现上述目的,本专利技术可采取下述技术方案:基于图挖掘和图距离的流程推荐方法,具体步骤如下:预处理步骤:将输入的流程集抽象标号为有向图的形式,得到流程子图,所述流程集包括工艺流程、业务流程以及事务流程,使用频繁子图挖掘算法对流程子图进行挖据,输出包含所有包括流程子图及其子图出现频率的合集;模式发现步骤:子图挖据和分解模块(21)对所述预处理步骤输出的合集进行分解,得到有影响上游子图、候选节点集以及置信度,将所得有影响上游子图、候选节点集以及置信度注册为模式表(3)中的数据条目,所述流程子图的末尾节点作为候选节点,剩余部分作为上游子图,选择候选节点集中置信度大于阈值的上游子图,即为有影响上游子图;流程推荐步骤:推荐模块(4)获取参考流程,所述参考流程由用户界面模块(1)输入,将参考流程与模式表(3)中的有影响上游子图进行比较,选出最匹配数据条目,将最匹配数据条目所对应的候选节点集输出为推荐流程。作为优选,流程推荐步骤中,所述比较的步骤具体包括:1)对模式表(3)中的每个有影响上游子图p和参考流程R进行处理,得到所述p和R的最小公共超图MCSub和最大公共子图MCSup,计算得到MM距离,所述MM距离为最小公共超图MCSub和最大公共子图MCSup的大小之差,即MMDist=|MCSup|-|MCSub|;2)根据参考流程R的节点向后位置,得到所述p和R的位置距离Lo,所述节点向后位置为:令R=(N,E,L,n,α)表示参考流程,表示R的待推荐节点集,In(x)和Out(x)分别表示节点x的输入节点集和输出节点集,Num(N)表示集合N中节点的个数,x,y,z∈(NNRR);节点x的节点向后位置为:1;]]>所述位置距离Lo的计算步骤包括:1’)找出所述参考流程R中的循环结构,分别用不同的无关节点替换其中互相独立的循环结构,所述无关节点为独立于活动节点的节点,如果两个或者两个以上的循环结构之间存在公共节点,则将所述两个或者两个以上的循环结构分别用同一个无关节点替换,得到参考流程R的无循环图;2’)根据所得无循环图得到图中节点的节点向后位置;3’)将无循环图中的无关节点恢复为步骤1’)替换之前的循环结构,并将无关节点的位置距离赋值给循环结构的节点,得到参考流程R中所有节点的节点向后位置;4’)根据步骤3’)所得到的节点向后位置,得到所述位置距离Lo;3)根据所述MM距离和位置距离Lo得到所述p和R的总距离,并将候选节点集、总距离以及置信度添加至CNS中;4)将CNS中的条目按照所述总距离由小到大进行排序,如果距离相同,则按照置信度由高到低进行排序,然后将位置靠前的多个结果选为最匹配数据条目。作为优选,还包括一下具体步骤:所述流程推荐步骤还包括将所得到的推荐流程加入流程库,所述流程库用于预处理步骤中作为输入的流程集的数据来源。作为优选,所述预处理步骤中的流程集还包括通过用户界面模块(1)输入的流程集。作为优选,循环执行所述预处理步骤、模式发现步骤以及流程推荐步骤。作为优选,所述频繁子图挖掘算法包括以下具体步骤:利用模式增长策略,采用深度优先方式便利模式搜索空间,在已知频繁子图pp的基础上,扩展产生所述pp的子频繁子图,所述子频繁子图为频繁子图的子节点,并计算所述子频繁子图的支持度;对每一个所述pp的子频繁子图,以深度优先的方式继续扩展,直至发现所有的频繁子图为止。作为优选,所述模式发现步骤还包括模式表构建步骤,具体步骤如下:分解流程子图,得到上游子图以及候选节;计算每个上游子图以及候选节点的置信度,根据上游子图、候选节点以及置信度构建模式表,所述模式表的数据条目为一个三元组T=(I,C,f),其中,I为有影响上游子图的有限集合,C为候选节点的有限集合,f:I→C为满射函数。相关概念与定义:基于最大公共子图和最小公共超图的距离(MM距离):两个业务流程图P1和P2的最小公共超图和最大公共子图分别为MCSub和MCSup,图P的大小为边与节点数之和,即|P|=|N|+|E|。则其MM距离为最小公共超图和最大公共子图的大小之差,即为MMDist=|MCSup|-|MCSub|。位置距离:位置距离是通过计算有影响上游子图中所有节点在参考模型中的最小向后位置得到的,节点向后位置的定义如下:令R=(N,E,L,n,α)表示参考流程,表示参考流程R的待推荐节点集。In(x)和Out(x)分别表示节点x的输入节点集和输出节点集。Num(N)表示集合N中节点的个数。所有x,y,z∈(N∪RR)。节点x的向后位置为:1.]]>位置距离的计算分为四步:(1)首先本文档来自技高网
...
基于图挖掘和图距离的流程推荐方法

【技术保护点】
一种基于图挖掘和图距离的流程推荐方法,其特征在于,具体步骤如下:预处理步骤:将输入的流程集抽象标号为有向图的形式,得到流程子图,所述流程集包括工艺流程、业务流程以及事务流程,使用频繁子图挖掘算法对流程子图进行挖据,输出包含所有包括流程子图及其子图出现频率的合集;模式发现步骤:子图挖据和分解模块(21)对所述预处理步骤输出的合集进行分解,得到有影响上游子图、候选节点集以及置信度,将所得有影响上游子图、候选节点集以及置信度注册为模式表(3)中的数据条目,所述流程子图的末尾节点作为候选节点,剩余部分作为上游子图,选择候选节点集中置信度大于阈值的上游子图,即为有影响上游子图;流程推荐步骤:推荐模块(4)获取参考流程,所述参考流程由用户界面模块(1)输入,将参考流程与模式表(3)中的有影响上游子图进行比较,选出最匹配数据条目,将最匹配数据条目所对应的候选节点集输出为推荐流程。

【技术特征摘要】
1.一种基于图挖掘和图距离的流程推荐方法,其特征在于,具体步骤如下:预处理步骤:将输入的流程集抽象标号为有向图的形式,得到流程子图,所述流程集包括工艺流程、业务流程以及事务流程,使用频繁子图挖掘算法对流程子图进行挖据,输出包含所有包括流程子图及其子图出现频率的合集;模式发现步骤:子图挖据和分解模块(21)对所述预处理步骤输出的合集进行分解,得到有影响上游子图、候选节点集以及置信度,将所得有影响上游子图、候选节点集以及置信度注册为模式表(3)中的数据条目,所述流程子图的末尾节点作为候选节点,剩余部分作为上游子图,选择候选节点集中置信度大于阈值的上游子图,即为有影响上游子图;流程推荐步骤:推荐模块(4)获取参考流程,所述参考流程由用户界面模块(1)输入,将参考流程与模式表(3)中的有影响上游子图进行比较,选出最匹配数据条目,将最匹配数据条目所对应的候选节点集输出为推荐流程;流程推荐步骤中,所述比较的步骤具体包括:1)对模式表(3)中的每个有影响上游子图p和参考流程R进行处理,得到所述p和R的最小公共超图MCSub和最大公共子图MCSup,计算得到MM距离,所述MM距离为最小公共超图MCSub和最大公共子图MCSup的大小之差,即MMDist=|MCSup|-|MCSub|;2)根据参考流程R的节点向后位置,得到所述p和R的位置距离Lop,所述节点向后位置为:令R=(N,E,Ln,α)表示参考流程,RR(RR∩N=φ)表示R的待推荐节点集,In(x)和Out(x)分别表示节点x的输入节点集和输出节点集,num(N)表示集合N中节点的个数,x,y,z∈N∪RR;节点x的节点向后位置为:所述位置距离Lop的计算步骤包括:1’)找出所述参考流程R中的循环结构,分别用不同的无关节点替换其中互相独立的循环结构,所述无关节点为独立于活动节点的节点,如果两个...

【专利技术属性】
技术研发人员:邓水光王东京李莎吴健李莹尹建伟吴朝晖
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1