The invention discloses a method for analyzing and repairing large data transaction model based on deviation reduction, which belongs to the field of business process management. The method comprises the following steps: discovering the deviation set Rd between event log and model by the deviation discovery method based on reachable identifier graph; obtaining the adjacent edge relation difference set Rp according to the deviation set Rd; And we obtain the sequence PS of neighbor difference relation. The model repair method based on the effective deviation is realized by the model repair method based on the deviation reduction, and the model fitting degree, accuracy, simplicity and time complexity are evaluated to verify the effectiveness of the method.
【技术实现步骤摘要】
一种基于偏差约减的大数据交易模型分析与修复方法
本专利技术属于业务流程管理领域,具体涉及一种基于偏差约减的大数据交易模型分析与修复方法。
技术介绍
随着海量数据的出现,数据的价值得到越来越多行业和领域的认可,大数据交易成为一种新型的数据流通手段,大数据交易平台的构建过程中产生了自有数据出售,数据加工转售以及数据交易平台服务等多种交易模式。如何及时发现并解决大数据交易流程中实际执行与业务规则之间的偏差是大数据交易过程面临的巨大挑战。业务流程管理通过对业务流程的整个生命周期进行建模、管理、监控和优化,来实现对各种业务环节的整合的全面管理。大数据交易业务流程管理过程中识别业务流程中的偏差,使得业务流程能够适应不断变化的情况,对优化交易规则制定、提升交易流程效率具有重要意义。目前大数据交易处于初级阶段,交易模式尚不成熟,为了实现对业务流程的检测、分析和改进,需要通过对整个流程建模来创建过程模型。大数据交易建模过程中,由于多种交易模式的存在,涉及的知识众多,而且这些知识高度分散在业务过程参与者的头脑中,所以过程模型的设计缺乏对过程数据的严格分析,导致在实际的业务流程中出现偏差。作为业务流程管理的重要环节,过程挖掘能够发现大数据交易业务流程存在的问题和瓶颈,以便对交易过程模型不断地优化。过程挖掘技术从现代信息系统普遍产生的事件日志中抽取信息,该技术为各种应用领域中的过程发现、监测和改进提供了新的手段。模型修复是过程挖掘的重要部分,通过修改模型使新的模型更好的反映现实业务。现有的模型修复方法主要是基于模型校准来发现日志与模型之间的偏差以达到模型修复的目的,其中模型校准是 ...
【技术保护点】
1.一种基于偏差约减的大数据交易模型分析与修复方法,其特征在于:首先定义相关概念:1.1、多重集、序列
【技术特征摘要】
1.一种基于偏差约减的大数据交易模型分析与修复方法,其特征在于:首先定义相关概念:1.1、多重集、序列是一个集合,存在映射其中代表集合上所有多重集的集合;例如多重集B1∶=[],B2∶=[a],B3∶=[a,b,b,c,b,a],B4∶=[a2,c,b,b2];序列|σ|表示序列σ的长度,|σ|∶=n;1.2、Petri网Petri网是用于描述分布式系统的一种模型;三元组N∶=(P,T,F)称为一个Petri网,P,T是两个不相交的有限集合,它们是网N的基本元素集,P称为库所集,T称为变迁集,F是网N的流关系;设N∶=(P,T,F)为一个Petri网,对于x∈P∪T,记·x={y|y∈P∪T∧(y,x)∈F}x·={y|y∈P∪T∧(x,y)∈F}称·x为x的前集或输入集,x·为x的后集或输出集;1.3、标识Petri网四元组N∶=(P,T,F,M)称为一个标识Petri网,映射M:P→{0,1,2,…}称为网N的一个标识,一个网系统有一个初始标识,记为M0,标识Petri网具有下面变迁发生规则:(1)、对于变迁t∈T,如果p∈·t→M(p)≥1则说变迁t在标识M有发生权,记为M[t>;(2)、若M[t>,则在标识M下,变迁t可以发生,从标识M发生变迁t得到一个新的标识M′(记为M[t>M′),对1.4、Petri网可达性设N∶=(P,T,F,M)为一个Petri网,如果存在t∈T,使得M[t>M′,则称M′为从M直接可达的;如果存在变迁序列t1,t2,…tk和标识序列M1,M2,…Mk使得M[t1>M1[t2>M2…Mk-1[tk>Mk,则称Mk为从M可达的;从M可达的一切标识的集合记为R(M),约定M∈R(M);1.5、有界Petri网设N∶=(P,T,F,M)为一个Petri网,p∈P,若存在正整数B,使得M(p)≤B,则称为库所p是有界的,如果对于每个p∈P都是有界的,则称为网N为有界Petri网;1.6、可达标识图设N=(P,T,F,M0)为一个有界Petri网,N的可达标识图定义为一个三元组RG(N)=(R(M0),e,p),其中假设网N1的初始标识M0=[1,0,0,0,0,0,0,0],基于可达标识图的概念,进一步给出了邻边关系集,子轨迹,最小状态偏差率以及偏差集的定义;1.7、事件日志事件日志由案例组成,案例由事件组成,案例中的事件用轨迹的形式来表示,即(唯一的)事件的序列,设集合代表事件日志中所有标签的集合,轨迹中的每一个标签代表一个事件;定义1邻边关系集Rc设网N=(P,T,F,M0)为有界Petri网,根据网N的可达标识图RG(N)=(R(M0),E,P)定义邻边关系集Rc:令r=<ta,Mi,tb>为邻边关系集Rc中的元素,定义关系前键·r=ta,关系后键r·=tb;定义2子轨迹日志L为事件轨迹的集合,设σ为事件日志L中的一条轨迹,σ=<e1,e2,…,en>∈L,n=len(σ)>1,定义σ[i,j]=<ei,..,ej>,i,j∈[1..n]且i&...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。