一种基于偏差约减的大数据交易模型分析与修复方法技术

技术编号:18668402 阅读:41 留言:0更新日期:2018-08-14 20:40
本发明专利技术公开了一种基于偏差约减的大数据交易模型分析与修复方法,属于业务流程管理领域,具体包括如下步骤:通过基于可达标识图的偏差发现方法发现事件日志与模型之间的偏差集Rd;根据偏差集Rd求得邻边关系差集Rp,进而求得邻边关系差序列集PS。本发明专利技术通过基于偏差约减的模型修复方法实现基于有效偏差的模型修复;对修复结果开展模型拟合度、精确度、简洁度及时间复杂度评估,验证方法的有效性。

Analysis and repair method of big data transaction model based on deviation reduction

The invention discloses a method for analyzing and repairing large data transaction model based on deviation reduction, which belongs to the field of business process management. The method comprises the following steps: discovering the deviation set Rd between event log and model by the deviation discovery method based on reachable identifier graph; obtaining the adjacent edge relation difference set Rp according to the deviation set Rd; And we obtain the sequence PS of neighbor difference relation. The model repair method based on the effective deviation is realized by the model repair method based on the deviation reduction, and the model fitting degree, accuracy, simplicity and time complexity are evaluated to verify the effectiveness of the method.

【技术实现步骤摘要】
一种基于偏差约减的大数据交易模型分析与修复方法
本专利技术属于业务流程管理领域,具体涉及一种基于偏差约减的大数据交易模型分析与修复方法。
技术介绍
随着海量数据的出现,数据的价值得到越来越多行业和领域的认可,大数据交易成为一种新型的数据流通手段,大数据交易平台的构建过程中产生了自有数据出售,数据加工转售以及数据交易平台服务等多种交易模式。如何及时发现并解决大数据交易流程中实际执行与业务规则之间的偏差是大数据交易过程面临的巨大挑战。业务流程管理通过对业务流程的整个生命周期进行建模、管理、监控和优化,来实现对各种业务环节的整合的全面管理。大数据交易业务流程管理过程中识别业务流程中的偏差,使得业务流程能够适应不断变化的情况,对优化交易规则制定、提升交易流程效率具有重要意义。目前大数据交易处于初级阶段,交易模式尚不成熟,为了实现对业务流程的检测、分析和改进,需要通过对整个流程建模来创建过程模型。大数据交易建模过程中,由于多种交易模式的存在,涉及的知识众多,而且这些知识高度分散在业务过程参与者的头脑中,所以过程模型的设计缺乏对过程数据的严格分析,导致在实际的业务流程中出现偏差。作为业务流程管理的重要环节,过程挖掘能够发现大数据交易业务流程存在的问题和瓶颈,以便对交易过程模型不断地优化。过程挖掘技术从现代信息系统普遍产生的事件日志中抽取信息,该技术为各种应用领域中的过程发现、监测和改进提供了新的手段。模型修复是过程挖掘的重要部分,通过修改模型使新的模型更好的反映现实业务。现有的模型修复方法主要是基于模型校准来发现日志与模型之间的偏差以达到模型修复的目的,其中模型校准是通过将日志中的轨迹映射到模型中重演,进而发现模型与现实业务之间的偏差,基于模型校准的模型修复方法对模型修复具有一定的指导和借鉴意义,但是大数据交易模型修复过程中,在日志与模型拟合的情况下,当交易模型中多个并行分支之间存在偏差时,基于模型校准的模型修复方法无法准确的发现并解决。迭代的过程发现技术解决的问题类似于模型修复问题,在大数据交易模型修复的过程中,基于迭代的过程发现技术执行过程复杂并且无法保证修复之后日志与模型之间的一致性,容易导致修复后的过程模型仅允许日志中记录的行为发生,即出现过拟合的现象。
技术实现思路
针对现有技术中存在的上述技术问题,本专利技术提出了一种基于偏差约减的大数据交易模型分析与修复方法,设计合理,克服了现有技术的不足,具有良好的效果。为了实现上述目的,本专利技术采用如下技术方案:一种基于偏差约减的大数据交易模型分析与修复方法,首先定义相关概念:1.1、多重集、序列是一个集合,存在映射其中代表集合上所有多重集的集合;例如多重集B1∶=[],B2∶=[a],B3∶=[a,b,b,c,b,a],B4∶=[a2,c,b,b2];序列|σ|表示序列σ的长度,|σ|∶=n;1.2、Petri网Petri网是用于描述分布式系统的一种模型;三元组N∶=(P,T,F)称为一个Petri网,P,T是两个不相交的有限集合,它们是网N的基本元素集,P称为库所集,T称为变迁集,F是网N的流关系;设N∶=(P,T,F)为一个Petri网,对于x∈P∪T,记称·x为x的前集或输入集,x·为x的后集或输出集;1.3、标识Petri网四元组N∶=(P,T,F,M)称为一个标识Petri网,映射M:P→{0,1,2,…}称为网N的一个标识,一个网系统有一个初始标识,记为M0,标识Petri网具有下面变迁发生规则:(1)、对于变迁t∈T,如果则说变迁t在标识M有发生权,记为M[t>;(2)、若M[t>,则在标识M下,变迁t可以发生,从标识M发生变迁t得到一个新的标识M′(记为M[t>M′),对1.4、Petri网可达性设N∶=(P,T,F,M)为一个Petri网,如果存在t∈T,使得M[t>M′,则称M′为从M直接可达的;如果存在变迁序列t1,t2,…tk和标识序列M1,M2,…Mk使得M[t1>M1[t2>M2…Mk-1[tk>Mk,则称Mk为从M可达的;从M可达的一切标识的集合记为R(M),约定M∈R(M);1.5、有界Petri网设N∶=(P,T,F,M)为一个Petri网,p∈P,若存在正整数B,使得则称为库所p是有界的,如果对于每个p∈P都是有界的,则称为网N为有界Petri网;1.6、可达标识图设N=(P,T,F,M0)为一个有界Petri网,N的可达标识图定义为一个三元组RG(N)=(R(M0),e,p),其中假设网N1的初始标识M0=[1,0,0,0,0,0,0,0],基于可达标识图的概念,进一步给出了邻边关系集,子轨迹,最小状态偏差率以及偏差集的定义;1.7、事件日志事件日志由案例组成,案例由事件组成,案例中的事件用轨迹的形式来表示,即(唯一的)事件的序列,设集合代表事件日志中所有标签的集合,轨迹中的每一个标签代表一个事件;定义1邻边关系集Rc设网N=(P,T,F,M0)为有界Petri网,根据网N的可达标识图RG(N)=(R(M0),E,P)定义邻边关系集Rc:令r=<ta,Mi,tb>为邻边关系集Rc中的元素,定义关系前键·r=ta,关系后键r·=tb;定义2子轨迹日志L为事件轨迹的集合,设σ为事件日志L中的一条轨迹,σ=<e1,e2,…,en>∈L,n=len(σ)>1,定义σ[i,j]=<ei,..,ej>,i,j∈[1..n]且i<j,表示整条轨迹σ中从第i个事件到第j个事件之间所对应的子轨迹;定义3最小状态偏差率Pmsd设网N=(P,T,F,M0)为有界Petri网,日志L为事件轨迹的集合,令count(M)为日志遍历过程中状态M出现的次数,M∈R(M0),max(ML)表示日志遍历过程中单个状态出现的最大次数,状态偏差率PM=count(M)/max(ML),其中Pmsd为日志遍历过程中允许的最小状态偏差率;定义4偏差集Rd设网N=(P,T,F,M0)为有界Petri网,RG(N)=(R(M0),E,P)为网N对应的可达标识图,Rc为网N对应的邻边关系集,定义偏差集定义5邻边关系差集Rp设网N=(P,T,F,M0)为有界Petri网,RG(N)=(R(M0),E,P)为网N的可达标识图,Rc为网N对应的邻边关系集,Rd为日志L对应的偏差集,定义邻边关系差集Rp:基于邻边关系差集Rp与偏差集Rd分别定义了邻边关系差序列集PS与修复序列集RS;定义6事件轨迹映射关系π日志L为事件轨迹的集合,设σ为事件日志L中的一条轨迹,定义事件轨迹之间的映射关系π,设ei为轨迹σ中第i个事件,则ei=πi(σ);定义7邻边关系差序列集PS设N=(P,T,F,M0)为有界Petri网,RG(N)=(R(M0),E,P)为网N对应的可达标识图,Rp为网N对应的邻边关系差集,定义模型邻边关系差序列集定义8修复序列集RS设N=(P,T,F,M0)为有界Petri网,RG(N)=(R(M0),E,P)为网N对应的可达标识图,Rd为网N对应的偏差集,定义模型修本文档来自技高网
...

【技术保护点】
1.一种基于偏差约减的大数据交易模型分析与修复方法,其特征在于:首先定义相关概念:1.1、多重集、序列

【技术特征摘要】
1.一种基于偏差约减的大数据交易模型分析与修复方法,其特征在于:首先定义相关概念:1.1、多重集、序列是一个集合,存在映射其中代表集合上所有多重集的集合;例如多重集B1∶=[],B2∶=[a],B3∶=[a,b,b,c,b,a],B4∶=[a2,c,b,b2];序列|σ|表示序列σ的长度,|σ|∶=n;1.2、Petri网Petri网是用于描述分布式系统的一种模型;三元组N∶=(P,T,F)称为一个Petri网,P,T是两个不相交的有限集合,它们是网N的基本元素集,P称为库所集,T称为变迁集,F是网N的流关系;设N∶=(P,T,F)为一个Petri网,对于x∈P∪T,记·x={y|y∈P∪T∧(y,x)∈F}x·={y|y∈P∪T∧(x,y)∈F}称·x为x的前集或输入集,x·为x的后集或输出集;1.3、标识Petri网四元组N∶=(P,T,F,M)称为一个标识Petri网,映射M:P→{0,1,2,…}称为网N的一个标识,一个网系统有一个初始标识,记为M0,标识Petri网具有下面变迁发生规则:(1)、对于变迁t∈T,如果p∈·t→M(p)≥1则说变迁t在标识M有发生权,记为M[t>;(2)、若M[t>,则在标识M下,变迁t可以发生,从标识M发生变迁t得到一个新的标识M′(记为M[t>M′),对1.4、Petri网可达性设N∶=(P,T,F,M)为一个Petri网,如果存在t∈T,使得M[t>M′,则称M′为从M直接可达的;如果存在变迁序列t1,t2,…tk和标识序列M1,M2,…Mk使得M[t1>M1[t2>M2…Mk-1[tk>Mk,则称Mk为从M可达的;从M可达的一切标识的集合记为R(M),约定M∈R(M);1.5、有界Petri网设N∶=(P,T,F,M)为一个Petri网,p∈P,若存在正整数B,使得M(p)≤B,则称为库所p是有界的,如果对于每个p∈P都是有界的,则称为网N为有界Petri网;1.6、可达标识图设N=(P,T,F,M0)为一个有界Petri网,N的可达标识图定义为一个三元组RG(N)=(R(M0),e,p),其中假设网N1的初始标识M0=[1,0,0,0,0,0,0,0],基于可达标识图的概念,进一步给出了邻边关系集,子轨迹,最小状态偏差率以及偏差集的定义;1.7、事件日志事件日志由案例组成,案例由事件组成,案例中的事件用轨迹的形式来表示,即(唯一的)事件的序列,设集合代表事件日志中所有标签的集合,轨迹中的每一个标签代表一个事件;定义1邻边关系集Rc设网N=(P,T,F,M0)为有界Petri网,根据网N的可达标识图RG(N)=(R(M0),E,P)定义邻边关系集Rc:令r=<ta,Mi,tb>为邻边关系集Rc中的元素,定义关系前键·r=ta,关系后键r·=tb;定义2子轨迹日志L为事件轨迹的集合,设σ为事件日志L中的一条轨迹,σ=<e1,e2,…,en>∈L,n=len(σ)>1,定义σ[i,j]=<ei,..,ej>,i,j∈[1..n]且i&...

【专利技术属性】
技术研发人员:张鹏郭艺戚梅
申请(专利权)人:山东科技大学
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1