生成测试数据的方法、评估流程挖掘算法的方法及介质技术

技术编号:36852078 阅读:35 留言:0更新日期:2023-03-15 17:21
本申请实施例提供一种生成测试数据的方法、评估流程挖掘算法的方法及介质,所述方法包括:获取标准流程模型集,其中,所述标准流程模型集中包括多个标准流程模型;根据所述标准流程模型集生成测试数据。本申请一些实施例的方法和系统能够自动且有效测试流程挖掘算法,也就是说本申请一些实施例构造了流程挖掘算法的自动评估方法与装置。法的自动评估方法与装置。法的自动评估方法与装置。

【技术实现步骤摘要】
生成测试数据的方法、评估流程挖掘算法的方法及介质


[0001]本申请涉及机器人自动化领域,具体而言本申请实施例涉及生成测试数据的方法、评估流程挖掘算法的方法及介质。

技术介绍

[0002]流程挖掘(Process Mining)是指利用企业信息系统中存储的包含业务执行信息的日志(Log),挖掘业务活动间不同维度的流程知识,建立能够反映企业真实业务流程执行过程的流程模型,并以此为基础对原有的业务流程进行诊断和优化。流程挖掘是从事件日志(Event Logs)中挖掘并构建业务流程模型(或简称流程模型)的过程,所得到的流程模型(Business Process Model)应能很好的反映事件日志所记录的流程行为即日志中的trace。
[0003]本申请的专利技术人在研究中发现,相关技术为了评估流程挖掘算法都是从真实企业和系统中获取测试用的日志数据,但这种做法经常只有日志,而没有标准流程模型(或称为标准业务流程模型),这样不便于评价算法。而且真实系统的日志的收集比较困难,造成测试数据的数据量不足,不能有效覆盖需要测试的流程场景,进而造成无法评估流程挖掘算法的性能。

技术实现思路

[0004]本申请实施例的目的在于提供生成测试数据的方法、评估流程挖掘算法的方法及介质,本申请一些实施例的方法和系统能够自动且有效测试流程挖掘算法,也就是说本申请一些实施例构造了流程挖掘算法的自动评估方法与装置。
[0005]第一方面,本申请的一些实施例提供一种生成测试数据的方法,所述的方法包括:获取标准流程模型集,其中,所述标准流程模型集中包括多个标准流程模型;根据所述标准流程模型集生成测试数据。
[0006]本申请的一些实施例通过标准流程模型生成测试数据,可以有效避免从真实企业和信息系统中获取测试用的日志数据造成的数据量不足以及不能有效覆盖需要测试的流程场景的问题,通过提升测试数据的数量和质量得到更加准确可靠的流程挖掘算法的评估结果。
[0007]在一些实施例中,所述测试数据包括多组测试日志集,不同组的测试日志集的完备程度不同,所述完备程度用于表征任一组测试日志集的所有流程实例对所述标准流程模型集所包括的所有流程实例的覆盖程度。
[0008]本申请的一些实施例能有效模拟生成不同完备程度的日志数据,可以得到按照不同完备度条件生成的日志集合SL的算法评价结果报告,更全面的反应被评估流程挖掘算法的性能。
[0009]第二方面,本申请实施例提供一种用于评估流程挖掘算法的方法,所述方法包括:根据标准流程模型集生成测试数据;通过待评估流程挖掘算法对所述测试数据进行流程挖
掘得到待评估流程模型集;比较所述待评估流程集和所述标准流程模型集得到对所述待评估流程挖掘算法的评估结果。
[0010]本申请的一些实施例通过标准流程模型生成测试数据,可以有效避免从真实企业和信息系统中获取测试用的日志数据造成的数据量不足以及不能有效覆盖需要测试的流程场景的问题,通过提升测试数据的数量和质量得到更加准确可靠的流程挖掘算法的评估结果。
[0011]在一些实施例中,所述测试数据包括多组测试日志集,不同组的测试日志集的完备程度不同,所述完备程度用于表征任一组测试日志集的所有流程实例对所述标准流程模型集所包括的所有流程实例的覆盖程度。
[0012]本申请的一些实施例能有效模拟生成不同完备程度的日志数据,可以得到按照不同完备度条件生成的日志集合SL的算法评价结果报告,更全面的反应被评估流程挖掘算法的性能。
[0013]在一些实施例中,所述根据标准流程模型集生成测试数据,包括:生成所述标准流程模型集,其中,所述标准流程模型集中包括多个标准流程模型;根据所述标准流程模型集得到所述多组测试日志集。
[0014]本申请的一些实施例首先生成标准流程模型再根据标准流程模型生成完备程度不同的测试用的日志数据,可以保证数据量充足且数据类型丰富以便更好测试待评估流程挖掘算法的性能。
[0015]在一些实施例中,所述根据所述标准流程模型集得到所述多组测试日志集,包括:获取与任意一个标准流程模型对应的多种不同完备程度的日志数据,得到多个子测试日志集,其中,一个子测试日志集对应一个完备程度的日志数据;重复上述过程得到与所述流程模型集中各个标准流程模型分别对应的多个子测试日志集,将完备程度相同的所有子测试日志集确定为一组测试日志集得到所述多组测试日志集。
[0016]本申请的一些实施例通过获取标准流程模型集中个标准流程模型对应的不同完备程度的测试数据,进而得到多组测试日志集。
[0017]在一些实施例中,所述任意一个标准流程模型为第一标准流程模型,其中,所述获取与任意一个标准流程模型对应的多种不同完备程度的日志数据得到多个子测试日志集,包括:根据N个完备程度指标值和所述第一标准流程模型包括的所有流程实例的总个数确定N个子测试日志集中各个子测试日志集包括的流程实例数目,得到N个流程实例数目;根据所述第一标准流程模型生成与所述N个流程实例数目中各个流程实例数目对应数量的流程实例,得到N个子测试日志集。
[0018]本申请的一些实施例通过计算不同完备程度的测试数据所需的流程实例的数量,进而生成相应数量的流程实例得到对应的子测试日志集。
[0019]在一些实施例中,所述任意一个标准流程模型为第一标准流程模型,其中,所述获取与任意一个标准流程模型对应的多种不同完备程度的日志数据得到多个子测试日志集,包括:根据所述第一标准流程模型生成与第i流程实例数目相同数量的多条流程实例,得到第i日志数据;根据所述第i日志数据的精度值确定所述第i日志数据所属的子测试日志集,并将所述第i日志数据作为所属的子测试日志集的测试数据,其中,所述精度值用于评价所述第一标准流程模型所表达的行为中被所述第i日志数据记录的行为之间的差异性;根据
设置的步长值增加或减少第i流程实例数目的值,并重复执行上述过程直至得到所述多个子测试日志集。
[0020]本申请的一些实施例基于标准流程模型生成日志数据log,控制生成日志中的流程实例case的数量,然后评价该日志的精度值Precision,从而得到它的完备性指标Completeness,每一个标准流程模型M可以生成不同流程实例case数量的日志得到不同完备性的一组测试日志集G。
[0021]在一些实施例中,在首次循环中所述第i流程实例数目为设置的流程实例数量初始值。
[0022]本申请一些实施例通过设置的流程实例初始值控制首次根据第一标准流程模型生成的流程实例的数目。
[0023]在一些实施例中,通过如下公式计算所述第i日志数据的精度值:
[0024][0025]其中,L用于表征第i日志数据,M表征第一标准流程模型,||用于求解被求解对象包括的轨迹总数目。
[0026]本申请的一些实施例提供一种计算精度值的计算公式,通过该公式可以准确计算精度值,进而得到属于不同完备程度的日志数据。
[0027]在一些实施例中,所述根据所述第i日志数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种生成测试数据的方法,其特征在于,所述的方法包括:获取标准流程模型集,其中,所述标准流程模型集中包括多个标准流程模型;根据所述标准流程模型集生成测试数据。2.如权利要求1所述的方法,其特征在于,所述测试数据包括多组测试日志集,不同组的测试日志集的完备程度不同,所述完备程度用于表征任一组测试日志集的所有流程实例对所述标准流程模型集所包括的所有流程实例的覆盖程度。3.一种用于评估流程挖掘算法的方法,其特征在于,所述方法包括:根据标准流程模型集生成测试数据;通过待评估流程挖掘算法对所述测试数据进行流程挖掘得到待评估流程模型集;比较所述待评估流程集和所述标准流程模型集得到对所述待评估流程挖掘算法的评估结果。4.如权利要求3所述的方法,其特征在于,所述测试数据包括多组测试日志集,不同组的测试日志集的完备程度不同,所述完备程度用于表征任一组测试日志集的所有流程实例对所述标准流程模型集所包括的所有流程实例的覆盖程度。5.如权利要求4所述的方法,其特征在于,所述根据标准流程模型集生成测试数据,包括:生成所述标准流程模型集,其中,所述标准流程模型集中包括多个标准流程模型;根据所述标准流程模型集得到所述多组测试日志集。6.如权利要求5所述的方法,其特征在于,所述根据所述标准流程模型集得到所述多组测试日志集,包括:获取与任意一个标准流程模型对应的多种不同完备程度的日志数据,得到多个子测试日志集,其中,一个子测试日志集对应一个完备程度的日志数据;重复上述过程得到与所述流程模型集中各个标准流程模型分别对应的多个子测试日志集,将完备程度相同的所有子测试日志集确定为一组测试日志集得到所述多组测试日志集。7.如权利要求6所述的方法,其特征在于,所述任意一个标准流程模型为第一标准流程模型,其中,所述获取与任意一个标准流程模型对应的多种不同完备程度的日志数据得到多个子测试日志集,包括:根据N个完备程度指标值和所述第一标准流程模型包括的所有流程实例的总个数确定N个子测试日志集中各个子测试日志集包括的流程实例数目,得到N个流程实例数...

【专利技术属性】
技术研发人员:王健袁野高煜光
申请(专利权)人:上海弘玑信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1