【技术实现步骤摘要】
一种业务流程的自动分类方法、装置及存储介质
[0001]本专利技术涉及一种业务流程的自动分类方法、装置及存储介质,属于流程挖掘
技术介绍
[0002]流程挖掘算法从日志文件中还原出业务流程的执行过程,方便企业诊断业务执行过程中存在的问题。在日志文件中往往同时存在大量不同的业务,不同业务的流程放在一个流程图中分析,往往会让流程图的过于复杂,难以理解业务的主干流程,并且不同业务之间会因存在相同节点而相互干扰,影响对业务流程的分析。
[0003]对日志文件进行切分的一般方式是为每个业务指定开始、结束事件,不同的业务对应不同的开始、结束事件对。还可以在生成日志文件时,为每个业务保存为一个单独的文件,不同业务放在不同的目录中。但在实际环境中,上述两种方式都非常繁琐,需要大量的人力投入,而且业务的定义、业务分析的范围都非常灵活,不方便预先定义,或者即使预先定义也无法解决所有的问题,所以需要一种自动化的方式来对业务进行分组,在保证准确率的基础上提供较大的灵活性。
技术实现思路
[0004]本专利技术的目的 ...
【技术保护点】
【技术特征摘要】
1.一种业务流程的自动分类方法,其特征在于,包括:获取日志文件,每一行是一条事件记录,每条事件记录代表一个事件,包含时间戳和业务编号属性;选择日志文件中每条事件记录中的一个或者多个属性,经过转换、映射与合并操作,获得第一事件名称作为新属性,该属性代表当前事件记录所对应的事件;根据每条事件记录的业务编号分组,将同组相同业务编号的事件记录按照时间戳排序,然后将该组事件记录合并为一条业务记录,包含开始时间戳、结束时间戳、业务编号、第二事件名称属性;使用预先训练好的模型根据第二事件名称对所述业务记录进行业务类别分类,将得到的业务类别作为所述业务记录的业务类别属性;根据业务类别属性,对不同业务类别的业务记录分别应用流程挖掘算法,获得不同业务类型的流程图。2.根据权利要求1所述的业务流程的自动分类方法,其特征在于,所述第二事件名称为该组事件记录中每条事件记录的第一事件名称拼接而成,所述开始时间戳和结束时间戳分别为对应事件记录组中按时间顺序排列的第一个时间戳为和最后一个时间戳,所述业务编号为事件记录中的业务编号。3.根据权利要求1所述的业务流程的自动分类方法,其特征在于,所述使用预先训练好的模型根据业务记录的第二事件名称对所述业务记录进行业务类别分类,包括:使用分类模型根据第二事件名称对所述业务记录进行业务类别分类,分类模型预测输出即为业务类别。4.根据权利要求1所述的业务流程的自动分类方法,其特征在于,还包括:使用聚类模型对业务记录的第二事件名称进行聚类,每个聚类就是相同类型业务的集合,为每个集合指定一个业务类别,获得所有...
【专利技术属性】
技术研发人员:靳志业,吴鑫,林平,唐琦松,蒋奕然,
申请(专利权)人:上海艺赛旗软件股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。