一种基于决策树的缺失数据流程异常预测方法技术

技术编号：37321760 阅读：31 留言：0更新日期：2023-04-21 23:01

本发明专利技术涉及一种基于决策树的缺失数据流程异常预测方法，从数据仓库中大量流程运行及业务数据中，随机取足量的流程运行数据、流程对应的业务数据；对取出的数据进行清洗和合并；分析训练数据，分类统计缺失项在4种之内的数据，根据不同的数据缺失项的有无，构造多个决策树模型；将训练数据复制m份，按照每颗决策树对数据的要求，分别去掉某几项数据，或补充某几项数据；使用训练好的m颗决策树模型对运行中以及新启动的业务流程进行流程预测；取m颗决策树中，预测结果占多数的结果为最终结果。本发明专利技术能够在大量缺失数据的情况下，有效实现流程的异常预测且准确率较高。实现流程的异常预测且准确率较高。实现流程的异常预测且准确率较高。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于决策树的缺失数据流程异常预测方法

[0001]本专利技术属于人工智能领域，涉及一种基于决策树的缺失数据流程异常预测方法。

技术介绍

[0002]随着各行业信息化水平的迅速发展，业务流程信息化水平已成为各行业各大中型企业信息化程度衡量的标准，随着业务流程信息化技术的发展，流程异常成为各行业的痛点，精准而有效的流程异常预测功能显得日益迫切，因此，流程异常预测技术逐渐成为各行业以及各大中型企业的重点研究问题。而往往在企业历史流程中，存在大量缺失数据，大量缺失数据的流程异常的智能预测的训练问题，具有较大的复杂性，也使得流程异常预测实现更加困难。
[0003]流程预测技术可提前侦测到的流程异常风险，从而避免将会发生的风险事件。然而随着企业信息化技术的飞速发展，企业的流程在不断优化，流程对应的业务数据的需求也在不断变更。同一个业务流程涉及的多个历史版本的流程数据和业务数据也不尽相同，导致流程的数据项完整度不一致的现象频发出现。想要寻找大量的，拥有同样完整度信息的流程数据难度非常大，不便于人工智能工作的研究。常规的流程异常...

【技术保护点】

【技术特征摘要】
1.一种基于决策树的缺失数据流程异常预测方法，其特征在于，包括以下步骤：步骤1，从数据仓库中大量流程运行及业务数据中，随机取足量的流程运行数据、流程对应的业务数据；步骤2，取出的流程运行数据和流程业务数据，按照业务数据和流程数据关联关系进行数据合并；步骤3，分析训练数据，分类统计缺失项在4种之内的数据，根据不同的数据缺失项的有无，构造多个决策树模型，决策树个数为m＝2^n，n为缺失项个数；步骤4，将训练数据复制m份，按照每颗决策树对数据的要求，分别去掉某几项数据，或补充某几项数据，每组数据，分别训练m棵决策树，形成多颗决策树，补充数据方法可采用均值填充、中位数填充等方法；步骤5，使用训练好的m颗决策树模型对运行中以及新启动的业务流程...

【专利技术属性】
技术研发人员：李逊，
申请(专利权)人：北京航天长峰科技工业集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人