一种数据处理方法和数据处理系统技术方案

技术编号:35763357 阅读:11 留言:0更新日期:2022-12-01 13:58
本发明专利技术提供一种数据处理方法和数据处理系统,涉及大数据处理领域,该数据处理方法包括:获取待分配案件;调用预测模型对所述待分配案件进行预测,得到所述待分配案件的工作量;确定与所述待分配案件的类型对应的办案人员;获取所述办案人员手头已有案件的工作量;基于所述待分配案件的工作量以及所述办案人员手头已有案件的工作量进行案件分配。本发明专利技术使用机器学习算法预测新案件的办理时长,合理、科学地对新案件进行分配,避免案件处于积压状态,以提高办案效能,提升办案人员利用率,解决办案人员工作量难以科学自动评估的问题。解决办案人员工作量难以科学自动评估的问题。解决办案人员工作量难以科学自动评估的问题。

【技术实现步骤摘要】
一种数据处理方法和数据处理系统


[0001]本专利技术涉及数据处理
,尤其涉及一种数据处理方法和数据处理系统。

技术介绍

[0002]案件在立案以后通常会根据案件类型、案由等因素分配合适的办理人员。现有的案件分配方法通常是将案件随机分配给办理人员,未考虑办理人员手头案件的工作量以及擅长处理的案件类型,从而造成案件的积压,办案效率低。

技术实现思路

[0003]本专利技术实施例提供一种数据处理方法和数据处理系统,可以解决现存案件分配方法易造成案件积压,导致办案效率低的缺点。
[0004]为解决上述技术问题,本专利技术提供一种数据处理方法,所述方法包括:
[0005]获取待分配案件;
[0006]调用预测模型对所述待分配案件进行预测,得到所述待分配案件的工作量;
[0007]确定与所述待分配案件的类型对应的办案人员;
[0008]获取所述办案人员手头已有案件的工作量;
[0009]基于所述待分配案件的工作量以及所述办案人员手头已有案件的工作量进行案件分配。
[0010]可选的,上述数据处理方法中,所述获取待分配案件的步骤之前,所述方法还包括:
[0011]基于案件样本数据对算法模型进行训练,建立所述预测模型。
[0012]可选的,上述数据处理方法中,基于案件样本数据对算法模型进行训练,建立所述预测模型之前,所述方法还包括:获取所述案件样本数据的元数据;根据所述元数据,确定用于建模的算法模型。
[0013]可选的,上述数据处理方法中,所述基于案件样本数据对算法模型进行训练,建立所述预测模型的步骤之前,所述方法包括:
[0014]获取案件样本数据;
[0015]对所述案件样本数据进行预处理,得到目标案件数据;
[0016]使用特征重要性分析方法对所述目标案件数据进行特征重要性分析,得到特征重要性结果。
[0017]可选的,上述数据处理方法中,所述使用特征重要性分析方法对所述目标案件数据进行特征重要性分析,得到特征重要性结果的步骤之后,所述方法还包括:
[0018]基于特征重要性结果对所述目标案件数据进行特征筛选,得到所述预测模型的目标特征变量。
[0019]可选的,上述数据处理方法中,所述使用特征重要性分析方法对所述目标案件数据进行特征重要性分析,得到特征重要性结果的步骤包括:
[0020]根据所述预测模型的类型确定特征重要性分析方法;
[0021]使用所述特征重要性分析方法对所述目标案件数据的各个特征变量进行重要分析,得到所述各个特征变量的重要性度量值。
[0022]可选的,上述数据处理方法中,所述基于特征重要性结果对所述目标案件数据进行特征筛选,得到所述预测模型的目标特征变量的步骤包括:
[0023]基于所述各个特征变量的重要性度量值对所述各个特征变量进行筛选,得到用于建立所述预测模型的目标特征变量。
[0024]可选的,上述数据处理方法中,所述对所述案件样本数据进行预处理,得到目标案件数据的步骤包括:
[0025]基于案件信息及业务等级代码的预设对应关系确定所述案件样本数据中各个特征变量的业务等级代码;
[0026]基于所述业务等级代码对所述各个特征变量进行合并,得到所述目标案件数据。
[0027]可选的,上述数据处理方法中,所述特征重要性分析方法包括以下至少一项:信息值、互信息、卡方检验、方差分析、随机森林、皮尔森相关系数法、极端树特征选择法和递归特征消除法。
[0028]可选的,上述数据处理方法中,所述预处理还包括以下至少一项:
[0029]数据去重、数据异常值处理、数据缺失值处理、数据唯一值处理。
[0030]可选的,上述数据处理方法中,所述基于案件样本数据对算法模型进行训练,建立所述预测模型的步骤包括:
[0031]基于所述案件样本数据确定案件审查流程;
[0032]基于所述案件样本数据以及所述案件审查流程,建立所述预测模型。
[0033]可选的,上述数据处理方法中,所述基于案件样本数据确定案件审查流程的步骤包括:
[0034]调用预先建立的案件审查流程预测模型对所述案件样本数据进行预测,得到所述案件审查流程。
[0035]可选的,上述数据处理方法中,所述案件审查流程预测模型包括至少一个算法模型。
[0036]可选的,上述数据处理方法中,所述算法模型包括以下至少一项:
[0037]逻辑回归、随机森林、Bagging、AdaBoost、投票模型、神经网络、堆栈模型、梯度提升、多项式贝叶斯、GBDT算法、Xgboost算法、Lightgbm算法和支持向量机。
[0038]本专利技术提供一种数据处理系统,所述数据处理系统包括:
[0039]第一获取模块,用于获取待分配案件;
[0040]预测模块,用于调用预测模型对所述待分配案件进行预测,得到所述待分配案件的工作量;
[0041]第一确定模块,用于确定与所述待分配案件的类型对应的办案人员;
[0042]第二获取模块,用于获取所述办案人员手头已有案件的工作量;
[0043]分配模块,用于基于所述待分配案件的工作量以及所述办案人员手头已有案件的工作量进行案件分配。
[0044]可选的,所述数据处理系统还包括:
[0045]第一建立模块,用于基于案件样本数据对算法模型进行训练,建立所述预测模型。
[0046]可选的,上述数据处理系统中,
[0047]所述数据处理系统还包括:
[0048]第三获取模块,用于获取所述案件样本数据的元数据;
[0049]第二确定模块,用于根据所述元数据,确定用于建模的算法模型。
[0050]可选的,所述数据处理系统还包括:
[0051]第四获取模块,用于获取案件样本数据;
[0052]预处理模块,用于对所述案件样本数据进行预处理,得到目标案件数据;
[0053]分析模块,用于使用特征重要性分析方法对所述目标案件数据进行特征重要性分析,得到特征重要性结果。
[0054]可选的,所述数据处理系统还包括:
[0055]筛选模块,用于基于特征重要性结果对所述目标案件数据进行特征筛选,得到所述预测模型的目标特征变量。
[0056]可选的,所述分析模块具体用于:
[0057]根据所述预测模型的类型确定特征重要性分析方法;
[0058]使用所述特征重要性分析方法对所述目标案件数据的各个特征变量进行重要分析,得到所述各个特征变量的重要性度量值。
[0059]可选的,上述数据处理系统中,所述筛选模块具体用于:
[0060]基于所述各个特征变量的重要性度量值对所述各个特征变量进行筛选,得到用于建立所述预测模型的目标特征变量。
[0061]可选的,上述数据处理系统中,所述预处理模块包括:
[0062]第一确定子模块,用于基于案件信本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取待分配案件;调用预测模型对所述待分配案件进行预测,得到所述待分配案件的工作量;确定与所述待分配案件的类型对应的办案人员;获取所述办案人员手头已有案件的工作量;基于所述待分配案件的工作量以及所述办案人员手头已有案件的工作量进行案件分配。2.根据权利要求1所述的数据处理方法,其特征在于,所述获取待分配案件的步骤之前,所述方法还包括:基于案件样本数据对算法模型进行训练,建立所述预测模型。3.根据权利要求2所述的数据处理方法,其特征在于,所述基于案件样本数据对算法模型进行训练,建立所述预测模型的步骤之前,所述方法包括:获取案件样本数据;对所述案件样本数据进行预处理,得到目标案件数据;使用特征重要性分析方法对所述目标案件数据进行特征重要性分析,得到特征重要性结果。4.根据权利要求3所述的数据处理方法,其特征在于,所述使用特征重要性分析方法对所述目标案件数据进行特征重要性分析,得到特征重要性结果的步骤之后,所述方法还包括:基于特征重要性结果对所述目标案件数据进行特征筛选,得到所述预测模型的目标特征变量。5.根据权利要求3所述的数据处理方法,其特征在于,所述对所述案件样本数据进行预处理,得到目标案件数据的步骤包括:基于案件信息以及业务等级代码的预设对应关系确定所述案件样本数据中各个特征变量的业务等级代码;基于所述业务等级代码对所述各个特征变量进行合并,得到所述目标案件数据。6.一种数据处...

【专利技术属性】
技术研发人员:朱瑞作刘军李建鹏周春张宏李颖姝
申请(专利权)人:山东省青岛市人民检察院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1