数据处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:39053042 阅读:7 留言:0更新日期:2023-10-12 19:45
本申请涉及一种数据处理方法、装置、计算机设备、存储介质和计算机程序产品,涉及大数据技术领域。所述方法包括:获取目标数据表,所述目标数据表中包含目标时间段的多个业务处理数据;基于目标聚类分析策略,针对各聚类指标对所述目标数据表中的各所述业务处理数据进行聚类处理,得到各所述聚类指标对应的多个聚类结果;根据各所述聚类结果中的各所述业务处理数据,确定各所述聚类结果之间的关联关系;根据各所述聚类结果之间的关联关系,从各所述聚类结果中确定至少一个目标聚类结果组,并根据各所述目标聚类结果组,生成数据分析结果。采用本方法,能够确定存在单个工作人员负责全局业务的模式的风险的时间节点或行为节点。点。点。

【技术实现步骤摘要】
数据处理方法、装置、计算机设备和存储介质


[0001]本申请涉及大数据
,特别是涉及一种数据处理方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]在业务处理过程中,用户发起的业务处理请求,往往通过一个工作人员进行处理。这种单个工作人员负责全局业务的模式,会导致业务系统安全性较低。
[0003]目前,针对单个工作人员负责用户全局业务的模式,能够在业务处理过程中,通过多个工作人员分别对部分业务进行处理,从而避免单个工作人员负责全局业务的模式带来的安全问题。
[0004]然而,在实际工作中,由于用户数量多、人力资源少等因素还是不可避免产生单个工作人员负责全局业务的模式的问题,并且业务系统中,也无法判断是否存在单个工作人员负责全局业务的模式的风险。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种能够检测业务系统中存在单个工作人员负责全局业务的模式风险的数据处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0006]第一方面,本申请提供了一种数据处理方法。所述方法包括:
[0007]获取目标数据表,所述目标数据表中包含目标时间段的多个业务处理数据;
[0008]基于目标聚类分析策略,针对各聚类指标对所述目标数据表中的各所述业务处理数据进行聚类处理,得到各所述聚类指标对应的多个聚类结果;
[0009]根据各所述聚类结果中的各所述业务处理数据,确定各所述聚类结果之间的关联关系;
[0010]根据各所述聚类结果之间的关联关系,从各所述聚类结果中确定至少一个目标聚类结果组,并根据各所述目标聚类结果组,生成数据分析结果。
[0011]在其中一个实施例中,所述基于目标聚类分析策略,针对各聚类指标对所述目标数据表中的各所述业务处理数据进行聚类处理,得到各所述聚类指标对应的多个聚类结果,包括:
[0012]针对任一所述聚类指标,确定所述目标数据表中所述聚类指标对应的目标聚类结果数目;
[0013]基于所述目标聚类结果数目和目标聚类分析算法,对所述目标数据表中的各所述业务处理数据进行聚类处理,得到所述聚类指标对应的所述目标聚类结果数目个聚类结果。
[0014]在其中一个实施例中,所述针对任一所述聚类指标,确定所述目标数据表中所述聚类指标对应的目标聚类结果数目,包括:
[0015]针对任一所述聚类指标,根据所述聚类指标对应的业务处理数据的数目,确定所述聚类指标对应的多个聚类结果数目;
[0016]确定所述聚类指标对应的各所述聚类结果数目对应的误差平方和,并根据各所述聚类结果数目对应的误差平方和,确定任意两个相邻所述聚类结果数目对应的样本平方误差和之间的差值;
[0017]根据各所述差值中的目标差值,确定所述聚类指标对应的目标聚类结果数目,所述目标聚类结果数目为所述目标差值对应的两个相邻所述聚类结果数目中较大的聚类结果数目。
[0018]在其中一个实施例中,所述根据各所述聚类结果中的各所述业务处理数据,确定各所述聚类结果之间的关联关系,包括:
[0019]根据所述目标数据表中各所述业务处理数据针对各所述聚类结果的数据,确定所述目标数据表对应的事务表,所述事务表包括各所述业务处理数据针对各所述聚类结果的项;
[0020]根据所述事务表中各所述业务处理数据针对各所述聚类结果的项,确定第一项集;
[0021]根据预设最小支持度和所述第一项集,确定第二项集;
[0022]根据所述第二项集,确定所述第二项集中的各个项的关联规则,并基于所述第二项集中的各所述项的关联规则,确定各所述聚类结果之间的关联关系。
[0023]在其中一个实施例中,所述根据预设最小支持度和所述第一项集,确定第二项集,包括:
[0024]在第k轮处理过程中,根据预设最小支持度,在第k

1频繁项集中,确定满足所述预设最小支持度的第k频繁项集,并在所述第k频繁项集中项的数目低于或者等于预设项数时,进入第k+1轮处理过程,直至第m频繁项集中项的数目高于所述预设项数为止;
[0025]将各轮次处理过程中的频繁项集,作为第二项集;其中,k与m均为正整数,在k为1的情况下,所述第k

1频繁项集为包含一个项的所述第一项集。
[0026]在其中一个实施例中,所述基于所述第二项集中的各所述项的关联规则,确定各所述聚类结果之间的关联关系,包括:
[0027]根据所述第二项集的支持度以及各所述第二项集中各个项之间的关联规则,确定所述第二项集中各所述项之间的关联规则的置信度;
[0028]在所述第二项集中各所述项之间的关联规则中,将置信度大于或者等于预设最小置信度的关联规则,作为目标关联规则;
[0029]根据所述目标关联规则对应的各所述聚类结果及所述目标关联规则的置信度,确定各所述聚类结果之间的关联关系。
[0030]在其中一个实施例中,所述根据各所述聚类结果之间的关联关系,从各所述聚类结果中确定至少一个目标聚类结果组,包括:
[0031]针对各所述聚类结果中的目标聚类结果,在各所述聚类结果中,将所述目标聚类结果以及与所述目标聚类结果存在关联关系的所述聚类结果,确定为一个目标聚类结果组,所述目标聚类结果为各所述聚类结果中的任一所述聚类结果。
[0032]在其中一个实施例中,所述获取目标数据表之前,还包括:
[0033]获取多个初始业务处理数据;
[0034]对各所述初始业务处理数据进行数据清洗,得到多个业务处理数据;
[0035]基于各所述业务处理数据,构建目标数据表。
[0036]第二方面,本申请还提供了一种数据处理装置。所述装置包括:
[0037]获取模块,用于获取目标数据表,所述目标数据表中包含目标时间段的多个业务处理数据;
[0038]聚类模块,用于基于目标聚类分析策略,针对各聚类指标对所述目标数据表中的各所述业务处理数据进行聚类处理,得到各所述聚类指标对应的多个聚类结果;
[0039]确定模块,用于根据各所述聚类结果中的各所述业务处理数据,确定各所述聚类结果之间的关联关系;
[0040]生成模块,用于根据各所述聚类结果之间的关联关系,从各所述聚类结果中确定至少一个目标聚类结果组,并根据各所述目标聚类结果组,生成数据分析结果。
[0041]在其中一个实施例中,所述聚类模块具体用于:
[0042]针对任一所述聚类指标,确定所述目标数据表中所述聚类指标对应的目标聚类结果数目;
[0043]基于所述目标聚类结果数目和目标聚类分析算法,对所述目标数据表中的各所述业务处理数据进行聚类处理,得到所述聚类指标对应的所述目标聚类结果数目个聚类结果。
[0044]在其中一个实施例中,所述聚类模块具体用于:
[0045]针对任一所述聚类指标,根据所述聚类指标对应的业务处理数据的数目,确定所述聚类指标对应本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取目标数据表,所述目标数据表中包含目标时间段的多个业务处理数据;基于目标聚类分析策略,针对各聚类指标对所述目标数据表中的各所述业务处理数据进行聚类处理,得到各所述聚类指标对应的多个聚类结果;根据各所述聚类结果中的各所述业务处理数据,确定各所述聚类结果之间的关联关系;根据各所述聚类结果之间的关联关系,从各所述聚类结果中确定至少一个目标聚类结果组,并根据各所述目标聚类结果组,生成数据分析结果。2.根据权利要求1所述的方法,其特征在于,所述基于目标聚类分析策略,针对各聚类指标对所述目标数据表中的各所述业务处理数据进行聚类处理,得到各所述聚类指标对应的多个聚类结果,包括:针对任一所述聚类指标,确定所述目标数据表中所述聚类指标对应的目标聚类结果数目;基于所述目标聚类结果数目和目标聚类分析算法,对所述目标数据表中的各所述业务处理数据进行聚类处理,得到所述聚类指标对应的所述目标聚类结果数目个聚类结果。3.根据权利要求2所述的方法,其特征在于,所述针对任一所述聚类指标,确定所述目标数据表中所述聚类指标对应的目标聚类结果数目,包括:针对任一所述聚类指标,根据所述聚类指标对应的业务处理数据的数目,确定所述聚类指标对应的多个聚类结果数目;确定所述聚类指标对应的各所述聚类结果数目对应的误差平方和,并根据各所述聚类结果数目对应的误差平方和,确定任意两个相邻所述聚类结果数目对应的样本平方误差和之间的差值;根据各所述差值中的目标差值,确定所述聚类指标对应的目标聚类结果数目,所述目标聚类结果数目为所述目标差值对应的两个相邻所述聚类结果数目中较大的聚类结果数目。4.根据权利要求1所述的方法,其特征在于,所述根据各所述聚类结果中的各所述业务处理数据,确定各所述聚类结果之间的关联关系,包括:根据所述目标数据表中各所述业务处理数据针对各所述聚类结果的数据,确定所述目标数据表对应的事务表,所述事务表包括各所述业务处理数据针对各所述聚类结果的项;根据所述事务表中各所述业务处理数据针对各所述聚类结果的项,确定第一项集;根据预设最小支持度和所述第一项集,确定第二项集;根据所述第二项集,确定所述第二项集中的各个项的关联规则,并基于所述第二项集中的各所述项的关联规则,确定各所述聚类结果之间的关联关系。5.根据权利要求4所述的方法,其特征在于,所述根据预设最小支持度和所述第一项集,确定第二项集,包括:在第k轮处理过程中,根据预设最小支持度,在第k

1频繁项集中,确定满足所述预设最小支持度的第k频繁项集,并在所述第k频繁项集中项的...

【专利技术属性】
技术研发人员:王贤
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1