System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种银行开发环境中海量用户信息脱敏方法技术_技高网

一种银行开发环境中海量用户信息脱敏方法技术

技术编号:41209131 阅读:3 留言:0更新日期:2024-05-09 23:31
本发明专利技术涉及数据处理技术领域,具体涉及一种银行开发环境中海量用户信息脱敏方法,包括:采集每个用户业务类型在每个用户中的若干用户业务数据;获取若干用户数据点集,根据不同用户业务类型之间受外界因素影响的关联情况以及用户业务数据整体的数据变化情况,得到每个用户数据点集的数据敏感度;根据用户数据点集的数据敏感度,对所有用户数据点集进行聚类得到若干级别聚类簇;对每个级别聚类簇进行数据防护处理,得到若干泛化后的用户业务数据。本发明专利技术更准确地识别需要进行脱敏的数据,提高了脱敏结果的准确性,提高了银行用户信息的脱敏效率。

【技术实现步骤摘要】

本专利技术涉及数据处理,具体涉及一种银行开发环境中海量用户信息脱敏方法


技术介绍

1、在银行的业务系统中存在大量不同类型的用户数据,随着业务的快速迭代,用户数据的数据量不断扩大,为了保证用户信息的数据安全;需要对用户数据中的敏感数据进行脱敏。

2、现有方法通常利用数据泛化的方式对所有用户数据统一进行脱敏处理,但在银行开发环境中若干外界因素一直处于动态变化的状态,使不同维度的数据受外界影响程度并不相同,使不同维度的数据存在不同的敏感情况,导致传统利用数据泛化进行脱敏的方式无法有效地识别需要进行脱敏的数据,降低了脱敏结果的准确性,降低了信息的脱敏效率。


技术实现思路

1、本专利技术提供一种银行开发环境中海量用户信息脱敏方法,以解决现有的问题:在银行开发环境中若干外界因素一直处于动态变化的状态,使不同维度的数据受外界影响程度并不相同,使不同维度的数据存在不同的敏感情况,导致传统利用数据泛化进行脱敏的方式无法有效地识别需要进行脱敏的数据。

2、本专利技术的一种银行开发环境中海量用户信息脱敏方法采用如下技术方案:

3、包括以下步骤:

4、采集每个用户业务类型在每个用户中的若干用户业务数据,所述每个用户业务类型对应多个记录时刻,每个记录时刻对应多个用户业务数据;

5、对于任意一个用户以及任意一个记录时刻,将用户在记录时刻下所有用户业务类型的用户业务数据整体构成的数据集记为用户在记录时刻下的用户数据点集,根据不同用户业务类型之间受外界因素影响的关联情况以及用户业务数据整体的数据变化情况,得到每个用户数据点集的数据敏感度;根据用户数据点集的数据敏感度,对所有用户数据点集进行聚类得到若干级别聚类簇;

6、对每个级别聚类簇进行数据防护处理,得到若干泛化后的用户业务数据。

7、优选的,所述根据不同用户业务类型之间受外界因素影响的关联情况以及用户业务数据整体的数据变化情况,得到每个用户数据点集的数据敏感度,包括的具体方法为:

8、根据每个用户业务类型在若干用户中的用户业务数据整体的变化情况,得到每个用户业务类型的数据波动因子;

9、根据每个用户业务类型与其他用户业务类型之间数据波动因子的差异情况,得到每个用户业务类型的用户维度互相关程度;

10、根据每个用户业务类型的用户维度互相关程度得到每个用户数据点集的综合维度敏感度;

11、获取每个用户的核心业务程度;

12、根据所有用户数据点集内每个用户业务类型的用户维度互相关程度、对应用户的核心业务程度以及第个用户数据点集的综合维度敏感度,得到第个用户数据点集的数据敏感度;具体方法为:

13、

14、式中,表示第个用户数据点集的数据敏感度;表示第个用户数据点集的综合维度敏感度;表示所有用户数据点集的数量;表示所有用户业务类型的数量;表示第个用户数据点集在第个用户业务类型的用户维度互相关程度;表示第个用户数据点集对应用户的核心业务程度;表示第个用户数据点集在第个用户业务类型的用户维度互相关程度;表示取绝对值。

15、优选的,所述根据每个用户业务类型在若干用户中的用户业务数据整体的变化情况,得到每个用户业务类型的数据波动因子,包括的具体方法为:

16、获取每个用户业务类型的所有核心用户;

17、

18、式中,表示第个用户业务类型的数据波动因子;表示第个用户业务类型的所有核心用户的数量;表示第个用户业务类型在第个核心用户中所有用户业务数据的数量;表示第个用户业务类型在第个核心用户中的第个用户业务数据;表示第个用户业务类型在所有核心用户中的所有用户业务数据的均值;表示取绝对值。

19、优选的,所述获取每个用户业务类型的所有核心用户,包括的具体方法为:

20、对于任意一个用户以及任意一个用户业务类型,若用户业务类型在用户中的用户业务数据不为0,将用户记为用户业务类型的核心用户。

21、优选的,所述根据每个用户业务类型与其他用户业务类型之间数据波动因子的差异情况,得到每个用户业务类型的用户维度互相关程度,包括的具体方法为:

22、获取第个用户业务类型的所有对照用户业务类型;

23、

24、式中,表示第个用户业务类型的用户维度互相关程度;表示第个用户业务类型的所有对照用户业务类型的数量;表示第个用户业务类型的数据波动因子;表示第个用户业务类型的第个对照用户业务类型的数据波动因子;表示所有对照用户业务类型的数据波动因子的最大值;表示以自然常数为底的指数函数;表示取绝对值。

25、优选的,所述获取第个用户业务类型的所有对照用户业务类型,包括的具体方法为:

26、将除第个用户业务类型以外的每个用户业务类型记为对照用户业务类型。

27、优选的,所述根据每个用户业务类型的用户维度互相关程度得到每个用户数据点集的综合维度敏感度,包括的具体方法为:

28、将第个用户数据点集中所有用户业务类型的用户维度互相关程度的均值记为第个用户数据点集的综合维度敏感度。

29、优选的,所述获取每个用户的核心业务程度,包括的具体方法为:

30、对于任意一个用户、任意一个记录时刻以及任意一个用户业务类型,若用户是用户业务类型的核心用户,将用户业务类型记为用户的核心用户业务类型;将用户的所有核心用户业务类型数量与用户的所有用户业务类型数量的比值,记为用户的核心业务程度。

31、优选的,所述根据用户数据点集的数据敏感度,对所有用户数据点集进行聚类得到若干级别聚类簇,包括的具体方法为:

32、预设一个邻域半径以及一个最小点数,将不同用户数据点集之间数据敏感度的差值的绝对值作为距离度量,根据以及距离度量对所有用户数据点集进行dbscan聚类得到若干聚类簇,并将每个聚类簇记为级别聚类簇。

33、优选的,所述对每个级别聚类簇进行数据防护处理,得到若干泛化后的用户业务数据,包括的具体方法为:

34、对每个级别聚类簇内的所有用户业务数据分别进行数据置换处理,得到若干置换后的用户业务数据;对所有置换后的用户业务数据进行数据泛化处理,得到若干泛化后的用户业务数据。

35、本专利技术的技术方案的有益效果是:通过分析不同用户业务类型之间与外界因素之间联系情况,以及用户业务数据整体的数据变化情况,将所有用户业务数据划分为若干级别聚类簇,从而对每个级别聚类簇进行防护处理;首先根据不同用户业务类型之间受外界因素影响的关联情况以及用户业务数据整体的数据变化情况,得到每个用户数据点集的数据敏感度,其中数据敏感度用于描述用户业务数据受外界影响容易丢失的程度,更易观察到用户业务数据与外界因素之间的联系,并且在一定程度上表示了用户业务数据对于银行以及用户的重要性;然后根据用户数据点集的数据敏感度,进行聚类得到若干级别聚类簇,其中级别聚类簇用于描述用户业务数据的防护等级,将需要进本文档来自技高网...

【技术保护点】

1.一种银行开发环境中海量用户信息脱敏方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述一种银行开发环境中海量用户信息脱敏方法,其特征在于,所述根据不同用户业务类型之间受外界因素影响的关联情况以及用户业务数据整体的数据变化情况,得到每个用户数据点集的数据敏感度,包括的具体方法为:

3.根据权利要求2所述一种银行开发环境中海量用户信息脱敏方法,其特征在于,所述根据每个用户业务类型在若干用户中的用户业务数据整体的变化情况,得到每个用户业务类型的数据波动因子,包括的具体方法为:

4.根据权利要求3所述一种银行开发环境中海量用户信息脱敏方法,其特征在于,所述获取每个用户业务类型的所有核心用户,包括的具体方法为:

5.根据权利要求2所述一种银行开发环境中海量用户信息脱敏方法,其特征在于,所述根据每个用户业务类型与其他用户业务类型之间数据波动因子的差异情况,得到每个用户业务类型的用户维度互相关程度,包括的具体方法为:

6.根据权利要求5所述一种银行开发环境中海量用户信息脱敏方法,其特征在于,所述获取第个用户业务类型的所有对照用户业务类型,包括的具体方法为:

7.根据权利要求2所述一种银行开发环境中海量用户信息脱敏方法,其特征在于,所述根据每个用户业务类型的用户维度互相关程度得到每个用户数据点集的综合维度敏感度,包括的具体方法为:

8.根据权利要求3所述一种银行开发环境中海量用户信息脱敏方法,其特征在于,所述获取每个用户的核心业务程度,包括的具体方法为:

9.根据权利要求1所述一种银行开发环境中海量用户信息脱敏方法,其特征在于,所述根据用户数据点集的数据敏感度,对所有用户数据点集进行聚类得到若干级别聚类簇,包括的具体方法为:

10.根据权利要求1所述一种银行开发环境中海量用户信息脱敏方法,其特征在于,所述对每个级别聚类簇进行数据防护处理,得到若干泛化后的用户业务数据,包括的具体方法为:

...

【技术特征摘要】

1.一种银行开发环境中海量用户信息脱敏方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述一种银行开发环境中海量用户信息脱敏方法,其特征在于,所述根据不同用户业务类型之间受外界因素影响的关联情况以及用户业务数据整体的数据变化情况,得到每个用户数据点集的数据敏感度,包括的具体方法为:

3.根据权利要求2所述一种银行开发环境中海量用户信息脱敏方法,其特征在于,所述根据每个用户业务类型在若干用户中的用户业务数据整体的变化情况,得到每个用户业务类型的数据波动因子,包括的具体方法为:

4.根据权利要求3所述一种银行开发环境中海量用户信息脱敏方法,其特征在于,所述获取每个用户业务类型的所有核心用户,包括的具体方法为:

5.根据权利要求2所述一种银行开发环境中海量用户信息脱敏方法,其特征在于,所述根据每个用户业务类型与其他用户业务类型之间数据波动因子的差异情况,得到每个用户业务类型的用户维度互相关程度,包...

【专利技术属性】
技术研发人员:唐军孙金泉史婷婷彭向南
申请(专利权)人:江苏开博科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1