System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术实施例涉及计算机数据处理,具体涉及一种数据自动分类分级方法、装置、设备以及计算机存储介质。
技术介绍
1、证券公司作为金融行业的重要组成部分,具备着金融市场的重要职能,而证券公司所接触到的客户数据日益庞大且复杂,对客户数据进行分类分级迫在眉睫。专利技术人发现:目前证券公司缺少一种能自动对客户数据分类管理的方案,其数据分类效率和准确率都较低,从而导致数据管理效率和数据利用率较低。
2、因此,需要一种针对证券业务的客户数据的自动分类分级方案。
技术实现思路
1、鉴于上述问题,本专利技术实施例提供了一种数据自动分类分级方法、装置、设备以及计算机存储介质,用于解决现有技术中存在的数据分类效率以及准确率较低的问题。
2、根据本专利技术实施例的一个方面,提供了一种数据自动分类分级方法,所述方法包括:
3、获取待管理数据;
4、根据预设的数据特征维度对所述待管理数据进行特征提取,得到所述待管理数据的目标数据特征信息;
5、将所述目标数据特征信息与至少一个可选数据特征条件进行匹配,得到所述目标数据特征信息所匹配的目标数据特征条件;其中,一个所述可选数据特征条件用于表征一个可选数据特征标签下的数据的数据特征值所满足的条件;
6、将所述目标数据特征条件对应的所述可选数据特征标签确定为所述待管理数据的目标数据特征标签;
7、根据所述目标数据特征标签在预设的数据分类分级模板中进行查找,得到所述待管理数据的数据分类
8、在一种可选的方式中,所述方法还包括:
9、获取至少一个重点参考系统对应的系统数据;所述系统数据包括多个可选数据字段对应的字段属性信息;
10、对各条所述字段属性信息对应的数据分类分级标签进行人工标注;
11、对各个所述数据分类分级标签的所述字段属性信息进行关联分析,得到各个所述数据分类分级标签对应的所述可选数据特征条件;
12、根据属于同一所述数据分类分级标签的所述字段属性信息确定所述数据分类分级标签对应的可选数据特征标签;
13、将属于同一所述数据分类分级标签的所述可选数据特征标签以及所述可选数据特征条件确定为相互对应。
14、在一种可选的方式中,所述方法还包括:
15、对属于同一所述数据分类分级标签的所述字段属性信息在多个可选数据特征维度下进行数据特征提取,得到各个所述字段属性信息的数据特征信息;
16、根据所有所述数据特征信息分别对应的数据分类分级标签以及预设的决策树模型,确定各个所述可选数据特征维度对应的特征分类权重;其中,所述决策树模型的一个节点对应于一个所述可选数据特征维度;所述特征分类权重用于表征所述可选数据特征维度下的数据特征值对于所述数据特征信息划分到不同的数据分类分级标签下的影响权重;
17、根据所述特征分类权重对所述可选数据特征维度进行筛选,得到目标数据特征维度;
18、对属于同一所述数据分类分级标签的所述数据特征信息在所述目标数据特征维度下的特征值进行统计,得到所述可选数据分类分级标签对应的至少一个所述可选数据特征条件。
19、在一种可选的方式中,所述方法还包括:
20、对属于同一所述数据分类分级标签的所有所述字段属性信息进行关键词提取,得到所述数据分类分级标签对应的所述可选数据特征标签。
21、在一种可选的方式中,所述方法还包括:
22、获取数据管理人员基于预设的数据资产调研表提交的数据资产调研结果;所述数据调研表中包括数据资产所属系统字段以及数据资产明细信息字段;
23、根据所述数据资产调研结果确定待采集系统以及待采集字段;
24、从所述待管理系统中获取所述待采集字段下的字段值信息,得到所述待管理数据。
25、在一种可选的方式中,所述数据资产明细信息字段包括数据资产关联人员字段、数据资产属性字段以及数据资产管理状态字段;所述方法还包括:
26、根据所述数据资产管理状态字段下的字段值对所述待采集系统的数据质量进行评估;
27、当确定所述待采集系统的数据质量达标时,根据所述数据资产关联人员字段以及数据资产属性字段下的字段值连接所述待采集系统,以获取所述待管理数据。
28、在一种可选的方式中,所述方法还包括:
29、对所述数据分类分级结果进行人工校验,得到校验结果;
30、根据所述校验结果对所述数据分类分级模板以及所述可选数据特征条件进行调整。
31、根据本专利技术实施例的另一方面,提供了一种数据自动分类分级装置,包括:
32、获取模块,用于获取待管理数据;
33、提取模块,用于根据预设的数据特征维度对所述待管理数据进行特征提取,得到所述待管理数据的目标数据特征信息;
34、匹配模块,用于将所述目标数据特征信息与至少一个可选数据特征条件进行匹配,得到所述目标数据特征信息所匹配的目标数据特征条件;其中,一个所述可选数据特征条件用于表征一个可选数据特征标签下的数据的数据特征值所满足的条件;
35、确定模块,用于将所述目标数据特征条件对应的所述可选数据特征标签确定为所述待管理数据的目标数据特征标签;
36、查找模块,用于根据所述目标数据特征标签在预设的数据分类分级模板中进行查找,得到所述待管理数据的数据分类分级结果;其中,所述数据分类分级模板中包括多个可选数据特征标签分别对应的数据分类分级标签。
37、根据本专利技术实施例的另一方面,提供了一种数据自动分类分级设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
38、所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如前述任意一项所述的数据自动分类分级方法实施例的操作。
39、根据本专利技术实施例的又一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使数据自动分类分级设备执行如前述任意一项所述的数据自动分类分级方法实施例的操作。
40、本专利技术实施例通过获取待管理数据,其中,待管理数据可以是根据数据资产摸排调研结果确定的,也可以是完全未知的待分类处理的数据,例如,证券公司的个人客户数据,待管理数据包括至少一个预设的数据字段对应的字段属性信息。根据预设的数据特征维度对所述待管理数据进行特征提取,得到所述待管理数据的目标数据特征信息,其中,数据特征维度可以包括字段名称、字段类型、所属表名称等字段属性相关特征维度。将所述目标数据特征信息与至少一个可选数据特征条件进行匹配,得到所述目标数据特征信息所匹配的目标数据特征条件;其中,一个所述可选数据特征条件用于表征一个可选数据特征标签下的数据的数据特征值所本文档来自技高网...
【技术保护点】
1.一种数据自动分类分级方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,在所述将所述目标数据特征信息与至少一个可选数据特征条件进行匹配,得到所述目标数据特征信息所匹配的目标数据特征条件之前,包括:
3.根据权利要求2所述的方法,其特征在于,所述对各个所述数据分类分级标签的所述字段属性信息进行关联分析,得到各个所述数据分类分级标签对应的所述可选数据特征条件,包括:
4.根据权利要求2所述的方法,其特征在于,所述根据属于同一所述数据分类分级标签的所述字段属性信息确定所述数据分类分级标签对应的可选数据特征标签,包括:
5.根据权利要求1所述的方法,其特征在于,所述获取待管理数据,包括:
6.根据权利要求5所述的方法,其特征在于,所述数据资产明细信息字段包括数据资产关联人员字段、数据资产属性字段以及数据资产管理状态字段;在所述获取数据管理人员基于预设的数据资产调研表提交的数据资产调研结果之后,还包括:
7.根据权利要求1所述的方法,其特征在于,在所述根据所述目标数据特征标签在预设的数据分类
8.一种数据自动分类分级装置,其特征在于,所述装置包括:
9.一种数据自动分类分级设备,其特征在于,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一可执行指令,所述可执行指令在数据自动分类分级设备上运行时,使得数据自动分类分级设备执行如权利要求1-7任意一项所述的数据自动分类分级方法的操作。
...【技术特征摘要】
1.一种数据自动分类分级方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,在所述将所述目标数据特征信息与至少一个可选数据特征条件进行匹配,得到所述目标数据特征信息所匹配的目标数据特征条件之前,包括:
3.根据权利要求2所述的方法,其特征在于,所述对各个所述数据分类分级标签的所述字段属性信息进行关联分析,得到各个所述数据分类分级标签对应的所述可选数据特征条件,包括:
4.根据权利要求2所述的方法,其特征在于,所述根据属于同一所述数据分类分级标签的所述字段属性信息确定所述数据分类分级标签对应的可选数据特征标签,包括:
5.根据权利要求1所述的方法,其特征在于,所述获取待管理数据,包括:
6.根据权利要求5所述的方法,其特征在于,所述数据资产明细信息字段包括数据资产关联人员字...
【专利技术属性】
技术研发人员:李明军,肖雪,
申请(专利权)人:国信证券股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。