System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 数据分类处理方法、装置、电子设备及存储介质制造方法及图纸_技高网

数据分类处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:40867855 阅读:5 留言:0更新日期:2024-04-08 16:33
本发明专利技术涉及金融科技数据处理领域,揭露一种数据分类处理方法,包括:接收终端发送的对客户数据集进行分类的请求,对客户数据集进行预处理,将预处理后的客户数据集存储至第一文档型数据库,客户数据集包含有多个客户的属性信息和多个客户对应的订单信息;将属性信息中至少一个预设子信息和/或订单信息中至少一个预设子信息作为检索语句,根据检索语句检索预处理后的客户数据集,得到第一类客群并存储至第二文档型数据库,根据订单信息中至少一个另外的预设子信息,对第一类客群中进行归类,得到多个第二目标类客群并反馈至终端。本发明专利技术应用于金融科技数据处理等应用场景,可以提高客群管理系统对数据集的分类效率和查询能力。

【技术实现步骤摘要】

本专利技术涉及金融科技数据处理领域,尤其涉及一种数据分类处理方法、装置、电子设备及存储介质


技术介绍

1、在金融科技领域,客群管理系统扮演着至关重要的角色,帮助企业对海量的客户数据进行分类、标注标签等处理,以便更好地了解客户群体和满足其需求。

2、目前大部分客群管理系统仍采用传统的关系型数据库作为数据存储和处理引擎,这在面对复杂多样的数据时存在以下问题:

3、在保险行业等领域,客户信息通常包含了几百个字段,包括但不限于个人基本信息、保单信息、车辆信息等。

4、这样庞大的客户数据集导致传统关系型数据库需要采用垂直分表策略来处理数据,即将不同属性的数据存储在不同表中,增加了数据库设计的复杂性。这种垂直分表策略设计复杂,容易导致客群管理系统的查询性能低下,降低了对数据集的分类效率。


技术实现思路

1、鉴于以上内容,有必要提供一种数据分类处理方法,其目的在于提高对数据集的分类效率,以提高客群管理系统的处理效率和查询能力。

2、本专利技术提供的数据分类处理方法,应用于客群管理系统,所述客群管理系统包括第一文档型数据库和第二文档型数据库,所述方法包括:

3、接收终端发送的对客户数据集进行分类的请求,对所述客户数据集进行预处理,将预处理后的客户数据集存储至所述第一文档型数据库,所述客户数据集包含有多个客户的属性信息和所述多个客户对应的订单信息,所述属性信息包括年龄子信息、性别子信息、收入水平子信息,所述订单信息包括产品类型子信息、供应商名称子信息、交易金额子信息;

4、将所述属性信息中至少一个预设子信息和/或所述订单信息中至少一个预设子信息作为检索语句,根据所述检索语句检索所述预处理后的客户数据集,得到第一类客群并存储至所述第二文档型数据库,

5、根据所述订单信息中至少一个另外的预设子信息,对所述第一类客群中进行归类,得到多个第二目标类客群并反馈至所述终端。

6、可选的,所述对所述客户数据集进行预处理,包括:

7、利用预设的分布式处理工具对所述客户数据集进行清洗、筛选和聚合,得到预处理后生成的客户数据集。

8、可选的,在所述将预处理后的客户数据集存储至所述第一文档型数据库之前,所述方法还包括:

9、在所述分布式处理工具与所述第一文档型数据库之间构建预设的同步工具。

10、可选的,所述将预处理后的客户数据集存储至所述第一文档型数据库,包括:

11、利用所述同步工具,将所述分布式处理工具预处理后的客户数据集同步至所述第一文档型数据库。

12、可选的,所述将所述属性信息中至少一个预设子信息和/或所述订单信息中至少一个预设子信息作为检索语句,根据所述检索语句检索所述预处理后的客户数据集,得到第一类客群,包括:

13、将所述属性信息中至少一个预设子信息和/或所述订单信息中至少一个预设子信息,生成所述第一文档型数据库的检索语句;

14、利用所述检索语句检索所述预处理后的客户数据集,提取符合所述属性信息中至少一个预设子信息和/或所述订单信息中至少一个预设子信息的客户信息,得到所述第一类客群。

15、可选的,在所述对所述第一类客群中进行归类之前,所述方法还包括:

16、提取所述订单信息中至少一个另外的预设子信息生成特征向量;

17、根据所述特征向量和预设的已知客群标签,构建分类模型。

18、可选的,所述对所述第一类客群中进行归类,得到多个第二目标类客群并反馈至所述终端,包括:

19、根据所述订单信息中至少一个另外的预设子信息和所述分类模型,对所述第一类客群中进行分类;

20、将分类后得到的多个第二类客群标注标签,得到所述多个目标类客群。

21、为了解决上述问题,本专利技术还提供一种数据分类处理装置,所述装置包括:

22、处理模块,用于接收终端发送的对客户数据集进行分类的请求,对所述客户数据集进行预处理,将预处理后的客户数据集存储至所述第一文档型数据库,所述客户数据集包含有多个客户的属性信息和所述多个客户对应的订单信息,所述属性信息包括年龄子信息、性别子信息、收入水平子信息,所述订单信息包括产品类型子信息、供应商名称子信息、交易金额子信息;

23、检索模块,用于将所述属性信息中至少一个预设子信息和/或所述订单信息中至少一个预设子信息作为检索语句,根据所述检索语句检索所述预处理后的客户数据集,得到第一类客群并存储至所述第二文档型数据库;

24、反馈模块,用于根据所述订单信息中至少一个另外的预设子信息,对所述第一类客群中进行归类,得到多个第二目标类客群并反馈至所述终端。

25、为了解决上述问题,本专利技术还提供一种电子设备,所述电子设备包括:

26、至少一个处理器;以及,

27、与所述至少一个处理器通信连接的存储器;其中,

28、所述存储器存储有可被所述至少一个处理器执行的数据分类处理程序,所述第一数据处理程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述数据分类处理方法。

29、为了解决上述问题,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有数据分类处理程序,所述第一数据处理程序可被一个或者多个处理器执行,以实现上述数据分类处理方法。

30、相较现有技术,本专利技术通过对客户数据集进行预处理并存储至第一文档型数据库。利用第一文档型数据库的文档型特性,使得在数据结构发生变化时更加灵活和便捷,无需像传统关系型数据库那样进行严格的表结构修改。

31、根据属性信息中至少一个预设子信息和/或所述订单信息中至少一个预设子信息,从预处理后的客户数据集中提取满足条件的客户数据,得到第一类客群并存储至第二文档型数据库,根据订单信息中至少一个另外的预设子信息,在第二文档型数据库中对第一类客群中进行归类,得到多个第二目标类客群并反馈至终端。

32、本专利技术利用第一、二文档型数据库构建的客群管理系统,在技术上可以优化数据处理和存储过程,提高对客户数据集分类的效率和数据管理的灵活性。

33、从而解决现有技术中,传统关系型数据库面对不同的客户之间属性差别大的量级大的数据集时,需要采用垂直分表策略来处理数据,容易导致客群管理系统的查询性能低下,降低了对数据集的分类效率的技术问题。

34、本专利技术应用于金融科技数据处理等应用场景,提高对数据集的分类效率,以提高客群管理系统的处理效率和查询能力。

本文档来自技高网...

【技术保护点】

1.一种数据分类处理方法,其特征在于,应用于客群管理系统,所述客群管理系统包括第一文档型数据库和第二文档型数据库,所述方法包括:

2.如权利要求1所述的数据分类处理方法,其特征在于,所述对所述客户数据集进行预处理,包括:

3.如权利要求2所述的数据分类处理方法,其特征在于,在所述将预处理后的客户数据集存储至所述第一文档型数据库之前,所述方法还包括:

4.如权利要求1或3所述的数据分类处理方法,其特征在于,所述将预处理后的客户数据集存储至所述第一文档型数据库,包括:

5.如权利要求1所述的数据分类处理方法,其特征在于,所述将所述属性信息中至少一个预设子信息和/或所述订单信息中至少一个预设子信息作为检索语句,根据所述检索语句检索所述预处理后的客户数据集,得到第一类客群,包括:

6.如权利要求1所述的数据分类处理方法,其特征在于,在所述对所述第一类客群中进行归类之前,所述方法还包括:

7.如权利要求1或6所述的数据分类处理方法,其特征在于,所述对所述第一类客群中进行归类,得到多个第二目标类客群并反馈至所述终端,包括

8.一种数据分类处理装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,所述电子设备包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有数据分类处理程序,所述第一数据处理程序可被一个或者多个处理器执行,以实现如权利要求1至7任一项所述的数据分类处理方法。

...

【技术特征摘要】

1.一种数据分类处理方法,其特征在于,应用于客群管理系统,所述客群管理系统包括第一文档型数据库和第二文档型数据库,所述方法包括:

2.如权利要求1所述的数据分类处理方法,其特征在于,所述对所述客户数据集进行预处理,包括:

3.如权利要求2所述的数据分类处理方法,其特征在于,在所述将预处理后的客户数据集存储至所述第一文档型数据库之前,所述方法还包括:

4.如权利要求1或3所述的数据分类处理方法,其特征在于,所述将预处理后的客户数据集存储至所述第一文档型数据库,包括:

5.如权利要求1所述的数据分类处理方法,其特征在于,所述将所述属性信息中至少一个预设子信息和/或所述订单信息中至少一个预设子信息作为检索语句,根据...

【专利技术属性】
技术研发人员:李军
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1