客群画像生成方法、装置、电子设备和储存介质制造方法及图纸

技术编号:32558694 阅读:16 留言:0更新日期:2022-03-05 12:01
本发明专利技术实施例公开了客群画像生成方法、装置、电子设备和储存介质,其中方法包括:获取第一画像数据集,包括作为正样本的画像客群数据和作为负样本的非画像客群数据,其样本规模相同;使用第一树模型对第一画像数据集进行二分类数据建模后,基于第一树模型中的特征变量确定客群间差异特征,将客群间差异特征添加到客群画像展示字段库,作为客群间差异字段;获取第二画像数据集,第二画像数据集通过对画像客群数据进行无监督聚类建模获得;使用第二树模型对第二画像数据集进行数据建模后,基于第二树模型中的特征变量确定客群内差异特征,添加到客群画像展示字段库,作为客群内差异字段;根据客群画像字段库中的目标字段,生成并展示客群画像。客群画像。客群画像。

【技术实现步骤摘要】
客群画像生成方法、装置、电子设备和储存介质


[0001]本专利技术涉及数据分析
,尤其涉及客群画像生成方法、装置、电子设备和储存介质。

技术介绍

[0002]近年来,随着知识图谱与大数据的快速发展,画像技术受到广泛关注。在各行业领域为了提供更好的服务,经常需要将客群细分,并针对已经筛选出来的细分客群做客群画像分析,精准了解客户偏好和需求。
[0003]目前细分客群的筛选和客群画像的制作大都依赖于数据分析的手工操作,部分平台虽然可以支持客群的筛选和客户画像的展示,其客群画像的展示采用事先定义的维度,不能很好的适配筛选出来的客群,因此不能很好的刻画出筛选出来的细分客群的特征。

技术实现思路

[0004]本申请提供了客群画像生成方法、装置、电子设备和储存介质。
[0005]第一方面,提供了一种客群画像生成方法,包括:获取第一画像数据集,所述第一画像数据集包括作为正样本的画像客群数据和作为负样本的非画像客群数据,所述画像客群数据与所述非画像客群数据的样本规模相同;使用第一树模型对所述第一画像数据集进行二分类数据建模后,基于所述第一树模型中的特征变量确定客群间差异特征,将所述客群间差异特征添加到客群画像展示字段库,作为客群间差异字段;获取第二画像数据集,所述第二画像数据集通过对所述画像客群数据进行无监督聚类建模获得;使用第二树模型对所述第二画像数据集进行数据建模后,基于所述第二树模型中的特征变量确定客群内差异特征,将所述客群内差异特征添加到所述客群画像展示字段库,作为客群内差异字段;根据所述客群画像字段库中的目标字段,生成并展示所述画像客群数据对应的客群画像,所述目标字段包括所述客群间差异字段和所述客群内差异字段。
[0006]第二方面,提供了一种客群画像生成装置,包括:获取模块,用于获取第一画像数据集,所述第一画像数据集包括作为正样本的画像客群数据和作为负样本的非画像客群数据,所述画像客群数据与非画像客群数据的样本规模相同;第一确定模块,用于使用第一树模型对所述第一画像数据集进行二分类数据建模后,基于所述第一树模型中的特征变量确定客群间差异特征;字段添加模块,用于将所述客群间差异特征添加到客群画像展示字段库,作为客群间差异字段;所述获取模块还用于,获取第二画像数据集,所述第二画像数据集通过对所述画
像客群数据进行无监督聚类建模获得;第二确定模块,用于使用第二树模型对所述第二画像数据集进行数据建模后,基于所述第二树模型中的特征变量确定客群内差异特征;所述字段添加模块还用于,将所述客群内差异特征添加到所述客群画像展示字段库,作为客群内差异字段;展示模块,用于根据所述客群画像字段库中的目标字段,生成并展示所述画像客群数据对应的客群画像,所述目标字段包括所述客群间差异字段和所述客群内差异字段。
[0007]第三方面,提供了一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如第一方面及其任一种可能的实现方式的步骤。
[0008]第四方面,提供了一种计算机存储介质,所述计算机存储介质存储有一条或多条指令,所述一条或多条指令适于由处理器加载并执行如上述第一方面及其任一种可能的实现方式的步骤。
[0009]本申请通过获取第一画像数据集,上述第一画像数据集包括作为正样本的画像客群数据和作为负样本的非画像客群数据,画像客群数据与非画像客群数据的样本规模相同;使用第一树模型对上述画像数据集进行二分类数据建模后,基于上述第一树模型中的特征变量确定客群间差异特征,将上述客群间差异特征添加到客群画像展示字段库,作为客群间差异字段;获取第二画像数据集,上述第二画像数据集通过对上述画像客群数据进行无监督聚类建模获得;使用第二树模型对上述第二画像数据集进行数据建模后,基于上述第二树模型中的特征变量确定客群内差异特征,将上述客群内差异特征添加到上述客群画像展示字段库,作为客群内差异字段;根据上述客群画像字段库中的目标字段,生成并展示上述画像客群数据对应的客群画像,上述目标字段包括上述客群间差异字段和上述客群内差异字段,可以针对客群数据确定更匹配的客群画像字段,自动化生成和展示客户画像,输出的客群画像能更准确地反映出客群的特点。
附图说明
[0010]为了更清楚地说明本申请实施例或
技术介绍
中的技术方案,下面将对本申请实施例或
技术介绍
中所需要使用的附图进行说明。
[0011]图1为本申请实施例提供的一种客群画像生成方法的流程示意图;图2为本申请实施例提供的另一种客群画像生成方法的流程示意图;图3为本申请实施例提供的一种客群画像展示页面示意图;图4为本申请实施例提供的一种客群画像生成装置的结构示意图;图5为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
[0012]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0013]本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
[0014]在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0015]下面结合本申请实施例中的附图对本申请实施例进行描述。
[0016]请参阅图1,图1是本申请实施例提供的一种客群画像生成方法的流程示意图。如图1所示,该方法包括:101、获取第一画像数据集,上述第一画像数据集包括作为正样本的画像客群数据和作为负样本的非画像客群数据,上述画像客群数据与上述非画像客群数据的样本规模相同。
[0017]本申请实施例中的执行主体可以为一种客群画像生成装置,可以为电子设备,具体实现中,上述电子设备可以为一种服务器,或者终端设备,包括但不限于诸如具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的膝上型计算机或平板计算机之类的其它便携式设备。还应当理解的是,在某些实施例中,上述设备并非便携式通信设备,而是具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的台式计算机。
[0018]本申请实施例中将需要进行数据分析的客户群体称为细分客群,客群画像的生成可以基于客群的信息和数据,也称为画像客群数据,是本申请本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种客群画像生成方法,其特征在于,包括:获取第一画像数据集,所述第一画像数据集包括作为正样本的画像客群数据和作为负样本的非画像客群数据,所述画像客群数据与所述非画像客群数据的样本规模相同;使用第一树模型对所述第一画像数据集进行二分类数据建模后,基于所述第一树模型中的特征变量确定客群间差异特征,将所述客群间差异特征添加到客群画像展示字段库,作为客群间差异字段;获取第二画像数据集,所述第二画像数据集通过对所述画像客群数据进行无监督聚类建模获得;使用第二树模型对所述第二画像数据集进行数据建模后,基于所述第二树模型中的特征变量确定客群内差异特征,将所述客群内差异特征添加到所述客群画像展示字段库,作为客群内差异字段;根据所述客群画像字段库中的目标字段,生成并展示所述画像客群数据对应的客群画像,所述目标字段包括所述客群间差异字段和所述客群内差异字段。2.根据权利要求1所述的客群画像生成方法,其特征在于,所述基于所述第一树模型中的特征变量确定客群间差异特征,包括:提取所述第一树模型中处于前N个分类节点的第一候选特征变量,所述N为大于1的整数;对所述第一候选特征变量进行组合,计算产生的每种特征变量组合的信息损失,每种所述特征变量组合至少包含一个特征变量;保留所述信息损失最少且特征数量最少的第一特征变量组合,确定所述第一特征变量组合中的特征变量为所述客群间差异特征。3.根据权利要求2所述的客群画像生成方法,其特征在于,所述计算产生的每种特征变量组合的信息损失,包括:计算全部所述第一候选特征变量进行组合时的初始信息容量,计算所述产生的每种特征变量组合对应的信息容量;基于所述初始信息容量和所述产生的每种特征变量组合对应的信息容量,计算获得所述每种特征变量组合的信息损失。4.根据权利要求1所述的客群画像生成方法,其特征在于,所述基于所述第二树模型中的特征变量确定客群内差异特征,包括:提取所述第二树模型中处于前M个分类节点的第二候选特征变量,所述M为大于1的整数;对所述第二候选特征变量进行组合,计算产生的每种特征变量组合的信息损失,每种所述特征变量组合至少包含一个特征变量;保留所述信息损失最少且特征数量最少的第二特征变量组合,确定所述第二特征变量组合中的特征变量为所述客群内差异特征。5.根据权利要求1所述的客群画像生成方法,其特征在于,所述获取第二画像数据集,包括:对所述画像客群数据做无监督聚类建模处理,获得聚类模型;使用轮廓系数评估聚类模型,选择所述轮廓系数最大的分类模型对所述画像客群数据
进行标签预测,获得所述画像...

【专利技术属性】
技术研发人员:龚骏华
申请(专利权)人:深圳索信达数据技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1