自底向上的客群分类方法及装置制造方法及图纸

技术编号:34820309 阅读:19 留言:0更新日期:2022-09-03 20:31
本发明专利技术提供了一种自底向上的客群分类方法及装置,可用于金融技术领域,该方法包括:根据目标领域的全量客户信息,获得每个客户的客户特征向量;对任意两个客户,计算该两个客户之间的相似性;将相似性大于第一阈值的客户合并为一个客群;重复执行以下步骤,直至达到迭代终止条件:计算每个客群的平均特征向量;对任意两个客群,基于该两个客群的平均特征向量,计算该两个客群之间的相似性;将相似性大于第二阈值的客群合并。本发明专利技术可以实现客群分类,效率高,准确度高。准确度高。准确度高。

【技术实现步骤摘要】
自底向上的客群分类方法及装置


[0001]本专利技术涉及金融
,尤其涉及一种自底向上的客群分类方法及装置。

技术介绍

[0002]结合现有数据,低成本发挥大数据业务价值,进行客群分类,从而实现精准营销尤为重要,目前客群分类经常通过人工进行,效率低下,准确度不高。

技术实现思路

[0003]本专利技术实施例提出一种自底向上的客群分类方法,用以实现客群分类,效率高,准确度高,该方法包括:
[0004]根据目标领域的全量客户信息,获得每个客户的客户特征向量;
[0005]对任意两个客户,计算该两个客户之间的相似性;
[0006]将相似性大于第一阈值的客户合并为一个客群;
[0007]重复执行以下步骤,直至达到迭代终止条件:计算每个客群的平均特征向量;对任意两个客群,基于该两个客群的平均特征向量,计算该两个客群之间的相似性;将相似性大于第二阈值的客群合并。
[0008]本专利技术实施例提出一种自底向上的客群分类装置,用以自动将全量客户划分为不同客群,以便后续对客户构成进行分析,或对客群进行精准营销,该装置包括:
[0009]客户特征向量获得模块,用于根据目标领域的全量客户信息,获得每个客户的客户特征向量;
[0010]客户相似性计算模块,用于对任意两个客户,计算该两个客户之间的相似性;
[0011]客户分群模块,用于将相似性大于第一阈值的客户合并为一个客群;
[0012]客群合并模块,用于重复执行以下步骤,直至达到迭代终止条件:计算每个客群的平均特征向量;对任意两个客群,基于该两个客群的平均特征向量,计算该两个客群之间的相似性;将相似性大于第二阈值的客群合并。
[0013]本专利技术实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述自底向上的客群分类方法。
[0014]本专利技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述自底向上的客群分类方法。
[0015]本专利技术实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述自底向上的客群分类方法。
[0016]在本专利技术实施例中,根据目标领域的全量客户信息,获得每个客户的客户特征向量;对任意两个客户,计算该两个客户之间的相似性;将相似性大于第一阈值的客户合并为一个客群;重复执行以下步骤,直至达到迭代终止条件:计算每个客群的平均特征向量;对任意两个客群,基于该两个客群的平均特征向量,计算该两个客群之间的相似性;将相似性
大于第二阈值的客群合并。在上述过程中,先对客户进行合并,再对客群进行合并,实现了自底向上的客群分类,筛选出了高一致性的客群,效率高,且分群准确性高。
附图说明
[0017]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
[0018]图1为本专利技术实施例中自底向上的客群分类方法的流程图一;
[0019]图2为本专利技术实施例中自底向上的客群分类方法的流程图二;
[0020]图3为本专利技术实施例中自底向上的客群分类装置的示意图一;
[0021]图4为本专利技术实施例中自底向上的客群分类装置的示意图二;
[0022]图5为本专利技术实施例中计算机设备的示意图。
具体实施方式
[0023]为使本专利技术实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本专利技术实施例做进一步详细说明。在此,本专利技术的示意性实施例及其说明用于解释本专利技术,但并不作为对本专利技术的限定。
[0024]在本说明书的描述中,所使用的“包含”、“包括”、“具有”、“含有”等,均为开放性的用语,即意指包含但不限于。参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”等的描述意指结合该实施例或示例描述的具体特征、结构或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。各实施例中涉及的步骤顺序用于示意性说明本申请的实施,其中的步骤顺序不作限定,可根据需要作适当调整。
[0025]图1为本专利技术实施例中自底向上的客群分类方法的流程图一,如图1所示,该方法包括:
[0026]步骤101,根据目标领域的全量客户信息,获得每个客户的客户特征向量;
[0027]步骤102,对任意两个客户,计算该两个客户之间的相似性;
[0028]步骤103,将相似性大于第一阈值的客户合并为一个客群;
[0029]步骤104,重复执行以下步骤,直至达到迭代终止条件:计算每个客群的平均特征向量;对任意两个客群,基于该两个客群的平均特征向量,计算该两个客群之间的相似性;将相似性大于第二阈值的客群合并。
[0030]在本专利技术实施例中,先对客户进行合并,再对客群进行合并,实现了自底向上的客群分类,筛选出了高一致性的客群,效率高,且分群准确性高。
[0031]在步骤101中,对任意两个客户,计算该两个客户之间的相似性;
[0032]在一实施例中,客户特征向量中的客户特征包括基础信息、交易信息、征信信息、风险信息、渠道偏好中的其中之一或任意组合。
[0033]当然,客户特征包括但不限于举例的这些,还可以包括客户的资产分布、持仓信息
等等,只要能转化进特征向量里的信息都可以。
[0034]表1为客户特征向量中每个客户特征取值的示例。
[0035]表1
[0036][0037][0038]在步骤102中,将相似性大于第一阈值的客户合并为一个客群;
[0039]客户X和客户Y的客户特征向量分别为X1X2X3…
X
100
和Y1Y2Y3…
Y
100
,那么余弦相似性的计算公式如下:
[0040][0041]cosθ越接近1,两个客户的相似性越高。
[0042]在步骤103中,重复执行以下步骤,直至达到迭代终止条件:计算每个客群的平均特征向量;对任意两个客群,基于该两个客群的平均特征向量,计算该两个客群之间的相似性;将相似性大于第二阈值的客群合并。
[0043]其中,客群的相似性也可以利用上述余弦相似性公式进行计算,客群的平均特征向量的计算公式如下:
[0044]其中,客群的平均特征向量的计算方法如下:
[0045]假设一个迭代客群V,其中客户的客户特征向量分别为:
[0046]V
1,1
V
1,2
V
...

【技术保护点】

【技术特征摘要】
1.一种自底向上的客群分类方法,其特征在于,包括:根据目标领域的全量客户信息,获得每个客户的客户特征向量;对任意两个客户,计算该两个客户之间的相似性;将相似性大于第一阈值的客户合并为一个客群;重复执行以下步骤,直至达到迭代终止条件:计算每个客群的平均特征向量;对任意两个客群,基于该两个客群的平均特征向量,计算该两个客群之间的相似性;将相似性大于第二阈值的客群合并。2.如权利要求1所述的方法,其特征在于,在计算每个客群的平均特征向量之后,还包括:对每个小客群的平均特征向量进行优化;对任意两个客群,基于该两个客群的平均特征向量,计算该两个客群之间的相似性,包括:对任意两个客群,基于该两个客群的优化后的特征向量,计算该两个客群之间的相似性。3.如权利要求1所述的方法,其特征在于,迭代终止条件为客群数达到第一预设数量,或存在客户数达到第二预设数量的客群,或达到预设迭代次数。4.如权利要求1所述的方法,其特征在于,客户特征向量中的客户特征包括基础信息、交易信息、征信信息、风险信息、渠道偏好中的其中之一或任意组合。5.一种自底向上的客群分类装置,其特征在于,包括:客户特征向量获得模块,用于根据目标领域的全量客户信息,获得每个客户的客户特征向量;客户相似性计算模块,用于对任意两个客户,计算该两个客户之间的相似性;客户分群模块,用于将相似性大于第一阈值...

【专利技术属性】
技术研发人员:李京娓
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1