客户信息的聚类方法、装置及电子设备制造方法及图纸

技术编号:38716613 阅读:8 留言:0更新日期:2023-09-08 14:59
本申请公开了一种客户信息的聚类方法、装置及电子设备,该方法应用于大数据技术领域,该方法包括:计算客户数据信息集合中每个客户数据信息的密度;依据每个客户数据信息的密度在客户数据信息集合中获取第一质心和第二质心;依据客户数据信息集合中客户数据信息与第一质心的余弦距离和客户数据信息集合中客户数据信息与第二质心的余弦距离,确定K个质心;依据K个质心对客户数据信息集合中的客户数据信息进行聚类,得到聚类结果。通过本申请,解决了相关技术中采用传统的K

【技术实现步骤摘要】
客户信息的聚类方法、装置及电子设备


[0001]本申请涉及大数据
,具体而言,涉及一种客户信息的聚类方法、装置及电子设备。

技术介绍

[0002]目前,金融机构中的工作人员向客户推荐金融产品时,往往依据当前热度较高或收益较高的金融产品向客户进行推荐。但由于不同的客户拥有不同的投资偏好,如果向每个客户均推荐热度较高或收益较高的金融产品,无法考虑到客户的实际购买需求,进而无法向客户提供合适的金融产品,导致客户没有良好的客户体验,不利于金融机构与客户构建良好且持续地合作关系。现有技术中还可以采用K

Means聚类算法对客户进行分类,以向客户提供定制化的金融产品。但由于传统的K

Means聚类算法采用随机抽取初始质心的方法初始化聚类算法,使得随机抽取到的初始质心可能过于分散或过于集中,初始质心分布不均匀,导致聚类算法的收敛速度较为缓慢以及聚类效果较差,进而导致客户的分类结果不准确。
[0003]针对相关技术中采用传统的K

Means聚类算法对客户信息进行聚类时,通过随机选择得到的质心过于邻近或分散,导致客户信息的聚类结果不准确的问题,目前尚未提出有效的解决方案。

技术实现思路

[0004]本申请的主要目的在于提供一种客户信息的聚类方法、装置及电子设备,以解决相关技术中采用传统的K

Means聚类算法对客户信息进行聚类时,通过随机选择得到的质心过于邻近或分散,导致客户信息的聚类结果不准确的问题。
[0005]为了实现上述目的,根据本申请的一个方面,提供了一种客户信息的聚类方法,该方法包括:计算客户数据信息集合中每个客户数据信息的密度,其中,所述客户数据信息集合中包括预设时间周期内,从金融机构中采集到的客户数据信息,所述密度表示每个客户数据信息周围分布其它客户数据信息的密集程度;依据每个客户数据信息的密度在所述客户数据信息集合中获取第一质心和第二质心;依据所述客户数据信息集合中客户数据信息与所述第一质心的余弦距离和所述客户数据信息集合中客户数据信息与所述第二质心的余弦距离,确定K个质心;依据所述K个质心对所述客户数据信息集合中的客户数据信息进行聚类,得到聚类结果。
[0006]进一步地,计算客户数据信息集合中每个客户数据信息的密度包括:从预设数据库中获取客户的交易信息,得到客户数据信息集合,其中,所述客户数据信息集合中包括N个客户数据信息,N是正整数;计算所述客户数据信息集合中每个客户数据信息的二阶邻域,得到N个二阶邻域;在所述N个二阶邻域中,计算每个客户数据信息在其它客户数据信息的二阶邻域中出现的次数,得到每个客户数据信息的密度。
[0007]进一步地,计算所述客户数据信息集合中每个客户数据信息的二阶邻域,得到N个
二阶邻域包括:步骤S31,在所述客户数据信息集合中确定与第一客户数据信息的余弦距离小于第一预设阈值的客户数据信息,得到所述第一客户数据信息的一阶邻域,其中,所述第一客户数据信息是所述客户数据信息集合中任意一个客户数据信息,所述第一客户数据信息的一阶邻域中包含L个客户数据信息,L是正整数;步骤S32,在所述第一客户数据信息的一阶邻域中,确定与所述一阶邻域中每个客户数据信息的余弦距离小于所述第一预设阈值的客户数据信息,得到所述第一客户数据信息的L个候选二阶邻域;步骤S33,确定所述第一客户数据信息的L个候选二阶邻域的公共交集,得到所述第一客户数据信息的二阶邻域;重复执行步骤S31至S33,确定所述客户数据信息集合中除第一客户数据信息之外的客户数据信息的二阶邻域,得到N个二阶邻域。
[0008]进一步地,依据每个客户数据信息的密度在所述客户数据信息集合中获取第一质心和第二质心包括:依据所述客户数据信息集合中每个客户数据信息的密度,获取密度最大的客户数据信息,得到所述第一质心;获取所述客户数据信息集合中与所述第一质心的余弦距离最大的客户数据信息,得到第二客户数据信息;获取所述客户数据信息集合中与所述第二客户数据信息的余弦距离小于第二预设阈值的客户数据信息,得到第二质心候选集;在所述第二质心候选集中确定密度最大的客户数据信息,得到所述第二质心。
[0009]进一步地,依据所述客户数据信息集合中客户数据信息与所述第一质心的余弦距离和所述客户数据信息集合中客户数据信息与所述第二质心的余弦距离,确定K个质心包括:将所述第一质心和所述第二质心添加至质心集合中,其中,所述质心集合包括M个质心,M是正整数;步骤S51,依据所述客户数据信息集合中每个客户数据信息与所述M个质心的余弦距离,得到M个簇;步骤S52,在所述M个簇中确定客户数据信息量最大的簇,得到目标簇;步骤S53,依据所述目标簇中每个客户数据信息与所述M个质心的距离积,得到第M+1质心候选集;步骤S54,在所述第M+1质心候选集中确定密度最大的客户数据信息,得到第M+1质心,并将所述第M+1质心添加至所述质心集合中,循环执行步骤S51至步骤S54,直到所述质心集合中质心的数量等于K,得到所述K个质心。
[0010]进一步地,依据所述客户数据信息集合中每个客户数据信息与所述M个质心的余弦距离,得到M个簇包括:计算所述客户数据信息集合中每个客户数据信息与所述M个质心的余弦距离,得到每个客户数据信息对应的余弦距离集合;在每个客户数据信息对应的余弦距离集合确定余弦距离最小值对应的质心,得到每个客户数据信息对应的目标质心;将每个客户数据信息与每个客户数据信息对应的目标质心划分至同一个簇中,得到所述M个簇。
[0011]进一步地,依据所述目标簇中每个客户数据信息与所述M个质心的距离积,得到第M+1质心候选集包括:计算所述目标簇中每个客户数据信息与所述M个质心的余弦距离,得到每个客户数据信息对应的M个距离,其中,所述目标簇中包括L个客户数据信息;分别计算所述目标簇中每个客户数据信息对应的M个距离的积,得到所述L个客户数据信息对应的距离积;将所述L个客户数据信息对应的距离积中距离积最大的客户数据信息确定为第M+1个质心邻近点;将所述目标簇中与所述第M+1个质心邻近点的余弦距离小于第三预设阈值的客户数据信息组成第M+1质心候选集。
[0012]进一步地,在依据所述K个质心对所述客户数据信息集合中的客户数据信息进行聚类,得到聚类结果之后,所述方法还包括:确定每类客户对应的推广策略,其中,所述推广
策略用于对每类客户推广金融产品;依据每类客户对应的推广策略,对每类客户推广金融产品。
[0013]为了实现上述目的,根据本申请的另一方面,提供了一种客户信息的聚类装置,该装置包括:计算单元,用于计算客户数据信息集合中每个客户数据信息的密度,其中,所述客户数据信息集合中包括预设时间周期内,从金融机构中采集到的客户数据信息,所述密度表示每个客户数据信息周围分布其它客户数据信息的密集程度;获取单元,用于依据每个客户数据信息的密度在所述客户数据信息集合中获取第一质心和第二质心;第一确定单元,用于依据所述客户数据信息集合中客户数据信息与所述第一质心的余本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种客户信息的聚类方法,其特征在于,包括:计算客户数据信息集合中每个客户数据信息的密度,其中,所述客户数据信息集合中包括预设时间周期内,从金融机构中采集到的客户数据信息,所述密度表示每个客户数据信息周围分布其它客户数据信息的密集程度;依据每个客户数据信息的密度在所述客户数据信息集合中获取第一质心和第二质心;依据所述客户数据信息集合中客户数据信息与所述第一质心的余弦距离和所述客户数据信息集合中客户数据信息与所述第二质心的余弦距离,确定K个质心;依据所述K个质心对所述客户数据信息集合中的客户数据信息进行聚类,得到聚类结果。2.根据权利要求1所述的方法,其特征在于,计算客户数据信息集合中每个客户数据信息的密度包括:从预设数据库中获取客户的交易信息,得到客户数据信息集合,其中,所述客户数据信息集合中包括N个客户数据信息,N是正整数;计算所述客户数据信息集合中每个客户数据信息的二阶邻域,得到N个二阶邻域;在所述N个二阶邻域中,计算每个客户数据信息在其它客户数据信息的二阶邻域中出现的次数,得到每个客户数据信息的密度。3.根据权利要求2所述的方法,其特征在于,计算所述客户数据信息集合中每个客户数据信息的二阶邻域,得到N个二阶邻域包括:步骤S31,在所述客户数据信息集合中确定与第一客户数据信息的余弦距离小于第一预设阈值的客户数据信息,得到所述第一客户数据信息的一阶邻域,其中,所述第一客户数据信息是所述客户数据信息集合中任意一个客户数据信息,所述第一客户数据信息的一阶邻域中包含L个客户数据信息,L是正整数;步骤S32,在所述第一客户数据信息的一阶邻域中,确定与所述一阶邻域中每个客户数据信息的余弦距离小于所述第一预设阈值的客户数据信息,得到所述第一客户数据信息的L个候选二阶邻域;步骤S33,确定所述第一客户数据信息的L个候选二阶邻域的公共交集,得到所述第一客户数据信息的二阶邻域;重复执行步骤S31至S33,确定所述客户数据信息集合中除第一客户数据信息之外的客户数据信息的二阶邻域,得到N个二阶邻域。4.根据权利要求1所述的方法,其特征在于,依据每个客户数据信息的密度在所述客户数据信息集合中获取第一质心和第二质心包括:依据所述客户数据信息集合中每个客户数据信息的密度,获取密度最大的客户数据信息,得到所述第一质心;获取所述客户数据信息集合中与所述第一质心的余弦距离最大的客户数据信息,得到第二客户数据信息;获取所述客户数据信息集合中与所述第二客户数据信息的余弦距离小于第二预设阈值的客户数据信息,得到第二质心候选集;在所述第二质心候选集中确定密度最大的客户数据信息,得到所述第二质心。5.根据权利要求1所述的方法,其特征在于,依据所述客户数据信息集合中客户数据信
息与所述第一质心的余弦距离和所述客户数据信息集合中客户数据信息与所述第二质心的余弦距离,确定K个质心包括:将所述第一质心和所述第二质心添加至质心集合中,其中,所述质心集合包括M个质心,M是正整数;步骤S51,依据所述客户数据...

【专利技术属性】
技术研发人员:程永龙王钰范淑君王睿
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1