银行客户分类方法及装置制造方法及图纸

技术编号:32219664 阅读:20 留言:0更新日期:2022-02-09 17:24
本发明专利技术公开了一种银行客户分类方法及装置,涉及大数据技术领域,该方法包括:收集不同银行客户的相关信息;所述相关信息包括客户身份信息和历史交易信息;针对每一银行客户,对该客户的相关信息进行预处理;所述预处理包括分词处理、停用词过滤处理和关键词抽取处理,得到对应该银行客户的多个词组;对不同银行客户的多个词组进行文本向量化处理,得到对应不同银行客户的多个词组文本向量;基于邻近传播聚类算法,对不同银行客户的多个词组文本向量,进行数据聚类分析,得到多个银行客户簇集;对多个银行客户簇集进行合并聚类分析,得到银行客户分类结果。本发明专利技术可提升银行客户分类的准确度。准确度。准确度。

【技术实现步骤摘要】
银行客户分类方法及装置


[0001]本专利技术涉及大数据
,尤其涉及银行客户分类方法及装置。

技术介绍

[0002]本部分旨在为权利要求书中陈述的本专利技术实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]在银行系统中,一般需对银行客户(如个体用户和商户)按照不同的特征进行细分,从而能够更好的对每一个类别的客户提供针对性的服务。现阶段,一般采用聚类算法来满足这一需求,目前已经在文本聚类中有相关应用的聚类算法,如k

means聚类算法,DBSCAN聚类算法。
[0004]上述聚类算法虽然已经得到了广泛的应用,但是也存在着一些问题,如受聚类算法本身特性的影响,使得聚类结果仅对异常值敏感、需要初始设定簇的个数等。最终的聚类分析结果因受到聚类簇数以及词向量维度的影响,在客户细分的这个环境下并不能很好的达到理想的效果,导致现阶段的客户分类结果并不准确。

技术实现思路

[0005]本专利技术实施例提供一种银行客户分类方法,用以提升银行客户分类的准确度,该方法包括:本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种银行客户分类方法,其特征在于,包括:收集不同银行客户的相关信息;所述相关信息包括客户身份信息和历史交易信息;针对每一银行客户,对该客户的相关信息进行预处理;所述预处理包括分词处理、停用词过滤处理和关键词抽取处理,得到对应该银行客户的多个词组;对不同银行客户的多个词组进行文本向量化处理,得到对应不同银行客户的多个词组文本向量;基于邻近传播聚类算法,对不同银行客户的多个词组文本向量,进行数据聚类分析,得到多个银行客户簇集;对多个银行客户簇集进行合并聚类分析,得到银行客户分类结果。2.如权利要求1所述的方法,其特征在于,所述分词处理包括使用结巴分词进行分词处理;所述停用词过滤处理包括使用自然语言处理工具包进行停用词过滤处理;所述关键词抽取处理包括使用N

gram特征选择算法进行关键词抽取处理。3.如权利要求1所述的方法,其特征在于,对不同银行客户的多个词组进行文本向量化处理,得到对应不同银行客户的多个词组文本向量,包括:基于Word2Vec算法和TF

IDF算法,对不同银行客户的多个词组进行文本向量化处理,得到对应不同银行客户的多个词组文本向量。4.如权利要求3所述的方法,其特征在于,基于Word2Vec算法和TF

IDF算法,对不同银行客户的多个词组进行文本向量化处理,得到对应不同银行客户的多个词组文本向量,包括:针对每一银行客户,基于Word2Vec算法,对该银行客户的多个词组进行词向量训练,得到对应该银行客户不同词组的词向量;基于TF

IDF算法,计算不同银行客户每一词组的词向量的TF

IDF值;对不同银行客户每一词组的词向量的TF

IDF值进行赋值加权计算,得到对应不同银行客户的多个词组文本向量。5.如权利要求1所述的方法,其特征在于,还包括:基于CVM算法,对不同银行客户的词组文本向量进行压缩;基于邻近传播聚类算法,对不同银行客户的多个词组文本向量,进行数据聚类分析,得到多个银行客户簇集,包括:基于邻近传播聚类算法,对压缩后的不同银行客户的多个词组文本向量,进行数据聚类分析,得到多个银行客户簇集。6.一种银行客户分类装置,其特征在于,包括:信息收集模块,用于收集不同银行客户的相关信息;所述相关信息包括客户身份信息和历...

【专利技术属性】
技术研发人员:王峭晗
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1