银行客户数据处理方法及装置制造方法及图纸

技术编号:26421086 阅读:20 留言:0更新日期:2020-11-20 14:17
本发明专利技术公开了一种银行客户数据处理方法及装置,其中方法包括:获得银行客户数据,所述银行客户数据包括:个人数据,交易数据,资产负债数据其中之一或任意组合;根据所述银行客户数据和预先建立的分类模型,对银行客户数据进行分类,其中,所述分类模型根据多个训练好的机器学习模型以及设定的每个训练好的机器学习模型对应的权重值预先建立,所述每个训练好的机器学习模型对应的权重值利用遗传算法进行设定,所述每个机器学习模型根据银行客户历史数据进行训练。本发明专利技术便于处理银行客户数据,实现高准确性及可靠性的客户数据分类。

【技术实现步骤摘要】
银行客户数据处理方法及装置
本专利技术涉及数据分析
,尤其涉及银行客户数据处理方法及装置。
技术介绍
为给每个客户提供更具有针对性个性化服务,商业银行需要对客户数据进行分类,分类结果可用于金融服务的多个场景,例如,基于客群的精准营销、产品推广等。随着商业银行客户数量的增加,客户消费行为异常复杂,且数据量随着时间推移越来越大,现有的聚类算法或者人工分类方法已无法满足商业银行业务对客户数据分类结果的要求,存在分类准确性和可靠性较差的问题。因此,亟需一种可以克服上述问题的银行客户数据处理方案。
技术实现思路
本专利技术实施例提供一种银行客户数据处理方法,用以处理银行客户数据,实现高准确性及可靠性的客户数据分类,该方法包括:获得银行客户数据,所述银行客户数据包括:个人数据,交易数据,资产负债数据其中之一或任意组合;根据所述银行客户数据和预先建立的分类模型,对银行客户数据进行分类,其中,所述分类模型根据多个训练好的机器学习模型以及设定的每个训练好的机器学习模型对应的权重值预先建立,所述每个训练好的机器学习模型对应的权重值利用遗传算法进行设定,所述每个机器学习模型根据银行客户历史数据进行训练。本专利技术实施例提供一种银行客户数据处理装置,用以处理银行客户数据,实现高准确性及可靠性的客户数据分类,该装置包括:数据获得模块,用于获得银行客户数据,所述银行客户数据包括:个人数据,交易数据,资产负债数据其中之一或任意组合;数据分类模块,用于根据所述银行客户数据和预先建立的分类模型,对银行客户数据进行分类,其中,所述分类模型根据多个训练好的机器学习模型以及设定的每个训练好的机器学习模型对应的权重值预先建立,所述每个训练好的机器学习模型对应的权重值利用遗传算法进行设定,所述每个机器学习模型根据银行客户历史数据进行训练。本专利技术实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述银行客户数据处理方法。本专利技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述银行客户数据处理方法的计算机程序。相对于现有技术中通过聚类算法或者人工进行客户数据分类的方案而言,本专利技术实施例通过获得银行客户数据,所述银行客户数据包括:个人数据,交易数据,资产负债数据其中之一或任意组合;根据所述银行客户数据和预先建立的分类模型,对银行客户数据进行分类,其中,所述分类模型根据多个训练好的机器学习模型以及设定的每个训练好的机器学习模型对应的权重值预先建立,所述每个训练好的机器学习模型对应的权重值利用遗传算法进行设定,所述每个机器学习模型根据银行客户历史数据进行训练。本专利技术实施例无需人为操作,利用银行客户数据和预先建立的分类模型对客户数据进行自动分类,快速、省力、高效且低成本,此外,考虑到每个机器学习模型学习到特征的侧重点不同,本专利技术实施例利用遗传算法为每个训练好的机器学习模型设定了对应的权重值,根据多个训练好的机器学习模型以及设定的每个训练好的机器学习模型对应的权重值建立分类模型,从而针对不同的业务需求能够自适应调整权重值,有效提升了特征学习能力,尽可能挖掘数据隐藏特征,提高了客户数据分类结果的准确性及可靠性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:图1为本专利技术实施例中银行客户数据处理方法示意图;图2为本专利技术实施例中银行客户数据处理装置结构图;图3为本专利技术实施例中银行客户数据处理装置结构图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本专利技术实施例做进一步详细说明。在此,本专利技术的示意性实施例及其说明用于解释本专利技术,但并不作为对本专利技术的限定。首先,对本申请实施例中涉及的名词进行介绍:lightgbm模型:lightgbm模型是微软提出的一个梯度提升框架,使用基于树的学习算法。该模型速度快、精度高、可处理大规模数据。客群分类:客群分类是指将客户按照某种标准,将具有相似行为特征、价值特征的客户归为同一个群体的行为。xgboost模型:xgboost模型是一个基于树的,由多个弱分类器经过boost框架,以负梯度为学习策略的一种集成学习方法。该方法在应用实践中表现出优良的效果和效率,因而被工业界广为推崇。神经网络:神经网络是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法模型。这种模型通过调整内部大量节点之间相互连接的关系,从而完成信息处理。遗传算法:遗传算法是一种通过模拟自然进化过程搜索最优解的优化算法,该算法不需要确定的规则就能自动获取和指导优化的搜索空间,自适应地调整搜索方向。如前所述,随着商业银行客户数量的增加,客户消费行为异常复杂,且数据量随着时间推移越来越大,现有的聚类算法或者人工分类方法已无法满足商业银行业务对客户数据分类结果的要求。基于聚类的客群方法无法挖掘数据中的隐藏特征,数据利用率低,结果可靠性、准确性差;单个算法能学习到的特征有限,故而基于单个算法的客群分类模型准确率会受到限制;基于单个模型的分类方法适用性受到算法本身限制,不能很好的适用于所有的场景。为了处理银行客户数据,实现高准确性及可靠性的客户数据分类,本专利技术实施例提供一种银行客户数据处理方法,如图1所示,该方法可以包括:步骤101、获得银行客户数据,所述银行客户数据包括:个人数据,交易数据,资产负债数据其中之一或任意组合;步骤102、根据所述银行客户数据和预先建立的分类模型,对银行客户数据进行分类,其中,所述分类模型根据多个训练好的机器学习模型以及设定的每个训练好的机器学习模型对应的权重值预先建立,所述每个训练好的机器学习模型对应的权重值利用遗传算法进行设定,所述每个机器学习模型根据银行客户历史数据进行训练。由图1所示可以得知,本专利技术实施例通过获得银行客户数据,所述银行客户数据包括:个人数据,交易数据,资产负债数据其中之一或任意组合;根据所述银行客户数据和预先建立的分类模型,对银行客户数据进行分类,其中,所述分类模型根据多个训练好的机器学习模型以及设定的每个训练好的机器学习模型对应的权重值预先建立,所述每个训练好的机器学习模型对应的权重值利用遗传算法进行设定,所述每个机器学习模型根据银行客户历史数据进行训练。本专利技术实施例无需人为操作,利用银行客户数据和预先建立的分类模型对客户数据进行自动分类,快速、省力、高效且低成本,此外,考虑到每个机器学习模型学习到特征的侧重点不同,本专利技术实施例利用遗传算法为每个训练好的机器学习模型设定了对应的权重值,根据多个训练好的机器学习模型以及设定的每个训练好的机器学习模型对应的权重值建立分类模本文档来自技高网...

【技术保护点】
1.一种银行客户数据处理方法,其特征在于,包括:/n获得银行客户数据,所述银行客户数据包括:个人数据,交易数据,资产负债数据其中之一或任意组合;/n根据所述银行客户数据和预先建立的分类模型,对银行客户数据进行分类,其中,所述分类模型根据多个训练好的机器学习模型以及设定的每个训练好的机器学习模型对应的权重值预先建立,所述每个训练好的机器学习模型对应的权重值利用遗传算法进行设定,所述每个机器学习模型根据银行客户历史数据进行训练。/n

【技术特征摘要】
1.一种银行客户数据处理方法,其特征在于,包括:
获得银行客户数据,所述银行客户数据包括:个人数据,交易数据,资产负债数据其中之一或任意组合;
根据所述银行客户数据和预先建立的分类模型,对银行客户数据进行分类,其中,所述分类模型根据多个训练好的机器学习模型以及设定的每个训练好的机器学习模型对应的权重值预先建立,所述每个训练好的机器学习模型对应的权重值利用遗传算法进行设定,所述每个机器学习模型根据银行客户历史数据进行训练。


2.如权利要求1所述的银行客户数据处理方法,其特征在于,所述每个训练好的机器学习模型对应的权重值按如下方式进行设定:
初始化所述每个训练好的机器学习模型对应的权重值;
利用遗传算法对所述每个训练好的机器学习模型对应的权重值进行多次迭代更新,其中,对于每次迭代更新,在该次迭代更新后获取第一预设数量的子代数据,根据所述第一预设数量的子代数据对所述权重值进行下一次迭代更新。


3.如权利要求2所述的银行客户数据处理方法,其特征在于,对于每次迭代更新,在该次迭代更新后获取第一预设数量的子代数据,根据所述第一预设数量的子代数据对所述权重值进行下一次迭代更新,包括:
对于每次迭代更新,在该次迭代更新后获取种群中第一预设数量的子代数据;
对所述第一预设数量的子代数据进行交叉处理,得到第二预设数量的子代数据;
利用所述第二预设数量的子代数据替换下一代种群中第二预设数量的子代数据;
根据替换后的下一代种群中的子代数据,对所述权重值进行下一次迭代更新。


4.如权利要求1所述的银行客户数据处理方法,其特征在于,所述多个训练好的机器学习模型包括:xgboost机器学习模型,lightgbm机器学习模型和神经网络模型。


5.如权利要求1所述的银行客户数据处理方法,其特征在于,还包括:获得银行客户数据之后,利用三倍标准差探测算法对所述银行客户数据进行清洗处理,利用均值填充算法对清洗处理后的银行客户数据进行空缺填充处理,对空缺填充处理后的银行客户数据进行数据向量化处理;
根据所述银行客户数据和预先建立的分类模型,对银行客户数据进行分类,包括:根据数据向量化处理后的银行客户数据和预先建立的分类模型,对银行客户数据进行分类。


6.一种银行客户数据处理装置,其特征在于,包括:
数据获得模块,用于获得银行客户数据,...

【专利技术属性】
技术研发人员:徐晓健童楚婕李福洋严洁栾英英彭勃
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1