基于改进GDBT算法的用户评级方法及系统技术方案

技术编号:33024065 阅读:12 留言:0更新日期:2022-04-15 08:57
本发明专利技术公开了基于改进GDBT算法的用户评级方法及系统,属于用户评价技术领域,要解决的技术问题为如何基于GDBT算法针对性的实现银行零售业内客户评级。包括如下步骤:获取用户基本信息,获取用户行为信息,基于用户行为信息建立用户的专家评分尺度;通过Topsis理想方法对样本进行标签建设,通过PCA模型对样本进行标签建设,并基于线性可信度累加融合第一评分值和第二评分值,得到样本得分标签;基于用户行为信息以及样本得分标签,通过改进的GDBT算法构建用户评级模型;通过用户评级模型预测输出用户得分,并对用户得分进行归一化处理;配置用户评级策略,通过用户评级策略确定用户等级以及不同等级的资源推荐策略。用户等级以及不同等级的资源推荐策略。用户等级以及不同等级的资源推荐策略。

【技术实现步骤摘要】
基于改进GDBT算法的用户评级方法及系统


[0001]本专利技术涉及用户评价
,具体地说是基于改进GDBT算法的用户评级方法及系统。

技术介绍

[0002]银行在开展零售业现存的对各类资源使用存在冗余、服务分配不均衡的问题,以及银行对提升资源利用效率的把控主要资源及其合理分配要求。同时进一步提升自身运营能力,针对存量用户的维系留存及增量用户的准入把控。为了减低成本,精细化银行零售系统内管理开销,针对客户合理有效的分配资源,精准定位客户,针对银行零售客户构建内部评级体系。通过对现存用户评级分类,不仅能从本质上解决内部资源合理分配,且在信贷申请阶段形成用户准入体系,直观科学的对运营工作进行指导。
[0003]现有相似的技术方案多是成熟行业的定性规则,大致的评级指标体系构建思路是:针对行业内的无监督数据,首先按照一定规则提取数据集,通过聚类分析等其他方法,建立评级模型。另一种思路是针对行业内样本,根据无监督数据打分的方法进行样本标签建设,并将无监督学习得到的标签作为输入,继而使用GDBT算法针对性的进行建模。
[0004]如何基于GDBT算法针对性的实现银行零售业内客户评级,是需要解决的技术问题。

技术实现思路

[0005]本专利技术的技术任务是针对以上不足,提供基于改进GDBT算法的用户评级方法及系统,来解决如何基于GDBT算法针对性的实现银行零售业内客户评级的技术问题。
[0006]第一方面,本专利技术的基于改进GDBT算法的用户评级方法,包括如下步骤:
[0007]获取用户基本信息,根据用户历史申请单位拉取用户对产品的申请行为,获取用户行为信息,基于用户行为信息建立用户的专家评分尺度,并基于用户基本信息和用户行为信息组成的用户信息构建用于用户评价的指标体系;
[0008]通过Topsis理想方法对样本进行标签建设,得到样本在Topsis理想解法下的评分值作为第一评分值,通过PCA模型对样本进行标签建设,得到样本的PCA算法下的评分值作为第二评分值,并基于线性可信度累加融合第一评分值和第二评分值,得到样本得分标签;
[0009]通过从构造一个变量多个决策树转变为构造一个多变量决策树的方式改进GDBT算法,基于所述用户信息以及样本得分标签,通过改进的GDBT算法构建用户评级模型,所述用户评级模型用于以用户信息为输入、推理输出用户得分;
[0010]通过所述用户评级模型预测输出用户得分,并对所述用户得分进行归一化处理;
[0011]配置用户评级策略,通过用户评级策略确定用户等级以及不同等级的资源推荐策略,基于用户得分,根据用户评级策略确定用户等级并进行资源推荐。
[0012]作为优选,所述用户基本信息包括用户名称、用户类型、使用产品类型以及用户年净利润;
[0013]所述用户申请行为包括单号order_id以及申请的信贷产品;
[0014]专家评分尺度包括使用资金目标程度得分、个人征信状况得分、偿还能力得分、消费能力得分、银行贡献得分以及调研配合得分。
[0015]作为优选,通过Topsis理想方法对样本进行标签建设,包括如下步骤:
[0016]对用户信息数据集X={x
i
},i=1,2,

,n,x
i
包含特征L={y
m
},m=1,2,...,n,寻找最优劣解,找到一个特征的最优记为f
j+
,找到每一特征最差记为f
j


[0017]计算各用户与最优最劣向量的欧式距离:
[0018][0019]计算用户的相对贴近程度:
[0020][0021]确定用户评分:
[0022][0023]共中,Otopsis
i
为第i个样本在Topsis理想解法下的样本评分值。
[0024]作为优选,通过PCA模型对样本进行标签建设,包括如下步骤:
[0025]对用户信息数据集X={x
i
},i=1,2,...,n,x
i
包含特征L={y
m
},m=1,2,...,进行PCA算法建模;
[0026]根据主成分贡献度的大小,选取j个主成分,Y={y
j
},j=1,2,...,a,y
j
为第j主成分得分,将第i个样本的第j主成分记为y
ij

[0027]根据第j个主成分的贡献度con
j
计算各个主成分得分,并根据主成分得分计算每个样本在PCA算法下的标签样本得分值,第i个样本在PCA算法下的标签样本得分值计算公式为:
[0028][0029]作为优选,基于线性可信度累加融合第一评分值和第二评分值,得到的样本得分标签计算公式为:
[0030]O=αOtopsis
i
+βOpca
i
=(o1o2,...,o
n
)
[0031]其中,o
n
为第n个样本对应的样本得分标签,α,β为引入的加权因子,α,β的相加和等于1。
[0032]作为优选,基于所述用户行为数据以及样本得分标签,通过改进的GDBT算法构建用户评级模型,包括如下步骤:
[0033](1)用户信息数据集X={x
i
},i=1,2,...,n,x
i
包含特征L={y
m
},m=1,2,...,对L={var
m
},m=1,2,...进行特征分箱的归一化,得到归一化后的特征矩阵y
i

[0034](2)计算初始梯度值:
[0035][0036]其中,f(x)设置为0或者随机值,learing_rate为学习率;
[0037](3)建立一个多变量决策树,直到树的叶子能被分割;
[0038](4)更新树的梯度g
m
(x
i
);
[0039](5)重复执行步骤(3)和步骤(4),直至得到用户评级模型f
GBDT
(x);
[0040]其中,步骤建立一个多变量决策树,直到树的叶子能被分割,包括如下步骤:
[0041](3.1)建立多输出的直方图,所述多输出的直方图对应样本集合S、列索引k、输出维数d和箱子数b、输出k列、,将特征矩阵转化成h
ij

[0042](3.2)从直方图中获得分裂增益,使用多输出的近似分割查找算法,遍历箱子数bin内每个直方图求解gain=max(gain,score);
[0043]基于直方图的稀疏分割算法在给定可能分割的情况下计算其目标增益:
[0044][0045]其中,G和H分别为多输出直方图的和的加总,通过来简化表示;G
r
G
l
是与G相同结构的表示,作为计算环节的中间变量,初始本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于改进GDBT算法的用户评级方法,其特征在于包括如下步骤:获取用户基本信息,根据用户历史申请单位拉取用户对产品的申请行为,获取用户行为信息,基于用户行为信息建立用户的专家评分尺度,并基于用户基本信息和用户行为信息组成的用户信息构建用于用户评价的指标体系;;通过Topsis理想方法对样本进行标签建设,得到样本在Topsis理想解法下的评分值作为第一评分值,通过PCA模型对样本进行标签建设,得到样本的PCA算法下的评分值作为第二评分值,并基于线性可信度累加融合第一评分值和第二评分值,得到样本得分标签;通过从构造一个变量多个决策树转变为构造一个多变量决策树的方式改进GDBT算法,基于所述用户信息以及样本得分标签,通过改进的GDBT算法构建用户评级模型,所述用户评级模型用于以用户信息为输入、推理输出用户得分;通过所述用户评级模型预测输出用户得分,并对所述用户得分进行归一化处理;配置用户评级策略,通过用户评级策略确定用户等级以及不同等级的资源推荐策略,基于用户得分,根据用户评级策略确定用户等级并进行资源推荐。2.根据权利要求1所述的基于改进GDBT算法的用户评级方法,其特征在于所述用户基本信息包括用户名称、用户类型、使用产品类型以及用户年净利润;所述用户申请行为包括单号order_id以及申请的信贷产品;;专家评分尺度包括使用资金目标程度得分、个人征信状况得分、偿还能力得分、消费能力得分、银行贡献得分以及调研配合得分。3.根据权利要求1所述的基于改进GDBT算法的用户评级方法,其特征在于通过Topsis理想方法对样本进行标签建设,包括如下步骤:对用户信息数据集X={x
i
},i=1,2,

,n,x
i
包含特征L={y
m
},m=1,2,

,n,寻找最优劣解,找到一个特征的最优记为f
j+
,找到每一特征最差记为f
j

;计算各用户与最优最劣向量的欧式距离:计算用户的相对贴近程度:确定用户评分:其中,Otopsis
i
为第i个样本在Topsis理想解法下的样本评分值。4.根据权利要求1所述的基于改进GDBT算法的用户评级方法,其特征在于通过PCA模型对样本进行标签建设,包括如下步骤:对用户信息数据集X={x
i
},i=1,2,

,n,x
i
包含特征L={y
m
},m=1,2,

,进行PCA算法建模;
根据主成分贡献度的大小,选取j个主成分,Y={y
j
},j=1,2,

,a,y
j
为第j主成分得分,将第i个样本的第j主成分记为y
ij
;根据第j个主成分的贡献度con
j
计算各个主成分得分,并根据主成分得分计算每个样本在PCA算法下的标签样本得分值,第i个样本在PCA算法下的标签样本得分值计算公式为:5.根据权利要求1所述的基于改进GDBT算法的用户评级方法,其特征在于基于线性可信度累加融合第一评分值和第二评分值,得到的样本得分标签计算公式为:O=αOtopsis
i
+βOpca
i
=(o1o2,

,o
n
)其中,o
n
为第n个样本对应的样本得分标签,α,β为引入的加权因子,α,β的相加和等于1。6.根据权利要求1

5任一项所述的基于改进GDBT算法的用户评级方法,其特征在于基于所述用户信息以及样本得分标签,通过改进的GDBT算法构建用户评级模型,包括如下步骤:(1)用户信息数据集X={x
i
},i=1,2,

,n,x
i
包含特征L={y
m
},m=1,2,

,对L={var
m
},m=1,2,

进行特征分箱的归一化,得到归一化后的特征矩阵y
i
;(2)计算初始梯度值:其中,f(x)设置为0或者随机值,learing_rate为学习率;(3)建立一个多变量决策树,直到树的叶子能被分割;(4)更新树的梯度g
m
(x
i
);(5)重复执行步骤(3)和步骤(4),直至得到用户评级模型f
GBDT
(x);其中,步骤建立一个多变量决策树,直到树的叶子能被分割,包括如下步骤:(3.1)建立多输出的直方图,所述多输出的直方图对应样本集合S、列索引k、输出维数d和箱子数b、输出k列、,将特征矩阵转化成h
ij
;(3.2)从直方图中获得分裂增益,使用多输出的近似分割查找算法,遍历箱子数bin内每个直方图求解gain=max(gain,score);基于直方图的稀疏分割算法在给定可能分割的情况下计算其目标增益:其中,G和H分别为多输出直方图的和的加总,通过来简化表示;G
r
G
l
是与G相同结构的表示,作为计算环节的中间变量,初始为0,遍历箱子数bin时,G
l
=G
l
+Hist.g[i];H
l
H
r
同理,const为固定常数,λ、bin为初始超参数;通过将单维树节点推广到多维应用求解目标增益,最终选取树的最佳分裂特征G,分裂阈值I;(3.3)建立根节点,
s=argmax(G
i
),1≤i≤mNode=(s,G
s
,I
s
)(3.4)根据最佳分裂特征分裂阈值,将样本切分。7.根据权利要求1

5任一项所述的基于改进GDBT算法的用户评级方法,其特征在于对于每个样本的评分Orate,归一化后的得分为rate
norm
,其中,μ、σ分别为样本评分的均值和方差。8.基于改进GDBT算法的用户评级系统,其特征在于用于通过如权利要求1
‑...

【专利技术属性】
技术研发人员:李尚锴王凯袁明明
申请(专利权)人:浪潮通信信息系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1