信息评估方法及装置制造方法及图纸

技术编号:38662741 阅读:7 留言:0更新日期:2023-09-02 22:45
本申请提供一种信息评估方法及装置,可用于金融领域或其他技术领域。所述方法包括:获取待评估信息,其中,所述待评估信息包括离散型特征和连续型特征;将所述离散型特征的特征向量输入基于双重样本感知因子分解机DIFM和高效通道注意力机制ECA

【技术实现步骤摘要】
信息评估方法及装置


[0001]本申请涉及机器学习
,具体涉及一种信息评估方法及装置。

技术介绍

[0002]在大数据兴起之前,信息的评估一般是由相关领域的专家完成,但是随着大数据时代的到来,这一工作继续由人工完成是不太现实的。随着大数据时代的到来,各类适应于该环境下的统计学和机器学习模型开始兴起。最开始的逻辑回归、支持向量机(SVM)、决策树,到后来的深度学习。深度学习模型更是凭借其在各类复杂任务中良好的表现,被快速的引入到推荐系统领域,广泛的应用于信息筛选、分类工作,并辅助决策者进行快速决策。在银行业内,存在着大量筛选信息进行决策的场景,例如根据客户的资产、信用等情况对客户进行画像,为银行挖掘潜力客户,同时使客户能够获得对应的最优的服务。一家成熟的银行所拥有的客户数量是及其庞大的,依靠人工完成对银行的整个客户群体画像是极其困难的,但是依靠大数据背景下的算法建模能够解决这一问题,本专利技术就是针对解决这一类问题提出的。
[0003]大数据广泛应用的情况下,数据量呈指数级增长,数据结构日益复杂。数据本身的记录方式,以及采集方式都会导致数据结构多样性。一些数据表现为离散,一些数据又相对连续,混合使用此类数据或单一使用某一类数据进行建模得到的结果并不那么理想。

技术实现思路

[0004]针对现有技术中的问题,本申请实施例提供一种信息评估方法及装置,能够至少部分地解决现有技术中存在的问题。
[0005]一方面,本申请提出一种信息评估方法,包括:
[0006]获取待评估信息,其中,所述待评估信息包括离散型特征和连续型特征;
[0007]将所述离散型特征的特征向量输入基于双重样本感知因子分解机DIFM和高效通道注意力机制ECA

Net建立的类别特征神经网络模型,得到所述类别特征神经网络模型输出的第一评估结果,其中,所述类别特征神经网络模型是以样本信息的离散型特征为输入,以该样本信息的离散型特征的标签为输出训练得到的;
[0008]将所述连续型特征的特征向量输入基于LightGBM的梯度提升树转化的GBDT2NN模型,得到所述GBDT2NN模型输出的第二评估结果,其中,所述GBDT2NN模型是以样本信息的连续型特征为输入、以该样本信息的连续型特征的标签为输出训练得到的;
[0009]根据所述第一评估结果和所述第二评估结果,确定所述待评估信息的评估结果。
[0010]在一些实施例中,所述类别特征神经网络模型包括:
[0011]嵌入矩阵层,将每个离散型特征的特征向量转化第一嵌入矩阵,将每个所述第一嵌入矩阵进行拼接,得到第二嵌入矩阵;
[0012]特征提取层,包括ECA

Net模块和DNN特征提取模块,ECA

Net模块对所述第二嵌入矩阵中的每个向量进行特征提取,得到第一输出矩阵,DNN特征提取模块对所述第二嵌入矩
阵进行特征提取,得到第二输出矩阵;
[0013]特征组合层,分别对第一输出矩阵和第二输出矩阵进行转换,得到两组长度为h的特征向量,将该两个长度为h的特征向量进行求和,得到特征权重向量,其中,h为所述离散型特征的特征向量的个数;
[0014]再次加权层,将所述特征权重向量和相应的离散型特征的特征向量进行相乘,得到每个离散型特征的加权向量;
[0015]预测层,根据每个离散型特征的加权向量,计算第一评估结果。
[0016]在一些实施例中,ECA

Net模块对所述第二嵌入矩阵中的每个向量进行特征提取,得到第一输出矩阵包括:
[0017]ECA

Net模块对所述第二嵌入矩阵中的每个向量进行1
×
1的卷积操作,将每个所述向量压缩为一个一维向量,将每个所述一维向量进行组合,生成组合向量,对组合向量进行卷积核大小为m、步长为1的一维卷积运算,得到卷积结果,将所述卷积结果与所述第二嵌入矩阵相乘,得到第一输出矩阵,m为正整数。
[0018]在一些实施例中,所述根据所述第一评估结果和所述第二评估结果,确定所述待评估信息的评估结果包括:
[0019]利用第一权重值和第二权重值分别对所述第一评估结果和所述第二评估结果进行加权求和处理,得到所述待评估信息的评估结果。
[0020]在一些实施例中,所述第一权重值和/或所述第二权重值为可训练参数,在所述类别特征神经网络模型和所述GBDT2NN模型的训练过程中更新。
[0021]在一些实施例中,在获取待评估信息之后,所述方法还包括:
[0022]对所述待评估信息中的离散型特征进行独热编码,生成所述离散型特征的特征向量;
[0023]利用线性判别降维算法对所述待评估信息中的连续型特征进行降维,得到所述连续型特征中的稠密特征的特征向量;
[0024]所述将所述连续型特征的特征向量输入基于LightGBM的梯度提升树转化的GBDT2NN模型包括:
[0025]将所述稠密特征的特征向量输入基于LightGBM的梯度提升树转化的GBDT2NN模型。
[0026]在一些实施例中,所述待评估信息包括银行客户的信息,所述银行客户信息包括存款信息、收入信息、贷款信息、守信信息、职业、学历、客户星级、征信等级、地域和/或性别。
[0027]另一方面,本申请提出一种信息评估装置,包括:
[0028]获取模块,用于获取待评估信息,其中,所述待评估信息包括离散型特征和连续型特征;
[0029]第一输入模块,用于将所述离散型特征的特征向量输入基于双重样本感知因子分解机DIFM和高效通道注意力机制ECA

Net建立的类别特征神经网络模型,得到所述类别特征神经网络模型输出的第一评估结果,其中,所述类别特征神经网络模型是以样本信息的离散型特征为输入,以该样本信息的离散型特征的标签为输出训练得到的;
[0030]第二输入模块,用于将所述连续型特征的特征向量输入基于LightGBM的梯度提升
树转化的GBDT2NN模型,得到所述GBDT2NN模型输出的第二评估结果,其中,所述GBDT2NN模型是以样本信息的连续型特征为输入、以该样本信息的连续型特征的标签为输出训练得到的;
[0031]确定模块,用于根据所述第一评估结果和所述第二评估结果,确定所述待评估信息的评估结果。
[0032]在一些实施例中,所述类别特征神经网络模型包括:
[0033]嵌入矩阵层,将每个离散型特征的特征向量转化第一嵌入矩阵,将每个所述第一嵌入矩阵进行拼接,得到第二嵌入矩阵;
[0034]特征提取层,包括ECA

Net模块和DNN特征提取模块,ECA

Net模块对所述第二嵌入矩阵中的每个向量进行特征提取,得到第一输出矩阵,DNN特征提取模块对所述第二嵌入矩阵进行特征提取,得到第二输出矩阵;
[0035]特征组合层,分别对第一输出矩阵和第二输出矩阵本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息评估方法,其特征在于,包括:获取待评估信息,其中,所述待评估信息包括离散型特征和连续型特征;将所述离散型特征的特征向量输入基于双重样本感知因子分解机DIFM和高效通道注意力机制ECA

Net建立的类别特征神经网络模型,得到所述类别特征神经网络模型输出的第一评估结果,其中,所述类别特征神经网络模型是以样本信息的离散型特征为输入,以该样本信息的离散型特征的标签为输出训练得到的;将所述连续型特征的特征向量输入基于LightGBM的梯度提升树转化的GBDT2NN模型,得到所述GBDT2NN模型输出的第二评估结果,其中,所述GBDT2NN模型是以样本信息的连续型特征为输入、以该样本信息的连续型特征的标签为输出训练得到的;根据所述第一评估结果和所述第二评估结果,确定所述待评估信息的评估结果。2.根据权利要求1所述的方法,其特征在于,所述类别特征神经网络模型包括:嵌入矩阵层,将每个离散型特征的特征向量转化第一嵌入矩阵,将每个所述第一嵌入矩阵进行拼接,得到第二嵌入矩阵;特征提取层,包括ECA

Net模块和DNN特征提取模块,ECA

Net模块对所述第二嵌入矩阵中的每个向量进行特征提取,得到第一输出矩阵,DNN特征提取模块对所述第二嵌入矩阵进行特征提取,得到第二输出矩阵;特征组合层,分别对第一输出矩阵和第二输出矩阵进行转换,得到两组长度为h的特征向量,将该两个长度为h的特征向量进行求和,得到特征权重向量,其中,h为所述离散型特征的特征向量的个数;再次加权层,将所述特征权重向量和相应的离散型特征的特征向量进行相乘,得到每个离散型特征的加权向量;预测层,根据每个离散型特征的加权向量,计算第一评估结果。3.根据权利要求2所述的方法,其特征在于,ECA

Net模块对所述第二嵌入矩阵中的每个向量进行特征提取,得到第一输出矩阵包括:ECA

Net模块对所述第二嵌入矩阵中的每个向量进行1
×
1的卷积操作,将每个所述向量压缩为一个一维向量,将每个所述一维向量进行组合,生成组合向量,对组合向量进行卷积核大小为m、步长为1的一维卷积运算,得到卷积结果,将所述卷积结果与所述第二嵌入矩阵相乘,得到第一输出矩阵,m为正整数。4.根据权利要求1所述的方法,其特征在于,所述根据所述第一评估结果和所述...

【专利技术属性】
技术研发人员:蒲可维
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1