基于多维度交叉特征的信用评价方法、装置、设备及介质制造方法及图纸

技术编号:27062576 阅读:26 留言:0更新日期:2021-01-15 14:43
本发明专利技术实施例公开了一种基于多维度交叉特征的信用评价方法,包括:接收信用评价指令,获取与待评价用户对应的信用数据,所述信用数据包括多个变量下的初步数据;对所述多个变量下的初步数据进行分组;针对每个分组进行至少一次模型训练,获取该分组对应的子模型,其中:对至少一个变量进行第一筛选操作、第二筛选操作,确定至少一个目标特征;根据至少一个第二变量确定对应的目标组合特征,构建该分组对应的子模型;根据每个分组对应的子模型,构建目标评价模型;根据目标评价模型,获取与所述待评价用户对应的信用评价结果。本发明专利技术实施例还公开了相应的装置、设备及存储介质。采用本发明专利技术,可提高基于互联网大数据的信用评价的准确性。

【技术实现步骤摘要】
基于多维度交叉特征的信用评价方法、装置、设备及介质
本专利技术涉及计算机
,尤其涉及一种基于多维度交叉特征的信用评价方法、装置、计算机设备和计算机可读存储介质。
技术介绍
在传统的金融信贷场景下,对用户的信用进行评价主要是基于征信数据、房产数据、收入存款数据等。但是也同样存在大量的无传统信用数据或数据接近于空白的用户,例如,征信白户、无房产用户等,从而造成了传统的信用评估无法准确进行评估。但是,在互联网大数据时代中,在互联网中存在大量与用户对应的数据,例如,多头申请和多头借贷、移动设备行为特征、消费指数、移动轨迹等,这些数据也可以对用户的信用进行评估。但是互联网大数据的噪声过大,且没有有效的评估模型,无法根据互联网大数据对用户信用进行有效的评估。
技术实现思路
基于此,有必要针对上述问题,提出了一种基于多维度交叉特征的信用评价方法、装置、计算机设备和计算机可读存储介质。在本专利技术的第一部分,提供了一种基于多维度交叉特征的信用评价方法,所述方法包括:接收信用评价指令,所述信用评价指令包含待评价用户的用户标识;根据所述用户标识获取与所述待评价用户对应的信用数据,所述信用数据包括多个变量下的初步数据;对所述多个变量下的初步数据进行分组,每个分组下的变量的数量为至少一个;针对每个分组下的至少一个变量的初步数据,进行至少一次模型训练,获取该分组对应的子模型,其中:对至少一个变量进行第一筛选操作,确定至少一个第一变量;对至少一个第一变量进行第二筛选操作,确定至少一个目标特征;根据至少一个第二变量确定对应的目标组合特征;基于目标组合特征以及与该目标组合特征对应的变量,构建该分组对应的子模型;根据每个分组对应的子模型,构建目标评价模型;根据目标评价模型,获取与所述待评价用户对应的信用评价结果。可选的,所述对所述多个变量下的初步数据进行分组,每个分组下的变量的数量为至少一个的步骤,还包括:根据每一个变量对应的初步数据的属性信息,对所述信用数据进行分组,所述属性信息包括与该变量对应的初步数量对应数据来源、数据维度、时间中的一个或多个。可选的,所述根据每一个变量对应的初步数据的属性信息,对所述信用数据进行分组的步骤之后,包括:针对每个分组下的变量的初步数据,进行数据预处理;所述数据预处理包括删除数据完整度过低的初步数据、删除高度共线性的初步数据、删除数据来源可靠性过低的初步数据、删除时间间隔过早的初步数据中的一个或多个。可选的,所述对至少一个变量进行第一筛选操作,确定至少一第一变量的步骤,还包括:基于随机样本计算每一个变量对应的重要性评价值;根据所述重要性评价值是否大于或等与预设的重要性阈值确定至少一个第一变量。可选的,所述对至少一个第一变量进行第二筛选操作,确定至少一个目标组合特征的步骤,还包括:对至少一个第一变量进行穷举组合,获取每一个变量组合对应的组合特征;分别计算每一个组合特征对应的第二特征值,根据第二特征值是否大于或等于预设的特征阈值确定目标组合特征。可选的,所述对至少一个第一变量进行穷举组合,获取每一个变量组合对应的组合特征的步骤,包括:对至少一个第一变量进行穷举组合,获取K元组,其中K为大于等于2的整数;针对每一个K元组构建对应的决策树特征,计算决策树特征的每一个叶子节点的第三特征值,根据决策树特征和对应的第三特征值确定该K元组对应的组合特征。可选的,所述根据每个分组对应的子模型,构建目标评价模型的步骤,包括:使用改进的boosting算法对每个分组对应的子模型进行模型叠加,获取目标评价模型。在本专利技术的第二部分,提供了一种基于多维度交叉特征的信用评价装置,包括:信用评价指令接收模块,用于接收信用评价指令,所述信用评价指令包含待评价用户的用户标识;数据获取模块,用于根据所述用户标识获取与所述待评价用户对应的信用数据,所述信用数据包括多个变量下的初步数据;数据分组模块,用于对所述多个变量下的初步数据进行分组,每个分组下的变量的数量为至少一个;分组子模型构建模块,用于针对每个分组下的至少一个变量的初步数据,进行至少一次模型训练,获取该分组对应的子模型;其中,所述分组子模型构建模块包括:第一筛选子单元,用于对至少一个变量进行第一筛选操作,确定至少一个第一变量;第二筛选子单元,用于对至少一个第一变量进行第二筛选操作,确定至少一个目标特征;特征组合子单元,用于根据至少一个第二变量确定对应的目标组合特征;子模型构建子单元,用于基于目标组合特征以及与该目标组合特征对应的变量,构建该分组对应的子模型;目标评价模型构建模块,用于根据每个分组对应的子模型,构建目标评价模型;评价模块,根据目标评价模型,获取与所述待评价用户对应的信用评价结果。在本专利技术的第三部分,提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器如上所述的基于多维度交叉特征的信用评价方法。在本专利技术的第四部分,提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上所述的基于多维度交叉特征的信用评价方法。采用本专利技术实施例,具有如下有益效果:采用了上述基于多维度交叉特征的信用评价方法、装置、计算机设备和计算机可读存储介质之后,在金融信贷等应用场景下,对于待评价用户,从互联网大数据获取该用户对应的多个维度的数据,然后对数据进行分组,针对每一个分组进行多次变量筛选、特征筛选,然后基于筛选后的变量构建每个分组下的子模型,然后对多个子模型进行叠加处理,得到最终的基于多维度交叉特征的目标评价模型,通过该目标评价模型对待评价用户进行评价,输出目标评价结果,完成对待评价用户的信用评价。通过上述目标评价模型对用户的信用进行评价,可以更好的利用互联网大数据完成信用评价,提高信用评价的准确性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。其中:图1为一个实施例中一种基于多维度交叉特征的信用评价方法的流程示意图;图2为一个实施例中子模型构建的流程示意图;图3为一个实施例中一种基于多维度交叉特征的信用评价方法的流程示意图;图4为一个实施例中一种基于多维度交叉特征的信用评价装置的结构框图;图5为一个实施例中一种基于多维度交叉特征的信用评价装置的结构框图;图6为一个实施例中计算机设备的结构框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本本文档来自技高网...

【技术保护点】
1.一种基于多维度交叉特征的信用评价方法,其特征在于,所述方法包括:/n接收信用评价指令,所述信用评价指令包含待评价用户的用户标识;/n根据所述用户标识获取与所述待评价用户对应的信用数据,所述信用数据包括多个变量下的初步数据;/n对所述多个变量下的初步数据进行分组,每个分组下的变量的数量为至少一个;/n针对每个分组下的至少一个变量的初步数据,进行至少一次模型训练,获取该分组对应的子模型,其中:/n对至少一个变量进行第一筛选操作,确定至少一个第一变量;/n对至少一个第一变量进行第二筛选操作,确定至少一个目标特征;/n根据至少一个第二变量确定对应的目标组合特征;/n基于目标组合特征以及与该目标组合特征对应的变量,构建该分组对应的子模型;/n根据每个分组对应的子模型,构建目标评价模型;/n根据目标评价模型,获取与所述待评价用户对应的信用评价结果。/n

【技术特征摘要】
1.一种基于多维度交叉特征的信用评价方法,其特征在于,所述方法包括:
接收信用评价指令,所述信用评价指令包含待评价用户的用户标识;
根据所述用户标识获取与所述待评价用户对应的信用数据,所述信用数据包括多个变量下的初步数据;
对所述多个变量下的初步数据进行分组,每个分组下的变量的数量为至少一个;
针对每个分组下的至少一个变量的初步数据,进行至少一次模型训练,获取该分组对应的子模型,其中:
对至少一个变量进行第一筛选操作,确定至少一个第一变量;
对至少一个第一变量进行第二筛选操作,确定至少一个目标特征;
根据至少一个第二变量确定对应的目标组合特征;
基于目标组合特征以及与该目标组合特征对应的变量,构建该分组对应的子模型;
根据每个分组对应的子模型,构建目标评价模型;
根据目标评价模型,获取与所述待评价用户对应的信用评价结果。


2.根据权利要求1所述的基于多维度交叉特征的信用评价方法,其特征在于,所述对所述多个变量下的初步数据进行分组,每个分组下的变量的数量为至少一个的步骤,还包括:
根据每一个变量对应的初步数据的属性信息,对所述信用数据进行分组,所述属性信息包括与该变量对应的初步数量对应数据来源、数据维度、时间中的一个或多个。


3.根据权利要求2所述的基于多维度交叉特征的信用评价方法,其特征在于,所述根据每一个变量对应的初步数据的属性信息,对所述信用数据进行分组的步骤之后,包括:
针对每个分组下的变量的初步数据,进行数据预处理;
所述数据预处理包括删除数据完整度过低的初步数据、删除高度共线性的初步数据、删除数据来源可靠性过低的初步数据、删除时间间隔过早的初步数据中的一个或多个。


4.根据权利要求1所述的基于多维度交叉特征的信用评价方法,其特征在于,所述对至少一个变量进行第一筛选操作,确定至少一个第一变量的步骤,还包括:
基于随机样本计算每一个变量对应的重要性评价值;
根据所述重要性评价值是否大于或等与预设的重要性阈值确定至少一个第一变量。


5.根据权利要求1所述的基于多维度交叉特征的信用评价方法,其特征在于,所述对至少一个第一变量进行第二筛选操作,确定至少一个目标组合特征的步骤,还包括:
对至少一个第一变量进行穷举组合,获取每一个变量组合对应的组合特征;
分别计算每一个组合特征对应的第二特征...

【专利技术属性】
技术研发人员:梁德威彭艺焦建益
申请(专利权)人:中证信用云科技深圳股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1