对象属性信息处理方法、装置、计算机设备、存储介质制造方法及图纸

技术编号:32364348 阅读:28 留言:0更新日期:2022-02-20 03:36
本申请涉及大数据技术领域,特别是涉及一种对象属性信息处理方法、装置、计算机设备、存储介质和计算机程序产品。该方法包括:基于多个样本对象的对象属性信息,确定各样本对象各自所对应的样本特征序列、违约风险级别、以及样本违约标签。对于特征序列中每个子特征,均基于相应子特征所对应的样本对象所属的违约风险级别、以及样本违约标签,确定相应子特征所对应的特征风险概率。基于各特征风险概率、各样本特征序列、以及各样本违约标签,进行相关性分析,得到与各样本对象分别对应的目标特征向量,各目标特征向量用于对违约风险预测模型进行训练。这样,大大提高了违约风险预测模型预测的准确度。型预测的准确度。型预测的准确度。

【技术实现步骤摘要】
对象属性信息处理方法、装置、计算机设备、存储介质


[0001]本申请涉及大数据
,特别是涉及一种对象属性信息处理方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]随着大数据
的发展,为了对金融领域的对象进行违约风险预测,需要对违约风险预测模型进行训练。其中,在对违约风险预测模型进行训练的过程中,常常需要对对象风险相关信息进行量化、标准化等处理,并将处理后的信息用于违约风险预测模型的训练。其中,风险相关信息可以是对象的年龄、收入、职业等类别特征。
[0003]在相关技术中,在信息处理的过程中,每个类别特征直接用于违约风险预测模型的训练,比如将对象的职业特征直接作为一个变量用于模型训练,该职业特征只能反映职务对对象风险的影响程度。
[0004]然而,对于每个类别特征来说,单一维度的类别特征在反映对象风险表现时相对简单,难以精确反映对象风险的表现,存在违约风险预测模型预测的准确度低的问题。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种对象属性信息处理方法、装置、本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种对象属性信息处理方法,其特征在于,所述方法包括:获取多个样本对象的对象属性信息;基于所述多个样本对象的对象属性信息,确定各样本对象各自所对应的样本特征序列、违约风险级别、以及样本违约标签;其中,所述样本特征序列对应多个属性维度所对应的属性特征组成,且每个属性特征均包含有多个子特征;对于每个子特征,均基于相应子特征所对应的样本对象所属的违约风险级别、以及所对应的样本对象所属的样本违约标签,确定相应子特征所对应的特征风险概率;基于各个特征风险概率、各个样本特征序列、以及各个样本违约标签,进行相关性分析,得到与各个样本对象分别对应的目标特征向量,各个所述目标特征向量用于对违约风险预测模型进行训练。2.根据权利要求1所述的方法,其特征在于,所述基于所述多个样本对象的对象属性信息,确定各样本对象各自所对应的样本特征序列、违约风险级别、以及样本违约标签,包括:对各个样本对象的对象属性信息进行抽取,得到各样本对象各自对应的样本特征序列、透支期限段、以及在预定时间段的违约结果;基于所述各样本对象各自对应的透支期限段,确定各样本对象各自对应的违约风险级别;基于各样本对象各自对应在预定时间段的违约结果,确定各样本对象各自对应的样本违约标签,所述样本违约标签包括不满足违约条件的白标签和满足违约条件的黑标签。3.根据权利要求1所述的方法,其特征在于,所述样本违约标签包括不满足违约条件的白标签,所述对于每个子特征,均基于相应子特征所对应的样本对象所属的违约风险级别、以及所对应的样本对象所属的样本违约标签,确定相应子特征所对应的特征风险概率,包括:对于每个子特征,均基于相应子特征所对应的样本对象所属的违约风险级别,确定所对应的样本对象中属于同一个违约风险级别的级别数量;对于相应子特征所对应的样本对象所属的每个违约风险级别,均基于相应子特征所对应的样本对象所属的白标签的个数、以及所对应的违约风险级别的级别数量,确定相应子特征所对应的特征风险概率;其中,各特征风险概率与各违约风险级别一一对应。4.根据权利要求1所述的方法,其特征在于,所述子特征所对应的特征风险概率包括与各违约风险级别分别对应的特征风险概率,所述基于各个特征风险概率、各个样本特征序列、以及各个样本违约标签,进行相关性分析,得到与各个样本对象分别对应的目标特征向量,包括:对于每个样本对象,确定相应样本对象的每个子特征分别在多个违约风险等级下的多个特征风险概率;若属性特征为数值型,则对于每个数值型属性特征,基于每个样本对象中数值型属性特征所对应的多个特征风险概率、数值型属性特征的属性数值、以及各个样本对象的样本违约标签,确定与相应数值型属性特征对应的第一待处理矩阵;对于各个第一待处理矩阵,均对每个第一待处理矩阵进行协方差计算,对相应第一待处理矩阵进行筛选,确定每个数值型属性特征各自对应的第一中间向量;若属性特征为非数值型,则对于每个非数值型属性特征,基于每个样本对象中非数值
型属性特征所对应的多个特征风险概率、以及各个样本对象的样本违约标签,确定与相应非数值型属性特征对应的第二待处理矩阵;对于各个第二待处理矩阵,均对每个第二待处理矩阵进行协方差计算,对相应第二待处理矩阵进行筛选,确定每个非数值型属性特征各自对应的第二中间向量;将所述第一中间向量和所述第二中间向量进行组合,得到与各个样本对象分别对应的目标特征向量。5.根据权利要求4所述的方法,其特征在于...

【专利技术属性】
技术研发人员:吴城宇何艳杨丝与谢玥
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1