This is a page open and a device model training method, the method comprises: constructing a decision function model and the training of the model of decision function importance of multiple training sample measure; measure in descending order of each of the training samples according to the importance, and each of the training samples after sorting the formation of a feature space; each of the training samples in the feature subspace classification and multi classification results, a plurality of classification results to get a weighted integration prediction score; judging whether the prediction score is the same with the preset scores, and in judging the prediction score and the preset don't score at the same time, the parameters of the model to adjust the decision function. The method improves the accuracy of prediction scores.
【技术实现步骤摘要】
模型训练方法及装置、存储介质、电子设备
本公开涉及数据处理
,具体而言,涉及一种模型训练方法、模型训练装置、计算机可读存储介质以及电子设备。
技术介绍
近年来,消费信贷迅速发展,住房、购车、信用卡、助学贷款等各种贷款义务规模不断扩大,日益增长的信贷规模给银行的风险评估能力带来很大的挑战。银行为了控制风险,不得不采取严格的信贷审核程序,导致贷款手续过于复杂,增加了消费信贷的交易成本;为了解决上述问题,建立一个完善的个人信用体系尤为重要,而个人信用评分是该体系中的重要技术环节。目前已有多种统计模型应用于个人信用评分,例如Logistic回归、神经网络技术、支持向量机等方法,均有不同程度应用于信用评分建模,但单一模型的问题在于分类精度不够高,且面对信用数据变化时显得不够稳健。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种模型训练方法、模型训练装置、计算机可读存储介质以及电子设备,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者 ...
【技术保护点】
一种模型训练方法,其特征在于,包括:构建一决策函数模型并对所述决策函数模型进行训练得到多个训练样本的重要性度量值;根据各所述重要性度量值对各所述训练样本进行降序排列,并将排序后的各所述训练样本生成一特征子空间;对所述特征子空间的各所述训练样本进行分类并得到多个分类结果,将多个所述分类结果进行加权整合得到一预测分数;判断所述预测分数是否与预设分数相同,并在判断所述预测分数与所述预设分数不同时,对所述决策函数模型的参数进行调整。
【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:构建一决策函数模型并对所述决策函数模型进行训练得到多个训练样本的重要性度量值;根据各所述重要性度量值对各所述训练样本进行降序排列,并将排序后的各所述训练样本生成一特征子空间;对所述特征子空间的各所述训练样本进行分类并得到多个分类结果,将多个所述分类结果进行加权整合得到一预测分数;判断所述预测分数是否与预设分数相同,并在判断所述预测分数与所述预设分数不同时,对所述决策函数模型的参数进行调整。2.根据权利要求1所述的模型训练方法,其特征在于,构建一决策函数模型包括:选择一线性核函数构建决策函数:f(x)=<w,x>+b;其中,f(x)为决策函数,<w,x>为线性核函数,w为重要性度量值,x为自变量,b为常数。3.根据权利要求2所述的模型训练方法,其特征在于,对所述决策函数模型进行训练得到多个训练样本的重要性度量值包括:假定所述决策函数的约束条件为:yi[(wi,xi)+b]-1≥0;其中,xi为第i个训练样本,yi为与所述第i个训练样本对应的结果标签,b为常数,wi为第i个训练样本的重要性度量值;将多个训练样本以及与多个所述训练样本一一对应的结果标签代入所述约束条件中并判断所述约束条件是否成立;将约束条件成立的各所述训练样本所对应的决策函数组成一最小化特征子集J,其中,J={J1,J2,...,Jm},m为使约束条件成立的训练样本的个数;对所述最小化特征子集J中的各训练样本所对应的决策函数进行泰勒展开得到:其中,ΔJ(i)为最小化目标函数J在第i个训练样本的增量,Δwi为重要性度量值w在第i个训练样本的增量,为最小化目标函数J的一阶偏导数,为最小化目标函数J的二阶偏导数;根据第i个所述训练样本对所述最小化目标函数的影响得出在所述最小化目标函数的最优点上,一阶偏导数为0,求解得到wi。4.根据权利要求3所述的模型训练方法,其特征在于,将排序后的各所述各所述训练样本生成一特征子空间包括:S10,配置一空集的特征序列F以及一特征子集S;其中,F=[],S=[1,…,p],p为排序后的训练样本的个数且p≤m;S20,判断所述特征子集S是否与φ相同并在判断所述特征子序列S与φ不相同时,将m个所述训练样本生成支持向量;S30,根据各所述训练样本的特征值wi计算所述支持向量中各所述训练样本的排序规则Ri,其中:Ri=(wi)2;S40,根据所述排序规则Ri的大小,查找到最小排序规则对应的所述训练样本的...
【专利技术属性】
技术研发人员:焦文健,
申请(专利权)人:北京京东尚科信息技术有限公司,北京京东世纪贸易有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。