【技术实现步骤摘要】
银行领域的广义线性模型训练方法、装置、设备和介质
[0001]本申请涉及计算机
,尤其涉及一种银行领域的广义线性模型训练方法、装置、电子设备和存储介质。
技术介绍
[0002]目前,在结构化数据的业务场景中,传统的业务模型,针对同一业务场景但应用对象不同的情况,一般有两种解决方法:一种是构建一个模型直接应用于不同的对象,一种是针对不同应用对象构建不同的模型。针对第一种方法,构建的模型数量少,花费时间少,模型上线管理简单,但是由于不同应用对象其数据分布差距比较大,构建一个模型直接应用于不同的对象,当分应用对象看模型效果时,模型效果一般较差;针对第二种方法,针对不同应用对象构建不同的模型,分应用对象看模型效果时,模型效果一般较第一种方法好,但是构建的模型数量多,耗费大量的人工,模型上线管理复杂,另外会割裂不同应用对象之间的联系。
[0003]如此,亟需一种可以模型管理简单,且针对多应用对象整体和分应用对象模型效果都较好的模型。
技术实现思路
[0004]本申请提供了一种银行领域的广义线性模型训练方法、装置、电子设备和存储介质,能够提高模型管理效率,且构建的模型针对多应用对象整体和单应用对象模型效果都较好。
[0005]第一方面,本申请提供了一种银行领域的广义线性模型训练方法,包括:对包含多个应用对象的数据进行处理,获得包括至少一个特征变量的目标训练集和目标验证集;基于该目标训练集,训练初始广义线性模型,得到目标广义线性模型;基于该目标验证集,对该目标广义线性模型进行评估,得到该目标验 ...
【技术保护点】
【技术特征摘要】
1.一种银行领域的广义线性模型训练方法,其特征在于,所述方法包括:对包含多个应用对象的数据进行处理,获得包括至少一个特征变量的目标训练集和目标验证集;基于所述目标训练集,训练初始广义线性模型,得到目标广义线性模型;基于所述目标验证集,对所述目标广义线性模型进行评估,得到所述目标验证集对应的第一模型评估指标;在根据所述第一模型评估指标确定针对所述目标验证集所述目标广义线性模型可用的情况下,按照不同的应用对象对所述目标验证集进行分组,得到多个子验证集,每个子验证集对应一个应用对象;基于所述每个子验证集,对所述目标广义线性模型进行评估,得到所述每个子验证集对应的第二模型评估指标;在根据所述每个子验证集对应的第二模型评估指标确定针对所述多个子验证集所述目标广义线性模型均可用的情况下,输出所述目标广义线性模型。2.根据权利要求1所述的方法,其特征在于,所述基于所述目标验证集,对所述目标广义线性模型进行评估,得到所述目标验证集对应的第一模型评估指标,包括:基于所述目标验证集,对所述目标广义线性模型进行评估,得到所述第一模型评估指标和所述目标验证集对应的至少一个第一单变量拟合曲线,每个第一单变量拟合曲线为所述目标验证集的一个特征变量的取值的拟合曲线;所述在根据所述第一模型评估指标确定针对所述目标验证集所述目标广义线性模型可用的情况下,按照不同的应用对象对所述目标验证集进行分组,得到多个子验证集,每个子验证集对应一个应用对象,包括:在根据所述第一模型评估指标和所述每个第一单变量拟合曲线,确定针对所述目标验证集所述目标广义线性模型可用的情况下,按照不同的应用对象对所述目标验证集进行分组,得到所述多个子验证集;所述基于所述每个子验证集,对所述目标广义线性模型进行评估,得到所述每个子验证集对应的第二模型评估指标,包括:基于所述每个子验证集,对所述目标广义线性模型进行评估,得到所述每个子验证集对应的第二模型评估指标和所述每个子验证集对应的至少一个第二单变量拟合曲线,每个第二单变量拟合曲线为对应的子验证集的一个特征变量的取值的拟合曲线;在根据所述每个子验证集对应的第二模型评估指标确定针对所述多个子验证集所述目标广义线性模型均可用的情况下,输出所述目标广义线性模型,包括:在根据所述每个子验证集对应的第二模型评估指标和所述每个子验证集对应的至少一个第二单变量拟合曲线,确定针对所述多个子验证集所述目标广义线性模型均可用的情况下,输出所述目标广义线性模型。3.根据权利要求2所述的方法,其特征在于,所述基于所述每个子验证集,对所述目标广义线性模型进行评估,得到所述每个子验证集对应的第二模型评估指标和所述每个子验证集对应的至少一个第二单变量拟合曲线之后,所述方法还包括:循环迭代执行下述步骤S1,直至在根据所述每个子验证集对应的第二模型评估指标和所述每个子验证集对应的至少一个第二单变量拟合曲线,确定针对所述多个子验证集所述
目标广义线性模型均可用的情况下,输出所述目标广义线性模型;其中,所述步骤S1包括:在根据所述每个子验证集对应的第二模型评估指标和所述每个子验证集对应的至少一个第二单变量拟合曲线,确定针对所述多个子验证集中的至少一个子验证集所述目标广义线性模型不可用的情况下,确定所述至少一个子验证集对应的至少一个目标特征变量中的待优化特征变量,每个目标特征变量为所述至少一个子验证集对应的特征变量中,第二单变量拟合曲线指示针对对应的子验证集所述目标广义线性模型不可用的特征变量;将所述待优化特征变量和不同应用对象标识进行交叉组合处理,生成新的特征变量,以更新所述目标训练集和所述目标验证集;将所述目标广义线性模型作为所述初始广义线性模型,返回执行基于所述目标训练集,训练初始广义线性模型,得到目标广义线性模型,以更新所述目标广义线性模型,直至得到所述每个子验证集对应的第二模型评估指标和所述每个子验证集对应的至少一个第二单变量拟合曲线。4.根据权利要求3所述的方法,其特征在于,所述待优化特征变量为所述至少一个子验证集对应的特征变量中,第二单变量拟合曲线指示针对对应的子验证集所述目标广义线性模型不可用的特征变量中,重要程度最大的特征变量。5.根据权利要求3所述的方法,其特征在于,所述方法还包括:在循环迭代执行所述步骤S1之后,确定至少一个第一特征变量的第二单变量拟合曲线指示针对对应的子验证集所述目标广义线性模型不可用;每个所述第一特征变量是通过至少一次执行所述步骤S1将第二特征变量进行优化,生成的所述新的特征变量;每个所述第一特征变量对应相同或不同的所述第二特征变量,所述第二特征变量为所述至少一个目标特征变量中的一个;所述至少一个子验证集对应的特征变量中,除所述至少一个第一特征变量之外的其他特征变量的第二单变量拟合曲线均指示针对对应的子验证集所述目标广义线性模型可用;...
【专利技术属性】
技术研发人员:请求不公布姓名,
申请(专利权)人:天云融创数据科技北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。