银行领域的广义线性模型训练方法、装置、设备和介质制造方法及图纸

技术编号:39255986 阅读:12 留言:0更新日期:2023-10-30 12:07
本申请涉及一种银行领域的广义线性模型训练方法、装置、设备和介质,该方法包括:对包含多个应用对象的数据进行处理,获得目标训练集和目标验证集;基于目标训练集,训练初始广义线性模型得到目标广义线性模型;基于目标验证集对目标广义线性模型进行评估,得到目标验证集对应的第一模型评估指标;在根据第一模型评估指标确定针对目标验证集目标广义线性模型可用的情况下,按照不同的应用对象对目标验证集进行分组,得到多个子验证集;基于每个子验证集对目标广义线性模型进行评估得到每个子验证集对应的第二模型评估指标;在根据每个子验证集对应的第二模型评估指标确定针对多个子验证集目标广义线性模型均可用的情况下输出目标广义线性模型。输出目标广义线性模型。输出目标广义线性模型。

【技术实现步骤摘要】
银行领域的广义线性模型训练方法、装置、设备和介质


[0001]本申请涉及计算机
,尤其涉及一种银行领域的广义线性模型训练方法、装置、电子设备和存储介质。

技术介绍

[0002]目前,在结构化数据的业务场景中,传统的业务模型,针对同一业务场景但应用对象不同的情况,一般有两种解决方法:一种是构建一个模型直接应用于不同的对象,一种是针对不同应用对象构建不同的模型。针对第一种方法,构建的模型数量少,花费时间少,模型上线管理简单,但是由于不同应用对象其数据分布差距比较大,构建一个模型直接应用于不同的对象,当分应用对象看模型效果时,模型效果一般较差;针对第二种方法,针对不同应用对象构建不同的模型,分应用对象看模型效果时,模型效果一般较第一种方法好,但是构建的模型数量多,耗费大量的人工,模型上线管理复杂,另外会割裂不同应用对象之间的联系。
[0003]如此,亟需一种可以模型管理简单,且针对多应用对象整体和分应用对象模型效果都较好的模型。

技术实现思路

[0004]本申请提供了一种银行领域的广义线性模型训练方法、装置、电子设备和存储介质,能够提高模型管理效率,且构建的模型针对多应用对象整体和单应用对象模型效果都较好。
[0005]第一方面,本申请提供了一种银行领域的广义线性模型训练方法,包括:对包含多个应用对象的数据进行处理,获得包括至少一个特征变量的目标训练集和目标验证集;基于该目标训练集,训练初始广义线性模型,得到目标广义线性模型;基于该目标验证集,对该目标广义线性模型进行评估,得到该目标验证集对应的第一模型评估指标;在根据第一模型评估指标确定针对该目标验证集该目标广义线性模型可用的情况下,按照不同的应用对象对该目标验证集进行分组,得到多个子验证集,每个子验证集对应一个应用对象;基于该每个子验证集,对该目标广义线性模型进行评估,得到该每个子验证集对应的第二模型评估指标;在根据该每个子验证集对应的第二模型评估指标确定针对该多个子验证集该目标广义线性模型均可用的情况下,输出该目标广义线性模型。
[0006]第二方面,本申请提供了一种银行领域的广义线性模型训练装置,包括:数据处理模块,用于对包含多个应用对象的数据进行处理,获得包括至少一个特征变量的目标训练集和目标验证集;模型训练模块,用于基于该目标训练集,训练初始广义线性模型,得到目标广义线性模型;模型评估模块,用于基于该目标验证集,对该目标广义线性模型进行评估,得到该目标验证集对应的第一模型评估指标;数据处理模块,还用于在根据第一模型评估指标确定针对该目标验证集该目标广义线性模型可用的情况下,按照不同的应用对象对该目标验证集进行分组,得到多个子验证集,每个子验证集对应一个应用对象;模型评估模
块,还用于基于该每个子验证集,对该目标广义线性模型进行评估,得到该每个子验证集对应的第二模型评估指标;模型输出模块,用于在根据该每个子验证集对应的第二模型评估指标确定针对该多个子验证集该目标广义线性模型均可用的情况下,输出该目标广义线性模型。
[0007]第三方面,本申请提供了一种电子设备,包括:处理器,所述处理器用于执行存储于存储器的计算机程序,所述计算机程序被处理器执行时实现第一方面提供的任一种银行领域的广义线性模型训练方法的步骤。
[0008]第四方面,本申请提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面提供的任一种银行领域的广义线性模型训练方法的步骤。
[0009]本申请实施例的第五方面,提供一种计算机程序产品,其中,该计算机程序产品包括计算机程序或指令,当该计算机程序产品在处理器上运行时,使得处理器执行该计算机程序或指令,实现如第一方面所述的银行领域的广义线性模型训练方法的步骤。
[0010]本申请实施例的第六方面,提供了一种芯片,该芯片包括处理器、存储器和通信接口,该通信接口和该处理器耦合,该存储器用于存储可在该处理器上运行的程序或指令,该处理器用于执行该程序或指令,实现如第一方面所述的银行领域的广义线性模型训练方法的步骤。
[0011]本申请实施例提供的技术方案与现有技术相比具有如下优点:本申请实施例中,通过对包含多个应用对象的数据进行处理,获得包括至少一个特征变量的目标训练集和目标验证集;基于该目标训练集,训练初始广义线性模型,得到目标广义线性模型;基于该目标验证集,对该目标广义线性模型进行评估,得到该目标验证集对应的第一模型评估指标;在根据第一模型评估指标确定针对该目标验证集该目标广义线性模型可用的情况下,按照不同的应用对象对该目标验证集进行分组,得到多个子验证集(每个子验证集对应一个应用对象);基于该每个子验证集,对该目标广义线性模型进行评估,得到该每个子验证集对应的第二模型评估指标;在根据该每个子验证集对应的第二模型评估指标确定针对该多个子验证集该目标广义线性模型均可用的情况下,输出该目标广义线性模型。如此,本申请实施例得到的目标广义线性模型是针对包括多个应用对象的该目标验证集可用的模型,且是针对每个应用对象对应的子验证集可用的模型,也就是说,针对多应用对象整体和分应用对象模型效果都较好,而且构建的模型数量少,花费时间少,模型上线管理简单。
附图说明
[0012]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
[0013]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0014]图1为本申请提供的一种银行领域的广义线性模型训练方法的流程示意图;
[0015]图2为本申请提供的另一种银行领域的广义线性模型训练方法的流程示意图;
[0016]图3为本申请提供的一种训练集和验证集的时间段划分示意图;
[0017]图4为本申请提供的一种单变量拟合曲线的示意图;
[0018]图5为本申请提供的另一种单变量拟合曲线的示意图;
[0019]图6为本申请提供的又一种单变量拟合曲线的示意图;
[0020]图7为本申请提供的又一种单变量拟合曲线的示意图;
[0021]图8为本申请提供的又一种单变量拟合曲线的示意图;
[0022]图9为本申请提供的又一种单变量拟合曲线的示意图;
[0023]图10为本申请提供的又一种单变量拟合曲线的示意图;
[0024]图11为本申请提供的又一种单变量拟合曲线的示意图;
[0025]图12为本申请提供的又一种单变量拟合曲线的示意图;
[0026]图13为本申请提供的再一种单变量拟合曲线的示意图;
[0027]图14为本申请提供的一种银行领域的广义线性模型训练装置的结构示意图;
[0028]图15为本申请提供的一种电子设备的硬件结构示意图。
具体实施方式
[0029]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种银行领域的广义线性模型训练方法,其特征在于,所述方法包括:对包含多个应用对象的数据进行处理,获得包括至少一个特征变量的目标训练集和目标验证集;基于所述目标训练集,训练初始广义线性模型,得到目标广义线性模型;基于所述目标验证集,对所述目标广义线性模型进行评估,得到所述目标验证集对应的第一模型评估指标;在根据所述第一模型评估指标确定针对所述目标验证集所述目标广义线性模型可用的情况下,按照不同的应用对象对所述目标验证集进行分组,得到多个子验证集,每个子验证集对应一个应用对象;基于所述每个子验证集,对所述目标广义线性模型进行评估,得到所述每个子验证集对应的第二模型评估指标;在根据所述每个子验证集对应的第二模型评估指标确定针对所述多个子验证集所述目标广义线性模型均可用的情况下,输出所述目标广义线性模型。2.根据权利要求1所述的方法,其特征在于,所述基于所述目标验证集,对所述目标广义线性模型进行评估,得到所述目标验证集对应的第一模型评估指标,包括:基于所述目标验证集,对所述目标广义线性模型进行评估,得到所述第一模型评估指标和所述目标验证集对应的至少一个第一单变量拟合曲线,每个第一单变量拟合曲线为所述目标验证集的一个特征变量的取值的拟合曲线;所述在根据所述第一模型评估指标确定针对所述目标验证集所述目标广义线性模型可用的情况下,按照不同的应用对象对所述目标验证集进行分组,得到多个子验证集,每个子验证集对应一个应用对象,包括:在根据所述第一模型评估指标和所述每个第一单变量拟合曲线,确定针对所述目标验证集所述目标广义线性模型可用的情况下,按照不同的应用对象对所述目标验证集进行分组,得到所述多个子验证集;所述基于所述每个子验证集,对所述目标广义线性模型进行评估,得到所述每个子验证集对应的第二模型评估指标,包括:基于所述每个子验证集,对所述目标广义线性模型进行评估,得到所述每个子验证集对应的第二模型评估指标和所述每个子验证集对应的至少一个第二单变量拟合曲线,每个第二单变量拟合曲线为对应的子验证集的一个特征变量的取值的拟合曲线;在根据所述每个子验证集对应的第二模型评估指标确定针对所述多个子验证集所述目标广义线性模型均可用的情况下,输出所述目标广义线性模型,包括:在根据所述每个子验证集对应的第二模型评估指标和所述每个子验证集对应的至少一个第二单变量拟合曲线,确定针对所述多个子验证集所述目标广义线性模型均可用的情况下,输出所述目标广义线性模型。3.根据权利要求2所述的方法,其特征在于,所述基于所述每个子验证集,对所述目标广义线性模型进行评估,得到所述每个子验证集对应的第二模型评估指标和所述每个子验证集对应的至少一个第二单变量拟合曲线之后,所述方法还包括:循环迭代执行下述步骤S1,直至在根据所述每个子验证集对应的第二模型评估指标和所述每个子验证集对应的至少一个第二单变量拟合曲线,确定针对所述多个子验证集所述
目标广义线性模型均可用的情况下,输出所述目标广义线性模型;其中,所述步骤S1包括:在根据所述每个子验证集对应的第二模型评估指标和所述每个子验证集对应的至少一个第二单变量拟合曲线,确定针对所述多个子验证集中的至少一个子验证集所述目标广义线性模型不可用的情况下,确定所述至少一个子验证集对应的至少一个目标特征变量中的待优化特征变量,每个目标特征变量为所述至少一个子验证集对应的特征变量中,第二单变量拟合曲线指示针对对应的子验证集所述目标广义线性模型不可用的特征变量;将所述待优化特征变量和不同应用对象标识进行交叉组合处理,生成新的特征变量,以更新所述目标训练集和所述目标验证集;将所述目标广义线性模型作为所述初始广义线性模型,返回执行基于所述目标训练集,训练初始广义线性模型,得到目标广义线性模型,以更新所述目标广义线性模型,直至得到所述每个子验证集对应的第二模型评估指标和所述每个子验证集对应的至少一个第二单变量拟合曲线。4.根据权利要求3所述的方法,其特征在于,所述待优化特征变量为所述至少一个子验证集对应的特征变量中,第二单变量拟合曲线指示针对对应的子验证集所述目标广义线性模型不可用的特征变量中,重要程度最大的特征变量。5.根据权利要求3所述的方法,其特征在于,所述方法还包括:在循环迭代执行所述步骤S1之后,确定至少一个第一特征变量的第二单变量拟合曲线指示针对对应的子验证集所述目标广义线性模型不可用;每个所述第一特征变量是通过至少一次执行所述步骤S1将第二特征变量进行优化,生成的所述新的特征变量;每个所述第一特征变量对应相同或不同的所述第二特征变量,所述第二特征变量为所述至少一个目标特征变量中的一个;所述至少一个子验证集对应的特征变量中,除所述至少一个第一特征变量之外的其他特征变量的第二单变量拟合曲线均指示针对对应的子验证集所述目标广义线性模型可用;...

【专利技术属性】
技术研发人员:请求不公布姓名
申请(专利权)人:天云融创数据科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1