决策模型训练方法、装置、存储介质及电子设备制造方法及图纸

技术编号:36805958 阅读:10 留言:0更新日期:2023-03-09 00:14
本说明书实施例公开了一种决策模型训练方法、装置、存储介质及电子设备,通过训练数据对决策模型得到的预设收益进行重演,从而对决策模型的所有超参数进行联合优化,进一步通过不断更新的预测收益进行评估,朝着预测收益满足预设条件的方向对决策模型中的多个超参数进行迭代优化,最终在预测收益满足预设条件的情况下得到决策模型的超参数分布,完成对决策模型的训练。模型的训练。模型的训练。

【技术实现步骤摘要】
决策模型训练方法、装置、存储介质及电子设备


[0001]本说明书涉及人工智能
,尤其涉及一种决策模型训练方法、装置、存储介质及电子设备。

技术介绍

[0002]决策模型是用于经营决策的数学模型。在现代化的科学决策中,常常借助于自然科学的方法,运用数学的工具,建立各决策变量之间的关系公式与模型,用以解决复杂的决策问题。超参数(Hyper Parameter)是训练各式模型的过程中,用于控制模型结构、性能以及训练效率的参数,且是在模型开始学习过程之前设置值的参数,而不是通过训练得到的参数数据,在模型训练过程中起着重要作用。例如,在信贷领域中,在贷前、贷中、贷后都涉及到信贷决策过程,决策的最终目标一般围绕着风险最小化、收益最大化等,基于此,信贷决策系统会构建复杂的信贷决策模型以获得更好的决策目标,故信贷决策模型中往往都会存在大量的超参数。通常情况下,在训练决策模型前,开发人员会根据经验设置初始超参数,并在决策模型训练过程中,根据决策模型的实际训练情况,根据经验手动调整超参数,以提高决策模型的训练效率和质量。

技术实现思路

[0003]本说明书实施例提供了一种决策模型训练方法、装置、存储介质及电子设备,可以实现在决策模型的训练过程中针对超参数进行联合训练,提高训练效率。所述技术方案如下:
[0004]第一方面,本说明书实施例提供了一种决策模型训练方法,所述方法包括:
[0005]将训练数据输入至决策模型中,得到所述训练数据对应的预测收益;
[0006]根据所述预测收益同时调整所述决策模型中的多个超参数,以更新所述决策模型;
[0007]将所述训练数据输入至更新后的所述决策模型,得到更新后的预测收益,并再次执行所述根据所述预测收益同时调整所述决策模型中的多个超参数的步骤,直至更新后的预测收益满足预设条件时,所述决策模型训练完成。
[0008]第二方面,本说明书实施例提供了一种决策模型训练装置,所述装置包括:
[0009]预设收益模块,用于将训练数据输入至决策模型中,得到所述训练数据对应的预测收益;
[0010]更新模型模块,用于根据所述预测收益同时调整所述决策模型中的多个超参数,以更新所述决策模型;
[0011]训练完成模块,用于将所述训练数据输入至更新后的所述决策模型,得到更新后的预测收益,并再次执行所述根据所述预测收益同时调整所述决策模型中的多个超参数的步骤,直至更新后的预测收益满足预设条件时,所述决策模型训练完成。
[0012]第三方面,本说明书实施例提供一种计算机存储介质,所述计算机存储介质存储
有多条指令,所述指令适于由处理器加载并执行上述的方法步骤。
[0013]第四方面,本说明书实施例提供一种电子设备,可包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行上述的方法步骤。
[0014]本说明书一些实施例提供的技术方案带来的有益效果至少包括:
[0015]本说明书通过训练数据对决策模型得到的预设收益进行重演,从而对决策模型的所有超参数进行联合优化,可以解决相关技术中对多个超参数进行分别优化时,多个超参数之间的依赖性问题,进一步通过不断更新的预测收益进行评估,朝着预测收益满足预设条件的方向对决策模型中的多个超参数进行迭代优化,最终在预测收益满足预设条件的情况下得到决策模型的超参数分布,完成对决策模型的训练,训练效率较高且训练效果较好。
附图说明
[0016]为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0017]图1是本说明书实施例提供的一种决策模型工作的流程示意图;
[0018]图2是本说明书实施例提供的一种决策模型训练方法的流程示意图;
[0019]图3是本说明书实施例提供的一种为线上决策模型配置多个超参数的结构示意图;
[0020]图4是本说明书实施例提供的一种贝叶斯参数优化方法的流程示意图;
[0021]图5是本说明书实施例提供的一种决策模型训练方法的流程示意图;
[0022]图6是本说明书实施例提供的一种多个历史分布曲线的示意图;
[0023]图7是本说明书实施例提供一种决策模型训练装置的结构示意图;
[0024]图8是本说明书实施例提供的一种电子设备的结构示意图。
具体实施方式
[0025]下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
[0026]在本说明书的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本说明书的描述中,需要说明的是,除非另有明确的规定和限定,“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本说明书中的具体含义。此外,在本说明书的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表
示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
[0027]下面结合具体的实施例对本说明书进行详细说明。
[0028]决策模型是用于经营决策的数学模型。在现代化的科学决策中,常常借助于自然科学的方法,运用数学的工具,建立各决策变量之间的关系公式与模型,用以解决复杂的决策问题。超参数(Hyper Parameter)是训练各式模型的过程中,用于控制模型结构、性能以及训练效率的参数,且是在模型开始学习过程之前设置值的参数,而不是通过训练得到的参数数据,在模型训练过程中起着重要作用。
[0029]以决策模型为信贷决策模型为例,在信贷领域中,在贷前、贷中、贷后都涉及到信贷决策过程,如贷前授信审批过程、贷前机构决策过程、贷前提额申请审批过程、贷中支用审批过程等,信贷决策模型做出决策的最终目标一般围绕着风险最小化、收益最大化等,基于此,信贷决策系统会构建复杂的信贷决策模型以获得更好的决策,故信贷决策模型中往往都会存在大量的超参数。
[0030]如图1所示,为本说明书实施例提供的一种决策模型工作的流程示意图,包括:训练数据101、决策模型102、决策103和收益104,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种决策模型训练方法,所述方法包括:将训练数据输入至决策模型中,得到所述训练数据对应的预测收益;根据所述预测收益同时调整所述决策模型中的多个超参数,以更新所述决策模型;将所述训练数据输入至更新后的所述决策模型,得到更新后的预测收益,并再次执行所述根据所述预测收益同时调整所述决策模型中的多个超参数的步骤,直至更新后的预测收益满足预设条件时,所述决策模型训练完成。2.根据权利要求1所述的训练方法,所述根据所述预测收益同时调整所述决策模型中的多个超参数,包括:根据所述预测收益和所述训练数据对应的历史收益之间的变化趋势,同时调整所述决策模型中的多个超参数。3.根据权利要求2所述的训练方法,所述将所述训练数据输入至更新后的所述决策模型,得到更新后的预测收益,并再次执行所述根据所述预测收益同时调整所述决策模型中的多个超参数的步骤,包括:将所述训练数据输入至更新后的所述决策模型,得到更新后的预测收益;根据更新前的预测收益、更新后的预测收益以及历史收益之间的变化趋势,同时调整所述决策模型中的多个超参数。4.根据权利要求1所述的训练方法,所述根据所述预测收益同时调整所述决策模型中的多个超参数,包括:获取训练前的决策模型中的多个超参数对应的分布曲线;根据所述预测收益,同时调整满足所述分布曲线的多个超参数分别对应的数值。5.根据权利要求1所述的训练方法,所述根据所述预测收益同时调整所述决策模型中的多个超参数,包括:获取训练集中多个历史决策模型分别对应的历史分布曲线,其中,每个所述历史决策模型对应的历史分布曲线为所述历史决策模型中的多个超参数对应的分布曲线;根据所述预测收益为所述决策模型的多个超参数匹配所述多个历史分布曲线中的目标分布曲线;根据所述目标分布曲线同时调整所述决策模型中的多个超参数。6.根据权利要求5所述的训练方法,所述根据所述预测收益为所述决策模型的多个超参数匹配所述多个历史分布曲线中的目标分布曲线,包括:分别获取将所述训练数据输入至每个所述历史决策模型后得到的训练收益;根据每个所述训练收益和所述预测收益之间的关联关系,为所述决策模型的多个超参数匹配所述多个历史分布曲线中的目标分布曲线。7.根据权利要求1所述的训练方法,所述根据所述预测收益同时调整所述决策模型中的多个超参数,以更新所述决策模型,包括:根据预测收益和优化算法,调整所述决策模型中的多个超参数的分布曲线以及所述多个超参数分别对应的数值;其中,所述优化算法至少包括下述的一种或多种:贝叶斯优化算法、随机搜索算法、...

【专利技术属性】
技术研发人员:熊永福凌永强赵鹏
申请(专利权)人:重庆蚂蚁消费金融有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1