深度学习模型的超参数确定方法、装置、设备和存储介质制造方法及图纸

技术编号:33289710 阅读:66 留言:0更新日期:2022-05-01 00:05
本申请公开了深度学习模型的超参数确定方法、装置、设备和存储介质,本申请先获取若干个超参数组,给目标模型配置不同的超参数组,再通过商品检索结果等训练数据以及测试数据分别对配置不同超参数组的目标模型进行训练和评估,每轮训练完后,存储该轮训练任务中的超参数组、超参数组的评估值以及最优的训练模型,然后对存储的超参数组进行优化,以选取下一轮训练任务所需要的超参数组,通过这样不断训练得到效果更加好的超参数组,当训练次数或训练时长达到预设值时则输出最优的训练模型及其对应的超参数组,以确定超参数组,从而解决了目前还没有效果较优的,用于商品检索结果排序深度学习模型超参数确定方法的技术问题。排序深度学习模型超参数确定方法的技术问题。排序深度学习模型超参数确定方法的技术问题。

【技术实现步骤摘要】
深度学习模型的超参数确定方法、装置、设备和存储介质


[0001]本申请涉及深度学习
,尤其涉及深度学习模型的超参数确定方法、装置、设备和存储介质。

技术介绍

[0002]随着电子商务的快速发展,电子商务平台上同类商品的数量庞大,仅仅依靠商品检索系统无法满足用户个性化的需求,所以基于商品检索结果排序的深度学习模型被用于电商平台中。由于不同地区的消费水平、购物习惯以及在售商品的不同,电商平台需要为每个地区定制不同的深度学习模型。一个好的深度学习模型需要平衡预测准确性、实时性和训练时长,而这些都与超参数的配置直接相关。
[0003]为了使每个深度学习模型都表现优异,需要为每个深度学习模型配置最适合的超参数。然而,通过人工为深度学习模型配置超参数会耗费大量的时间和人力。因此,自动超参数优化被提出,旨在没有人工参与下对超参数进行配置。
[0004]目前还没有效果较优的,用于商品检索结果排序的深度学习模型超参数确定方法。

技术实现思路

[0005]本申请提供了深度学习模型的超参数确定方法、装置、设备和存储介质,用于解决本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种深度学习模型的超参数确定方法,其特征在于,包括:S101、获取待训练的模型数据,所述模型数据包括目标模型、训练数据和测试数据;S102、获取若干个超参数组;S103、通过若干个分布式集群子节点,基于所述超参数组、所述训练数据和所述测试数据对所述目标模型进行训练和评估,得到若干个训练模型和超参数组的评估值;S104、存储所述超参数组和所述超参数组的评估值,并从若干个所述训练模型中存储最优的训练模型;S105、对存储的所述超参数组进行优化,并选取新的超参数组作为下一轮训练的超参数组;S106、重复执行步骤S102至S105,当训练次数或训练时长达到预设值时,输出最优的训练模型及其对应的超参数组。2.根据权利要求1所述的深度学习模型的超参数确定方法,其特征在于,所述对存储的所述超参数组进行优化,并选取新的超参数组作为下一轮训练的超参数组,包括:选取评估值较优的两组超参数组;在采样空间中划分出正采样区域;以第一预置概率在所述正采样区域进行采样,以第二预置概率在全局采样区域进行采样,以选取新的超参数组作为下一轮训练的超参数组。3.根据权利要求2所述的深度学习模型的超参数确定方法,其特征在于,所述在采样空间中划分出正采样区域,包括:对两组超参数组进行分类得到数值类型超参数和类别类型超参数;以所述数值类型超参数为边缘勾画轴平行框,所述轴平行框所涵盖的区域为所述数值类型超参数的正采样区域;将所述类别类型超参数作为所述类别类型超参数的正采样区域。4.根据权利要求2所述的深度学习模型的超参数确定方法,其特征在于,所述第一预置概率大于所述第二预置概率。5.根据权利要求1所述的深度学习模型的超参数确定方法,其特征在于,所述获取若干个超参...

【专利技术属性】
技术研发人员:吴悦悦徐恒张振
申请(专利权)人:南京希音电子商务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1