超参数的确定方法、装置、设备、存储介质以及计算机程序产品制造方法及图纸

技术编号:29836994 阅读:8 留言:0更新日期:2021-08-27 14:26
本公开提供了一种超参数的确定方法、装置、设备、存储介质以及计算机程序产品,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于智慧城市和智慧金融场景下。该方法的一具体实施方式包括:利用以下步骤进行迭代处理,直至满足迭代结束条件:确定候选超参数组;利用候选超参数组对模型进行训练,得到训练后的模型以及模型精度;基于候选超参数组与模型精度确定高斯过程函数;基于高斯过程函数确定新的候选超参数组;以及响应于满足迭代结束条件,从迭代过程产生的所有候选超参数组中确定目标超参数组。该实施方式无需手动调节超参数,省时省力,也提升了确定超参数的效率。

【技术实现步骤摘要】
超参数的确定方法、装置、设备、存储介质以及计算机程序产品
本公开涉及人工智能
,具体为计算机视觉和深度学习
,尤其涉及超参数的确定方法、装置、设备、存储介质以及计算机程序产品,可应用于智慧城市和智慧金融场景下。
技术介绍
随着计算机技术的发展,数据处理模型获得了广泛的应用。数据处理模型的超参数是指在开始学习过程之前设置的参数,而不是在训练过程中学习到的参数。超参数的选取直接影响着数据处理模型的性能。
技术实现思路
本公开实施例提出了一种超参数的确定方法、装置、设备、存储介质以及计算机程序产品。第一方面,本公开实施例提出了一种超参数的确定方法,包括:利用以下步骤进行迭代处理,直至满足迭代结束条件:确定候选超参数组;利用候选超参数组对模型进行训练,得到训练后的模型以及模型精度;基于候选超参数组与模型精度确定高斯过程函数;基于高斯过程函数确定新的候选超参数组;以及响应于满足迭代结束条件,从迭代过程产生的所有候选超参数组中确定目标超参数组。第二方面,本公开实施例提出了一种超参数的确定装置,包括:迭代模块,被配置成利用以下模块进行迭代处理,直至满足迭代结束条件;第一确定模块,被配置成确定候选超参数组;训练模块,被配置成利用候选超参数组对模型进行训练,得到训练后的模型以及模型精度;第二确定模块,被配置成基于候选超参数组与模型精度确定高斯过程函数;第三确定模块,被配置成基于高斯过程函数确定新的候选超参数组;第四确定模块,被配置成响应于满足迭代结束条件,从迭代过程产生的所有候选超参数组中确定目标超参数组。第三方面,本公开实施例提出了一种模型训练方法,包括:获取初始识别模型和训练样本集,其中,训练样本集中包括多个人脸图像样本;配置初始识别模型的超参数,其中,超参数通过第一方面中任一实现方式描述的方法确定;利用训练样本集对初始识别模型进行训练,得到训练完成的人脸识别模型。第四方面,本公开实施例提出了一种人脸识别方法,包括:获取待识别人脸图像;利用第三方面中任一实现方式得到的人脸识别模型对待识别人脸图像进行识别,得到人脸识别结果。第五方面,本公开实施例提出了一种模型训练装置,包括:第一获取模块,被配置成获取初始识别模型和训练样本集,其中,训练样本集中包括多个人脸图像样本;配置模块,被配置成配置初始识别模型的超参数,其中,超参数通过第一方面中任一实现方式描述的方法确定;得到模块,被配置成利用训练样本集对初始识别模型进行训练,得到训练完成的人脸识别模型。第六方面,本公开实施例提出了一种人脸识别装置,包括:第二获取模块,被配置成获取待识别人脸图像;识别模块,被配置成利用第五方面中任一实现方式得到的人脸识别模型对所述待识别人脸图像进行识别,得到人脸识别结果。第七方面,本公开实施例提出了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面中任一实现方式描述的方法。第八方面,本公开实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如第一方面中任一实现方式描述的方法。第九方面,本公开实施例提出了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如第一方面中任一实现方式描述的方法。应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显。附图用于更好地理解本方案,不构成对本公开的限定。其中:图1是本公开可以应用于其中的示例性系统架构图;图2是根据本公开的超参数的确定方法的一个实施例的流程图;图3是根据本公开的超参数的确定方法的另一个实施例的流程图;图4是根据本公开的超参数的确定方法的又一个实施例的流程图;图5是根据本公开的模型训练方法的一个实施例的流程图;图6是根据本公开的人脸识别方法的一个实施例的流程图;图7是根据本公开的超参数的确定装置的一个实施例的结构示意图;图8是根据本公开的模型训练装置的一个实施例的结构示意图;图9是根据本公开的人脸识别装置的一个实施例的结构示意图;图10是用来实现本公开实施例的超参数的确定方法的电子设备的框图。具体实施方式以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。图1示出了可以应用本公开的超参数的确定方法或超参数的确定装置的实施例的示例性系统架构100。如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种客户端应用。终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述电子设备中。其可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。服务器105可以提供各种服务。例如,服务器105可以对从终端设备101、102、103获取到的候选超参数组进行分析和处理,并生成处理结果(例如目标超参数组等)。需要说明的是,服务器105可以是硬件,也可以是软件。当服务器105为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器105为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。需要说明的是,本公开实施例所提供的超参数的确定方法一般由服务器105执行,相应地,超参数的确定装置一般设置于服务器105中。应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。继续参考图2,其示出了根据本公开的超参数的确定方法的一个实施例本文档来自技高网...

【技术保护点】
1.一种超参数的确定方法,包括:/n利用以下步骤进行迭代处理,直至满足迭代结束条件:/n确定候选超参数组;/n利用所述候选超参数组对模型进行训练,得到训练后的模型以及模型精度;/n基于所述候选超参数组与所述模型精度确定高斯过程函数;/n基于所述高斯过程函数确定新的候选超参数组;以及/n响应于满足迭代结束条件,从迭代过程产生的所有候选超参数组中确定目标超参数组。/n

【技术特征摘要】
1.一种超参数的确定方法,包括:
利用以下步骤进行迭代处理,直至满足迭代结束条件:
确定候选超参数组;
利用所述候选超参数组对模型进行训练,得到训练后的模型以及模型精度;
基于所述候选超参数组与所述模型精度确定高斯过程函数;
基于所述高斯过程函数确定新的候选超参数组;以及
响应于满足迭代结束条件,从迭代过程产生的所有候选超参数组中确定目标超参数组。


2.根据权利要求1所述的方法,其中,所述方法还包括:
定义超参数搜索空间;以及
所述确定候选超参数组,包括:
在所述超参数搜索空间中,通过随机初始化操作确定候选超参数组。


3.根据权利要求1或2所述的方法,其中,所述基于所述候选超参数组与所述模型精度确定高斯过程函数,包括:
将所述候选超参数组与所述模型精度输入至高斯过程中,对所述高斯过程的参数进行更新,得到高斯过程函数。


4.根据权利要求3所述的方法,其中,所述将所述候选超参数组与所述模型精度输入至高斯过程中,对所述高斯过程的参数进行更新,得到高斯过程函数,包括:
将所述候选超参数组与所述模型精度输入至高斯过程中,利用极大似然估计方法对所述候选超参数组与所述模型精度进行拟合;
基于拟合结果对所述高斯过程的参数进行更新,得到高斯过程函数。


5.根据权利要求1-4中任一项所述的方法,其中,所述基于所述高斯过程函数确定新的候选超参数组,包括:
利用最大值自变量点集函数对所述高斯过程函数进行求解,得到新的候选超参数组的采样点;
基于所述采样点确定所述新的候选超参数组。


6.根据权利要求1-5中任一项所述的方法,其中,所述从迭代过程产生的所有候选超参数组中确定目标超参数组,包括:
基于迭代过程产生的所有候选超参数组对应的模型精度,从所述所有候选超参数组中确定目标超参数组。


7.一种模型训练方法,包括:
获取初始识别模型和训练样本集,其中,所述训练样本集中包括多个人脸图像样本;
配置所述初始识别模型的超参数,其中,所述超参数通过如权利要求1-6中任一项所述的方法确定;
利用所述训练样本集对所述初始识别模型进行训练,得到训练完成的人脸识别模型。


8.一种人脸识别方法,包括:
获取待识别人脸图像;
利用如权利要求7所述的人脸识别模型对所述待识别人脸图像进行识别,得到人脸识别结果。


9.一种超参数的确定装置,包括:
迭代模块,被配置成利用以下模块进行迭代处理,直至满足迭代结束条件;
第一确定模块,被配置成确定候选超参数组;
训练模块,被配置成利用所述候选超参数组对模型进行训练,得到训练后的模型以及模型精度;
第二确定模块,被配置成基于所述候选超参数组与所述模型精度确定高斯过程函数;
第三确定模块,被配置成基于所述高斯过...

【专利技术属性】
技术研发人员:杨馥魁
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1