一种在搜索阶段无需训练的图像分类模型的构建方法技术

技术编号：38000509 阅读：13 留言：0更新日期：2023-06-30 10:14

本发明专利技术提供了一种在搜索阶段无需训练的图像分类模型的构建方法，包括：在模型结构的搜索阶段，执行步骤A1

全部详细技术资料下载

【技术实现步骤摘要】
一种在搜索阶段无需训练的图像分类模型的构建方法

[0001]本专利技术涉及自动化机器学习领域，具体来说涉及图像分类
，更具体地说，涉及一种在搜索阶段无需训练的图像分类模型的构建方法。

技术介绍

[0002]自动化机器学习要解决的问题是，针对特定的一类或若干类机器学习任务，在没有人类专家干预且计算资源有限的条件下，自动化地构建机器学习流程。研究方向包括：自动化特征提取、自动化模型选择、自动化模型参数调优、自动化模型结构搜索、自动化模型评估、元学习、迁移学习等。其中神经网络架构搜索作为其中一个关键的环节，旨在预定义好的搜索空间中通过自动化的技术搜索得到性能最优的网络结构。神经网络架构搜索得到的结构性能已经在多个任务中被验证可以超过人工设计的网络结构性能。因此，自动化设计网络结构受到研究者的广泛关注。
[0003]神经网络架构搜索的关键步骤是需要评估搜索空间中每个架构的性能。早期的方法需要单独训练每个架构至收敛，然后验证它们的性能，该过程要消耗大量的时间和资源，需要成百上千个GPU天数才可以完成搜索。后来，为了减少架构的性能评估时间，一种权重共享的技术被提出。权重共享，指在不同子网络之间共享相同操作的权重，这样就只需要训练一个超网络即可，不同的子网络就可以直接继承超网络的权重进行验证性能。具体而言，基于梯度训练的超网络引入架构参数，分别在训练集和验证集交替训练网络权重和架构参数，然后根据架构参数的大小评估候选架构的性能；另一方面，基于单路径采样训练的超网络在训练收敛之后，利用进化算法挑选大量子网络通过继承超网...

【技术保护点】

【技术特征摘要】
1.一种在搜索阶段无需训练的图像分类模型的构建方法，其特征在于，包括：在模型结构的搜索阶段，执行步骤A1
‑
A4：A1、从预设的搜索空间所包含的多个神经网络模型结构中采样出多个待选的模型结构；A2、对每个待选的模型结构，利用从图像分类数据集中提取的评价集中的每个图像样本分别在该待选的模型结构进行一次正向传播得到图像分类结果，并基于图像分类结果的分类损失求梯度并反向传播得到待选的模型结构下各图像样本对应的每个可训练的参数的梯度；A3、根据每个待选的模型结构下各图像样本对应的每个可训练的参数的梯度，确定每个待选的模型结构的信噪比代理指标，其中，所述信噪比代理指标与各图像样本对应的参数的梯度的均值的平方与参数的梯度的方差的比值正相关；A4、根据所有待选的模型结构的信噪比代理指标，从多个待选的模型结构选定目标网络模型；在训练阶段，根据从图像分类数据集中提取的训练集对目标网络模型进行图像分类训练，得到经训练的图像分类模型。2.根据权利要求1所述的方法，其特征在于，所述信噪比代理指标为评价集中各图像样本对应的参数的梯度的均值的平方与参数的梯度的方差的比值之和。3.根据权利要求1所述的方法，其特征在于，所述信噪比代理指标为评价集中各图像样本对应的参数的梯度的均值的平方与修正的参数的梯度的方差的比值之和，其中，修正的参数的梯度为该图像样本对应的参数的梯度的方差与预设的正则化值之和。4.根据权利要求3所述的方法，其特征在于，所述信噪比代理指标按照以下方式确定：其中，N表示评价集中的图像样本的总数，X
i
表示评价集中的第i个图像样本，Y
i
表示第i个图像样本的标签，θ
j
表示第j个参数，表示针对第i个图像样本计算出的参数θ
j
的梯度，表示第i个图像样本对应的参数的梯度的均值的平方，表示第i个图像样本对应的参数的梯度的方差，ξ表示预设的正则化值。5.根据权利要求1所述的方法，其特征在于，在模型结构的搜索阶段，针对每个待选...

【专利技术属性】
技术研发人员：孙自浩，胡瑜，
申请(专利权)人：中国科学院计算技术研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人