一种深度学习模型的选择方法、装置及设备制造方法及图纸

技术编号：35747978 阅读：24 留言：0更新日期：2022-11-26 18:53

本发明专利技术公开一种深度学习模型的选择方法，其对不同深度学习模型进行训练、验证及测试，对测试结果进行比较，选取符合预设条件的深度学习模型，其中，不同深度学习模型的训练、验证及测试均通过同一个执行器实现：首先通过执行器根据给定的深度学习算法构建所需的模块：模型、数据集、训练循环控制器、验证循环控制器、测试循环控制器以及钩子，然后根据预设的逻辑，调用训练循环控制器、验证循环控制器、或测试循环控制器以进行模型训练、验证或测试。由于无需针对不同深度学习算法开发专门的流程，而是通过调用相应的模块即可方便地实现多种深度学习算法，因此可以方便地比较不同算法的优劣，进而确定最合适的模型。进而确定最合适的模型。进而确定最合适的模型。

全部详细技术资料下载

【技术实现步骤摘要】
一种深度学习模型的选择方法、装置及设备

[0001]本专利技术涉及计算机视觉
，特别涉及一种深度学习模型的选择方法、装置及设备。

技术介绍

[0002]基于深度学习框架进行模型训练、验证、测试时通常需要以下步骤：深度学习环境初始化、数据集读取、模型初始化、模型权重加载、优化器和参数调度器构建、在数据集上执行训练、验证、测试等循环。在实际应用中，不同的数据输入所采用的最优算法往往不同，因此，为了获取最优模型，通常需要对不同深度学习算法进行训练、验证及测试。
[0003]目前不同的深度学习算法往往都需要实现一套不同的训练、验证、测试流程，而没有统一的实现，导致不同深度学习算法库的代码中存在许多冗余。用户在使用多个深度学习算法的过程中也会遇到不同算法训练流程不同的障碍。

技术实现思路

[0004]针对现有技术中的部分或全部问题，本专利技术一方面提供一种深度学习模型的选择方法，包括：对不同深度学习模型进行训练、验证及测试，对测试结果进行比较，选取符合预设条件的深度学习模型，其中，所述不同深度学习模型的训练、验证及测试均通过同一个执行器实现，且任一深度学习模型的训练、验证及测试包括：
[0005]通过所述执行器根据给定的深度学习算法构建所需的模块，所述模块包括：模型、数据集、训练循环控制器、验证循环控制器、测试循环控制器以及钩子；以及
[0006]根据预设的逻辑，调用所述训练循环控制器、验证循环控制器、或测试循环控制器以进行模型训练、验证或测试。
[0007]进一步地，所述...

【技术保护点】

【技术特征摘要】
1.一种深度学习模型的选择方法，其特征在于，包括步骤：对不同深度学习模型进行训练、验证及测试，对测试结果进行比较，选取符合预设条件的深度学习模型，其中，所述不同深度学习模型的训练、验证及测试均通过同一个执行器实现，且任一深度学习模型的训练、验证及测试包括步骤：通过所述执行器根据给定的深度学习算法构建所需的模块，所述模块包括：模型、数据集、训练循环控制器、验证循环控制器、测试循环控制器以及钩子；以及根据预设的逻辑，调用所述训练循环控制器、验证循环控制器、或测试循环控制器以进行模型训练、验证或测试。2.如权利要求1所述的选择方法，其特征在于，所述模型训练包括：按预设的最大迭代轮次在数据集上反复迭代，并进行模型的前向推理和反向传播以及优化。3.如权利要求1所述的选择方法，其特征在于，所述验证包括：在预设时刻，对训练完成的模型进行验证，并输出验证集上的评价指标，所述执行器根据所述评价指标，在下一迭代轮次训练前对深度学习训练的超参数进行调整。4.如权利要求1所述的选择方法，其特征在于，所述测试包括：在预设时刻，对训练完成的模型进行测试，并输出测试集上的评价指标。5.如权利要求1所述的选择方法，其特征在于，还包括，通过所述钩子查询、修改或调用对应步骤的输入或输出参数，其中所述钩子设置于以下一个或多个步骤的前后：模块构建、训练、验证、测试、任一训练轮次、任一训练迭代、任一验证轮次、任一验证迭代、任一测试轮次、以及任一测试迭代。6.如权利要求1所述的选择方法，...

【专利技术属性】
技术研发人员：吕成器，周再达，叶浩晨，张文蔚，陈恺，
申请(专利权)人：上海人工智能创新中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人