模型训练方法、系统、芯片、电子设备及介质技术方案

技术编号：24252337 阅读：38 留言：0更新日期：2020-05-22 23:58

模型训练方法、系统、芯片、电子设备及介质，方法为：在预设的基础神经网络上训练一组模型，选出在验证集上性能最好的模型T0；在T0上进行优化然后获得若干备选实验配置，对所述若干备选实验配置训练并获得其中性能最优的模型T1’；对T1’重新训练，确保重新训练的性能结果的平均值大于T0的性能；即得到最优的模型配置。本发明专利技术能将训练出来的模型自动转换为caffe或TF pb或其他常用模型格式，并且自动验证是否能在相应希望部署的硬件平台上部署的方法，并能够自动做一些优化。

Model training methods, systems, chips, electronic devices and media

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、系统、芯片、电子设备及介质
本专利技术涉及计算机数据处理系统和方法，具体地说是一种模型训练方法、系统、芯片、电子设备及介质。
技术介绍
目前现有的人工智能（AI）研发系统的实质是提供软件的数据库，使用上需要用户有一定编程背景；若要获得好的计算模型，则需要用户自己进行参数调整和选择，因而还需有相关深度学习优化知识。同时，现有的人工智能（AI）研发系统一般只能支持单一用户单一任务，而在多用户情况下只能手动分配各种资源，计算资源利用率差。而在人工智能（AI）研发系统中，现有的训练工具一般只支持将在数据输入后，单纯地通过预设的模型进行训练，在面对新任务的时候往往效果不佳。而若需对模型进行优化，则也需要有相关模型优化的知识，并且手动设计并编程实现优化——使得其用户范围较窄。而现有的其他自动模型优化算法，一般通过RNN等方法自动设计网络模型，这种方法过程较慢、可并行性差，同时必须要大量数据；对于数据量中等、计算资源较小的情形缺并不适用。此外，应用系统部署和运行在云平台上来对外提供服务。目前在模型部署环节，针对部署的环境和目标格式，需要手动编写转换代码进行转换；并且不能验证是否失败，需要手动编写测试脚本测试，十分繁琐，切要耗费大量时间。
技术实现思路
本专利技术针对上述人工智能研发系统的不足，旨在提供一种适用于模型优化部署系统的模型训练方法、系统、芯片、电子设备及介质，以解决现有问题。为了达到上述目的，本专利技术提供一种模型优化部署系统，包括：数据预处理模块，接受回

【技术保护点】
1.一种模型训练方法，其特征在于包括：/nS1，在预设的基础神经网络上训练一组模型，选出在验证集上性能最好的模型T0；/nS2,在T0上进行优化获得若干备选实验配置，对所述若干备选实验配置训练并获得其中性能最优的模型T1’；/nS3,对T1’重新训练，确保重新训练的性能结果的平均值大于T0的性能，得到最优的模型配置。/n

【技术特征摘要】
1.一种模型训练方法，其特征在于包括：
S1，在预设的基础神经网络上训练一组模型，选出在验证集上性能最好的模型T0；
S2,在T0上进行优化获得若干备选实验配置，对所述若干备选实验配置训练并获得其中性能最优的模型T1’；
S3,对T1’重新训练，确保重新训练的性能结果的平均值大于T0的性能，得到最优的模型配置。

2.根据权利要求1所述的模型训练方法，其特征在于：S2中，所述在T0上进行优化的方法为调整参数。

3.根据权利要求2所述的模型训练方法，其特征在于：所述参数包括以下之一或组合：模型宽度，学习速率，优化策略，是否使用数据增强，数据增强的参数，网络单位模块。

4.根据权利要求1-3任一所述的模型训练方法，其特征在于：S3对T1’的重新训练中，如果重新训练的性能结果大于T0的性能结果，则替代T0作为新的备选实验配置。

5.根据权利要求4所述的模型训练方法，其特征在于：所述迭代优化的过程反复循环进行，直至性能最优时停止。

【专利技术属性】
技术研发人员：王益县，章子誉，
申请(专利权)人：上海依图网络科技有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人