【技术实现步骤摘要】
模型训练方法、系统、芯片、电子设备及介质
本专利技术涉及计算机数据处理系统和方法,具体地说是一种模型训练方法、系统、芯片、电子设备及介质。
技术介绍
目前现有的人工智能(AI)研发系统的实质是提供软件的数据库,使用上需要用户有一定编程背景;若要获得好的计算模型,则需要用户自己进行参数调整和选择,因而还需有相关深度学习优化知识。同时,现有的人工智能(AI)研发系统一般只能支持单一用户单一任务,而在多用户情况下只能手动分配各种资源,计算资源利用率差。而在人工智能(AI)研发系统中,现有的训练工具一般只支持将在数据输入后,单纯地通过预设的模型进行训练,在面对新任务的时候往往效果不佳。而若需对模型进行优化,则也需要有相关模型优化的知识,并且手动设计并编程实现优化——使得其用户范围较窄。而现有的其他自动模型优化算法,一般通过RNN等方法自动设计网络模型,这种方法过程较慢、可并行性差,同时必须要大量数据;对于数据量中等、计算资源较小的情形缺并不适用。此外,应用系统部署和运行在云平台上来对外提供服务。目前在模型部署环节,针 ...
【技术保护点】
1.一种模型训练方法,其特征在于包括:/nS1,在预设的基础神经网络上训练一组模型,选出在验证集上性能最好的模型T0;/nS2,在T0上进行优化获得若干备选实验配置,对所述若干备选实验配置训练并获得其中性能最优的模型T1’;/nS3,对T1’重新训练,确保重新训练的性能结果的平均值大于T0的性能,得到最优的模型配置。/n
【技术特征摘要】 【专利技术属性】
1.一种模型训练方法,其特征在于包括:
S1,在预设的基础神经网络上训练一组模型,选出在验证集上性能最好的模型T0;
S2,在T0上进行优化获得若干备选实验配置,对所述若干备选实验配置训练并获得其中性能最优的模型T1’;
S3,对T1’重新训练,确保重新训练的性能结果的平均值大于T0的性能,得到最优的模型配置。
2.根据权利要求1所述的模型训练方法,其特征在于:S2中,所述在T0上进行优化的方法为调整参数。
3.根据权利要求2所述的模型训练方法,其特征在于:所述参数包括以下之一或组合:模型宽度,学习速率,优化策略,是否使用数据增强,数据增强的参数,网络单位模块。
4.根据权利要求1-3任一所述的模型训练方法,其特征在于:S3对T1’的重新训练中,如果重新训练的性能结果大于T0的性能结果,则替代T0作为新的备选实验配置。
5.根据权利要求4所述的模型训练方法,其特征在于:所述迭代优化的过程反复循环进行,直至性能最优时停止。
技术研发人员:王益县,章子誉,
申请(专利权)人:上海依图网络科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。