图像识别模型训练方法及装置制造方法及图纸

技术编号：32567961 阅读：11 留言：0更新日期：2022-03-09 16:54

本发明专利技术公开了一种图像识别模型训练方法及装置，该方法包括：确定训练好的第一图像识别模型；第一图像识别模型包括有训练好的第一特征编码网络；确定待训练的第二图像识别模型；第二图像识别模型的模型参数少于第一图像识别模型的模型参数；将第二图像识别模型中的第二特征编码网络的网络参数，确定为第一特征编码网络的网络参数；确定损失函数为第一特征编码网络的特征输出和第二特征编码网络的特征输出之间的差异，对第一图像识别模型和第二图像识别模型进行联合训练，得到训练好的第二图像识别模型。可见，通过本发明专利技术的方案训练得到的第二图像识别模型可以保持较小的规模的同时达到更好的识别效果。同时达到更好的识别效果。同时达到更好的识别效果。

全部详细技术资料下载

【技术实现步骤摘要】
图像识别模型训练方法及装置

[0001]本专利技术涉及图像处理
，尤其涉及一种图像识别模型训练方法及装置。

技术介绍

[0002]随着图像识别技术的发展，深度学习技术逐渐被引入这一领域，以提高图像识别的精度，让例如图像中的字符识别的效率提高，但提高效率和精度的代价往往是需要付出高算力。因此，准确度越高的图像识别模型往往需要更高的成本，例如耗费更高的计算资源和占据更高的内存，导致其难以部署到移动端设备中，实现本地的实时识别。
[0003]现有技术的模型训练方案，为解决高精度大体积的模型的成本过高的问题，常常不得不在精度和成本之间做出抉择，因此难以有效兼顾精度和成本，存在缺陷，亟需得到解决。

技术实现思路

[0004]本专利技术所要解决的技术问题在于，提供一种图像识别模型训练确定方法及装置，能够利用训练好的网络参数来提高模型训练的速度，降低训练的成本，且训练得到的第二图像识别模型可以保持较小的规模的同时达到更好的识别效果。
[0005]为了解决上述技术问题，本专利技术第一方面公开了一种图像识别模型训练方法，所述方法包括：
[0006]确定训练好的第一图像识别模型；所述第一图像识别模型包括有训练好的第一特征编码网络；
[0007]确定待训练的第二图像识别模型；所述第二图像识别模型的模型参数少于所述第一图像识别模型的模型参数；
[0008]将所述第二图像识别模型中的第二特征编码网络的网络参数，确定为所述第一特征编码网络的网络参数；
[0009]确定损失函数...

【技术保护点】

【技术特征摘要】
1.一种图像识别模型训练方法，其特征在于，所述方法包括：确定训练好的第一图像识别模型；所述第一图像识别模型包括有训练好的第一特征编码网络；确定待训练的第二图像识别模型；所述第二图像识别模型的模型参数少于所述第一图像识别模型的模型参数；将所述第二图像识别模型中的第二特征编码网络的网络参数，确定为所述第一特征编码网络的网络参数；确定损失函数为所述第一特征编码网络的特征输出和所述第二特征编码网络的特征输出之间的差异，对所述第一图像识别模型和所述第二图像识别模型进行联合训练，得到训练好的所述第二图像识别模型。2.根据权利要求1所述的图像识别模型训练方法，其特征在于，所述对所述第一图像识别模型和所述第二图像识别模型进行联合训练，得到训练好的所述第二图像识别模型，包括：将训练数据集同时输入至所述第一图像识别模型和所述第二图像识别模型进行训练；在所述训练中将所述第一图像识别模型的所有模型参数和所述第二图像识别模型的所述第二特征编码网络的参数进行固定以保持不变；在所述训练中，优化所述第二图像识别模型中除所述第二特征编码网络的参数以外的其他模型参数，直至所述损失函数收敛，得到训练好的所述第二图像识别模型。3.根据权利要求1所述的图像识别模型训练方法，其特征在于，所述第二特征编码网络的网络层数与所述第一特征编码网络的网络层数相同；和/或，所述第一特征编码网络为BiLSTM网络；和/或，所述第二特征编码网络为BiLSTM网络。4.根据权利要求1所述的图像识别模型训练方法，其特征在于，所述第二图像识别模型的模型参数少于所述第一图像识别模型的模型参数，多于所述第一图像识别模型的模型参数的1/10；和/或，所述第一图像识别模型还包括第一特征提取网络；所述第二图像识别模型还包括第二特征提取网络；所述第二特征提取网络的网络参数少于所述第一特征提取网络的网络参数，多于所述第一特征提取网络的网络参数的1/10。5.根据权利要求1所述的图像识别模型训练方法，其特征在于，所述确定损失函数为所述第一特征编码网络的特征输出和所述第二特征编码网络的特征输出之间的差异，包括：将所述第一特征编码网...

【专利技术属性】
技术研发人员：钟艺豪，蔡锐涛，
申请(专利权)人：有米科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人