【技术实现步骤摘要】
识别模型的训练方法、字符识别方法、装置、设备和介质
本申请涉及字符识别
,特别是涉及一种识别模型的训练方法、字符识别方法、装置、设备和介质。
技术介绍
随着光学字符识别(OpticalCharacterRecognition,OCR)模型被越来越广泛地运用在各种场景中。因此,为了使OCR识别模型能够适应于各种不同的应用场景,需要对OCR识别模型进行多次优化,增加OCR识别模型的通用性。传统技术中,为了增加OCR识别模型的通用性,通常会使用一个较大的网络,利用知识蒸馏的思想,对较大的网络进行训练和优化,得到一个效果较好的小网络,用得到的小网络代替大网络完成对OCR识别模型进行优化。然而,传统的对OCR识别模型的优化方法,存在耗时较长的问题。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够缩短OCR识别模型优化时间的识别模型的训练方法、字符识别方法、装置、设备和介质。一种识别模型的训练方法,所述方法包括:根据样本字符图像,采用第一教师网络对识别模型的初始特征提 ...
【技术保护点】
1.一种识别模型的训练方法,其特征在于,所述方法包括:/n根据样本字符图像,采用第一教师网络对识别模型的初始特征提取网络进行训练,得到特征提取网络;/n根据所述样本字符图像,采用第二教师网络对所述识别模型的初始时序网络进行训练,得到时序网络;其中,在所述初始时序网络的训练过程中所述特征提取网络的参数固定不变;/n根据所述特征提取网络和所述时序网络,得到所述识别模型。/n
【技术特征摘要】
1.一种识别模型的训练方法,其特征在于,所述方法包括:
根据样本字符图像,采用第一教师网络对识别模型的初始特征提取网络进行训练,得到特征提取网络;
根据所述样本字符图像,采用第二教师网络对所述识别模型的初始时序网络进行训练,得到时序网络;其中,在所述初始时序网络的训练过程中所述特征提取网络的参数固定不变;
根据所述特征提取网络和所述时序网络,得到所述识别模型。
2.根据权利要求1所述的方法,其特征在于,所述根据样本字符图像,采用第一教师网络对识别模型的初始特征提取网络进行训练,得到特征提取网络,包括:
将所述样本字符图像输入所述第一教师网络的特征提取网络,通过所述第一教师网络的特征提取网络得到所述样本字符图像的第一特征图,将所述第一特征图输入所述第一教师网络的时序网络,得到第一识别结果;所述第一识别结果为所述第一教师网络对所述样本字符图像中字符的识别结果;
将所述样本字符图像输入所述初始特征提取网络,通过所述初始特征提取网络得到所述样本字符图像的第一样本特征图,将所述第一样本特征图输入所述初始时序网络,得到第一样本识别结果;
根据所述第一特征图、所述第一样本特征图和所述第一样本识别结果,得到所述初始特征提取网络的损失函数的值;
根据所述初始特征提取网络的损失函数的值,对所述初始特征提取网络进行训练,得到所述特征提取网络。
3.根据权利要求2所述的方法,其特征在于,所述初始特征提取网络的损失函数的计算公式为:L1=β*smoothL1loss+μCrossEntropy(y,pre),式中,L1表示初始特征提取网络的损失函数,β、μ均为参数,y表示所述样本字符图像对应的标准识别结果,pre表示所述第一样本识别结果,CrossEntropy表示交叉熵损失函数,smoothL1loss为根据所述第一特征图和所述第一样本特征图所得到的损失值。
4.根据权利要求1所述的方法,其特征在于,所述根据所述样本字符图像,采用第二教师网络对所述识别模型的初始时序网络进行训练,得到时序网络,包括:
将所述样本字符图像输入所述第二教师网络的特征提取网络,通过所述第二教师网络的特征提取网络得到所述样本字符图像的第二特征图,将所述第二特征图输入所述第二教师网络的时序网络,得到所述第二特征图的预测概率值,并根据所述第二特征图的预测概率值得到第二识别结果;所述第二识别结果为所述第二教师网络对所述样本字符图像中字符的识别结果;
将所述样本字符图像输入所述特征提取网络,通过所述特征提取网络得到所述样本字符图像的第二样本特征图,将所述第二样本特征图输入所述识别模型的初始时序网络,得到所述第二样本特征图的...
【专利技术属性】
技术研发人员:冯晓锐,
申请(专利权)人:上海眼控科技股份有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。