【技术实现步骤摘要】
OCR识别模型的训练方法、装置和计算机设备
本专利技术涉及到识别模型的
,特别是涉及到一种OCR识别模型的训练方法、装置、计算机设备和存储介质。
技术介绍
OCR(OpticalCharacterRecognition,光学字符识别)是人工智能领域重要的领域,利用OCR可以快速的将光学字符转化为数字化信息,极大的降低了人工录入的成本,因而被广泛地应用在各类票证数字化的系统中。目前,传统OCR识别一般通过监督学习训练出的识别模型来实现,但传统OCR识别系统存在以下缺陷:训练识别模型时,OCR识别的字符需要预先定义,并针对每个类别的字符,均需要采集大量的样本数据;而且这样训练出来的识别模型对于预先定义以外的字符没有识别能力,需要追加数据二次训练;另外,当训练数据与实际生产环境存在表现差异的时候,系统精度会有比较明显的下降。
技术实现思路
本专利技术的主要目的为提供一种OCR识别模型的训练方法、装置、计算机设备和存储介质,旨在解决现有技术中OCR识别模型识别效果不佳的技术问题。基于上述专利技术目的,本专利技术提出一种OCR识别模型的训练方法,包括:获取样本集;对所述样本集中的部分样本进行标注,以使所述样本集包括标注样本以及非标注样本;将所述样本集输入至预设的OCR识别网络中进行计算,得到第一特征向量集;将所述第一特征向量集输入到用于做无监督训练的第一损失计算层,计算得到第一损失值集,以及将所述第一特征向量集输入到用于做有监督训练的第二损失计算层继续计 ...
【技术保护点】
1.一种OCR识别模型的训练方法,其特征在于,包括:/n获取样本集;/n对所述样本集中的部分样本进行标注,以使所述样本集包括标注样本以及非标注样本;/n将所述样本集输入至预设的OCR识别网络中进行计算,得到第一特征向量集;/n将所述第一特征向量集输入到用于做无监督训练的第一损失计算层,计算得到第一损失值集,以及将所述第一特征向量集输入到用于做有监督训练的第二损失计算层继续计算得到第二损失值集;/n将所述第一损失值集与第二损失值集通过网络反向传播计算出网络的参数梯度,以更新所述OCR识别网络的参数直到收敛,得到OCR识别模型。/n
【技术特征摘要】
1.一种OCR识别模型的训练方法,其特征在于,包括:
获取样本集;
对所述样本集中的部分样本进行标注,以使所述样本集包括标注样本以及非标注样本;
将所述样本集输入至预设的OCR识别网络中进行计算,得到第一特征向量集;
将所述第一特征向量集输入到用于做无监督训练的第一损失计算层,计算得到第一损失值集,以及将所述第一特征向量集输入到用于做有监督训练的第二损失计算层继续计算得到第二损失值集;
将所述第一损失值集与第二损失值集通过网络反向传播计算出网络的参数梯度,以更新所述OCR识别网络的参数直到收敛,得到OCR识别模型。
2.根据权利要求1所述的OCR识别模型的训练方法,其特征在于,所述将所述第一损失值集与第二损失值集通过网络反向传播计算出网络的参数梯度的步骤,包括:
依据所述非标注样本与所述标注样本的数量得到数量比值,依据所述数据比值获取第一系数与第二系数,其中,所述第一系数与所述第二系数的比值与所述数量比值对应;
将所述第一损失值乘以所述第一系数得到第一值,并将第二损失值乘以第二系数得到第二值,将所述第一值与第二值相加得到函数损失值;
将所述函数损失值通过网络反向传播计算参数梯度。
3.根据权利要求1所述的OCR识别模型的训练方法,其特征在于,所述将所述第一特征向量集输入到用于做有监督训练的第二损失计算层继续计算得到第二损失值集的步骤之前,包括:
判断所述第一特征向量集中的第一特征向量是否由所述标注样本计算得到的特征向量;
若是,则将所述第一特征向量输入至所述第二损失计算层中;
若否,则将所述第一特征向量剔除。
4.根据权利要求1所述的OCR识别模型的训练方法,其特征在于,所述第二损失计算层由分类网络层以及做监督训练的损失函数构建,所述将所述第一损失值集与第二损失值集通过网络反向传播计算出网络的参数梯度,以更新所述OCR识别网络的参数直到收敛,得到OCR识别模型的步骤之后,包括:
获取需要扩展识别的字符样本集,所述字符样本集中包括多种不同类型的字符样本;
将所述字符样本集输入至所述OCR识别模型中的OCR识别网络进行计算,得到与各所述字符样本对应的第二特征向量;
对所有同类型的所述第二特征向量分别计算得到中心向量,每一所述中心向量对应一种类型的字符样本;
依据各类的所述字符样本的中心向量更...
【专利技术属性】
技术研发人员:叶明,盛建达,张国辉,宋晨,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。