OCR识别模型的训练方法、装置和计算机设备制造方法及图纸

技术编号:26172920 阅读:23 留言:0更新日期:2020-10-31 13:53
本发明专利技术涉及人工智能技术,应用于智慧城市中,提出的OCR识别模型的训练方法、装置、计算机设备和存储介质,其中方法包括:获取样本集;对样本集中的部分样本进行标注,以使样本集包括标注样本以及非标注样本;将样本集输入至预设的OCR识别网络中进行计算得到第一特征向量集;将第一特征向量集输入到用于做无监督训练的第一损失计算层计算得到第一损失值集,以及将第一特征向量集输入到用于做有监督训练的第二损失计算层继续计算得到第二损失值集;将第一损失值集与第二损失值集通过网络反向传播计算出网络的参数梯度,以更新OCR识别网络的参数直到收敛,得到OCR识别模型;该OCR识别模型与传统训练方法得到OCR模型相比,识别精度更高。

【技术实现步骤摘要】
OCR识别模型的训练方法、装置和计算机设备
本专利技术涉及到识别模型的
,特别是涉及到一种OCR识别模型的训练方法、装置、计算机设备和存储介质。
技术介绍
OCR(OpticalCharacterRecognition,光学字符识别)是人工智能领域重要的领域,利用OCR可以快速的将光学字符转化为数字化信息,极大的降低了人工录入的成本,因而被广泛地应用在各类票证数字化的系统中。目前,传统OCR识别一般通过监督学习训练出的识别模型来实现,但传统OCR识别系统存在以下缺陷:训练识别模型时,OCR识别的字符需要预先定义,并针对每个类别的字符,均需要采集大量的样本数据;而且这样训练出来的识别模型对于预先定义以外的字符没有识别能力,需要追加数据二次训练;另外,当训练数据与实际生产环境存在表现差异的时候,系统精度会有比较明显的下降。
技术实现思路
本专利技术的主要目的为提供一种OCR识别模型的训练方法、装置、计算机设备和存储介质,旨在解决现有技术中OCR识别模型识别效果不佳的技术问题。基于上述专利技术目的,本专利技术提出一种OCR识别模型的训练方法,包括:获取样本集;对所述样本集中的部分样本进行标注,以使所述样本集包括标注样本以及非标注样本;将所述样本集输入至预设的OCR识别网络中进行计算,得到第一特征向量集;将所述第一特征向量集输入到用于做无监督训练的第一损失计算层,计算得到第一损失值集,以及将所述第一特征向量集输入到用于做有监督训练的第二损失计算层继续计算得到第二损失值集;将所述第一损失值集与第二损失值集通过网络反向传播计算出网络的参数梯度,以更新所述OCR识别网络的参数直到收敛,得到OCR识别模型。进一步地,所述将所述第一损失值集与第二损失值集通过网络反向传播计算出网络的参数梯度的步骤,包括:依据所述非标注样本与所述标注样本的数量得到数量比值,依据所述数据比值获取第一系数与第二系数,其中,所述第一系数与所述第二系数的比值与所述数量比值对应;将所述第一损失值乘以所述第一系数得到第一值,并将第二损失值乘以第二系数得到第二值,将所述第一值与第二值相加得到函数损失值;将所述函数损失值通过网络反向传播计算参数梯度。进一步地,所述将所述第一特征向量集输入到用于做有监督训练的第二损失计算层继续计算得到第二损失值集的步骤之前,包括:判断所述第一特征向量集中的第一特征向量是否由所述标注样本计算得到的特征向量;若是,则将所述第一特征向量输入至所述第二损失计算层中;若否,则将所述第一特征向量剔除。进一步地,所述第二损失计算层由分类网络层以及做监督训练的损失函数构建,所述将所述第一损失值集与第二损失值集通过网络反向传播计算出网络的参数梯度,以更新所述OCR识别网络的参数直到收敛,得到OCR识别模型的步骤之后,包括:获取需要扩展识别的字符样本集,所述字符样本集中包括多种不同类型的字符样本;将所述字符样本集输入至所述OCR识别模型中的OCR识别网络进行计算,得到与各所述字符样本对应的第二特征向量;对所有同类型的所述第二特征向量分别计算得到中心向量,每一所述中心向量对应一种类型的字符样本;依据各类的所述字符样本的中心向量更改所述分类网络层的权值矩阵,以得到扩展识别字符后的OCR识别模型。进一步地,所述对所有同类型的所述第二特征向量分别计算得到中心向量的步骤,包括:对所有同类型的所述第二特征向量分别进行归一化处理,并求出平均值,将所述平均值作为所述中心向量。进一步地,所述第一损失计算层由ContrastiveLOSS函数构建,所述第二损失计算层由分类网络层以及CTCLOSS函数构建。本专利技术还提供一种OCR识别模型的训练装置,包括:获取样本单元,用于获取样本集;标注样本单元,用于对所述样本集中的部分样本进行标注,以使所述样本集包括标注样本以及非标注样本;输入网络单元,用于将所述样本集输入至预设的OCR识别网络中进行计算,得到第一特征向量集;计算损失单元,用于将所述第一特征向量集输入到用于做无监督训练的第一损失计算层,计算得到第一损失值集,以及将所述第一特征向量集输入到用于做有监督训练的第二损失计算层继续计算得到第二损失值集;更新参数单元,用于将所述第一损失值集与第二损失值集通过网络反向传播计算出网络的参数梯度,以更新所述OCR识别网络的参数直到收敛,得到OCR识别模型。进一步地,所述更新参数单元,包括:获取系数子单元,用于依据所述非标注样本与所述标注样本的数量得到数量比值,依据所述数据比值获取第一系数与第二系数,其中,所述第一系数与所述第二系数的比值与所述数量比值对应;获得损失子单元,用于将所述第一损失值乘以所述第一系数得到第一值,并将第二损失值乘以第二系数得到第二值,将所述第一值与第二值相加得到函数损失值;反向传播子单元,用于将所述函数损失值通过网络反向传播计算参数梯度。本专利技术还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述OCR识别模型的训练方法的步骤。本专利技术还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述OCR识别模型的训练方法的步骤。本专利技术的有益效果为:本申请提供的OCR识别模型的训练方法,将传统训练方法中单纯采用一种用于监督训练的标注训练数据,变成采用用于监督训练以及无监督训练的两种不同训练数据。训练过程中也分成两方面同时进行,一方面标注样本数据依然采用传统的监督训练流程,最终通过CTCLOSS进行约束;另一方面无标注的泛化字符数据,则在RNN层之后,不经过分类层,通过ContrastiveLOSS做无监督的据类型约束,由于在训练中加入了大量的额外无标注字符数据进行无监督训练,如此得到的OCR识别模型,与传统训练方法得到OCR模型相比,识别精度更提高,当实际应用中的输入数据与训练数据差别较大时,由于传统训练方法是单纯的监督训练,识别精度较低,甚至无法识别,而通过本申请提供的训练方法,结合了监督训练以及无监督训练,识别精度大大提高,在环境适应性以及系统泛化性上有了明显的提升。附图说明图1为本专利技术一实施例中OCR识别模型的训练方法的步骤示意图;图2为本专利技术一实施例中OCR识别模型的训练装置的结构示意框图;图3为本专利技术一实施例的计算机设备的结构示意框图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。参照图1,本实施例中的OCR识别模型的训练方法,包括:步骤S1:获取样本集;步骤S2:对所述样本集中的部分样本进行标注,以使所述样本集包括标注样本以及非标注样本;步骤S3:将所述样本集输入至预本文档来自技高网...

【技术保护点】
1.一种OCR识别模型的训练方法,其特征在于,包括:/n获取样本集;/n对所述样本集中的部分样本进行标注,以使所述样本集包括标注样本以及非标注样本;/n将所述样本集输入至预设的OCR识别网络中进行计算,得到第一特征向量集;/n将所述第一特征向量集输入到用于做无监督训练的第一损失计算层,计算得到第一损失值集,以及将所述第一特征向量集输入到用于做有监督训练的第二损失计算层继续计算得到第二损失值集;/n将所述第一损失值集与第二损失值集通过网络反向传播计算出网络的参数梯度,以更新所述OCR识别网络的参数直到收敛,得到OCR识别模型。/n

【技术特征摘要】
1.一种OCR识别模型的训练方法,其特征在于,包括:
获取样本集;
对所述样本集中的部分样本进行标注,以使所述样本集包括标注样本以及非标注样本;
将所述样本集输入至预设的OCR识别网络中进行计算,得到第一特征向量集;
将所述第一特征向量集输入到用于做无监督训练的第一损失计算层,计算得到第一损失值集,以及将所述第一特征向量集输入到用于做有监督训练的第二损失计算层继续计算得到第二损失值集;
将所述第一损失值集与第二损失值集通过网络反向传播计算出网络的参数梯度,以更新所述OCR识别网络的参数直到收敛,得到OCR识别模型。


2.根据权利要求1所述的OCR识别模型的训练方法,其特征在于,所述将所述第一损失值集与第二损失值集通过网络反向传播计算出网络的参数梯度的步骤,包括:
依据所述非标注样本与所述标注样本的数量得到数量比值,依据所述数据比值获取第一系数与第二系数,其中,所述第一系数与所述第二系数的比值与所述数量比值对应;
将所述第一损失值乘以所述第一系数得到第一值,并将第二损失值乘以第二系数得到第二值,将所述第一值与第二值相加得到函数损失值;
将所述函数损失值通过网络反向传播计算参数梯度。


3.根据权利要求1所述的OCR识别模型的训练方法,其特征在于,所述将所述第一特征向量集输入到用于做有监督训练的第二损失计算层继续计算得到第二损失值集的步骤之前,包括:
判断所述第一特征向量集中的第一特征向量是否由所述标注样本计算得到的特征向量;
若是,则将所述第一特征向量输入至所述第二损失计算层中;
若否,则将所述第一特征向量剔除。


4.根据权利要求1所述的OCR识别模型的训练方法,其特征在于,所述第二损失计算层由分类网络层以及做监督训练的损失函数构建,所述将所述第一损失值集与第二损失值集通过网络反向传播计算出网络的参数梯度,以更新所述OCR识别网络的参数直到收敛,得到OCR识别模型的步骤之后,包括:
获取需要扩展识别的字符样本集,所述字符样本集中包括多种不同类型的字符样本;
将所述字符样本集输入至所述OCR识别模型中的OCR识别网络进行计算,得到与各所述字符样本对应的第二特征向量;
对所有同类型的所述第二特征向量分别计算得到中心向量,每一所述中心向量对应一种类型的字符样本;
依据各类的所述字符样本的中心向量更...

【专利技术属性】
技术研发人员:叶明盛建达张国辉宋晨
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1