字符识别模型训练方法、装置及设备制造方法及图纸

技术编号:27089846 阅读:17 留言:0更新日期:2021-01-25 18:19
本发明专利技术提供一种字符识别模型训练方法、装置及设备,该方法包括:从图像样本集中选择未标注图像;所述图像样本集包括已标注图像和未标注图像;将选择的未标注图像输入至字符识别模型,得到输入至字符识别模型的每一未标注图像的预测字符识别结果;所述字符识别模型是根据所述图像样本集中的已标注图像训练得到的;针对输入至所述字符识别模型的每一未标注图像,根据该未标注图像的预测字符识别结果对所述图像样本集中的该未标注图像进行标注,得到已标注图像;根据所述图像样本集中的已标注图像和所述字符识别模型训练出目标字符识别模型。可提升标注效率,进而提升模型训练效率。进而提升模型训练效率。进而提升模型训练效率。

【技术实现步骤摘要】
字符识别模型训练方法、装置及设备


[0001]本专利技术涉及机器视觉
,尤其涉及的是一种字符识别模型训练方法、装置及设备。

技术介绍

[0002]随着科学技术的发展,深度学习算法在分类、检测、识别等任务中表现优异。在字符识别技术中,将图像输入到已训练的字符识别模型中,以通过字符识别模型对图像中的字符进行识别。实现此技术的前提是,需要利用大量样本训练出字符识别模型。
[0003]现有的字符识别模型训练方式中,采集到大量图像后,需要人为地一一标注图像中各字符的标签,再利用标注好标签的所有图像训练出所需的字符识别模型。
[0004]上述方式中,由于模型训练需要大量样本,而且每张图像中还可能有大量的字符,所以需要人为标注的标签很多,标注效率过低,导致模型训练效率低。

技术实现思路

[0005]有鉴于此,本专利技术提供一种字符识别模型训练方法、装置及设备,可提升标注效率,进而提升模型训练效率。
[0006]本专利技术第一方面提供一种字符识别模型训练方法,包括:
[0007]从图像样本集中选择未标注图像;所述图像样本集包括已标注图像和未标注图像;
[0008]将选择的未标注图像输入至字符识别模型,得到输入至字符识别模型的每一未标注图像的预测字符识别结果;所述字符识别模型是根据所述图像样本集中的已标注图像训练得到的;
[0009]针对输入至所述字符识别模型的每一未标注图像,根据该未标注图像的预测字符识别结果对所述图像样本集中的该未标注图像进行标注,得到已标注图像
[0010]根据所述图像样本集中的已标注图像和所述字符识别模型训练出目标字符识别模型。
[0011]根据本专利技术的一个实施例,从所述图像样本集中选择未标注图像,包括:
[0012]如果所述图像样本集中未标注图像的数量大于等于设定数量,从所述图像样本集中选择设定数量个未标注图像;
[0013]如果所述图像样本集中未标注图像的数量小于设定数量,从所述图像样本集中选择剩余所有未标注图像。
[0014]根据本专利技术的一个实施例,
[0015]所述预测字符识别结果包括未标注图像中各字符的预测字符信息;
[0016]所述根据该未标注图像的预测字符识别结果对所述图像样本集中的该未标注图像进行标注,包括:
[0017]依据该未标注图像的预测字符识别结果中的预测字符信息确定该未标注图像中
各字符被预测的字符标签;
[0018]针对该未标注图像中每一字符,确定该字符是否被预测出正确的字符标签,如果是,确定该字符标签为该字符的目标标签,如果否,重新确定一个字符标签作为该字符的目标标签;
[0019]依据该未标注图像中各字符的目标标签,对所述图像样本集中的该未标注图像进行标注,得到已标注图像。
[0020]根据本专利技术的一个实施例,确定该字符是否被预测出正确的字符标签,包括:
[0021]接收外部输入的指令;所述指令携带字符未被预测出正确的字符标签的指示信息;
[0022]若所述指令携带的指示信息指示该字符未被预测出正确的字符标签,则确定该字符未被预测出正确的字符标签,若所述指令携带的指示信息未指示该字符未被预测出正确的字符标签,则确定该字符被预测出正确的字符标签。
[0023]根据本专利技术的一个实施例,
[0024]所述指令还进一步携带:候选标签;
[0025]所述重新确定一个字符标签作为该字符的目标标签,包括:
[0026]从所述指令携带的候选标签中选择一个候选标签,将选择的候选标签确定为该字符的目标标签。
[0027]根据本专利技术的一个实施例,根据所述图像样本集中的已标注图像和所述字符识别模型训练出目标字符识别模型,包括:
[0028]根据所述图像样本集中的已标注图像训练所述字符识别模型;
[0029]检查当前是否满足设定的训练结束条件,若否,返回从图像样本集中选择未标注图像的操作,若是,将所述字符识别模型确定为目标字符识别模型。
[0030]根据本专利技术的一个实施例,从图像样本集中选择未标注图像之前,还包括:
[0031]获取从指定场景中采集的图像,所述指定场景中字符的风格为指定风格;
[0032]从采集的每一图像中截取出字符区域,所述字符区域包含至少一个字符;
[0033]根据截取出的所有字符区域确定所述图像样本集。
[0034]本专利技术第二方面提供一种字符识别模型训练装置,包括:
[0035]选择模块,用于从图像样本集中选择未标注图像;所述图像样本集包括已标注图像和未标注图像;
[0036]预测模块,用于将选择的未标注图像输入至字符识别模型,得到输入至字符识别模型的每一未标注图像的预测字符识别结果;所述字符识别模型是根据所述图像样本集中的已标注图像训练得到的;
[0037]标注模块,用于针对输入至所述字符识别模型的每一未标注图像,根据该未标注图像的预测字符识别结果对所述图像样本集中的该未标注图像进行标注,得到已标注图像;
[0038]训练模块,用于根据所述图像样本集中的已标注图像和所述字符识别模型训练出目标字符识别模型。
[0039]根据本专利技术的一个实施例,所述选择模块从所述图像样本集中选择未标注图像时,具体用于:
[0040]如果所述图像样本集中未标注图像的数量大于等于设定数量,从所述图像样本集中选择设定数量个未标注图像;
[0041]如果所述图像样本集中未标注图像的数量小于设定数量,从所述图像样本集中选择剩余所有未标注图像。
[0042]根据本专利技术的一个实施例,
[0043]所述预测字符识别结果包括未标注图像中各字符的预测字符信息;
[0044]所述标注模块根据该未标注图像的预测字符识别结果对所述图像样本集中的该未标注图像进行标注时,具体用于:
[0045]依据该未标注图像的预测字符识别结果中的预测字符信息确定该未标注图像中各字符被预测的字符标签;
[0046]针对该未标注图像中每一字符,确定该字符是否被预测出正确的字符标签,如果是,确定该字符标签为该字符的目标标签,如果否,重新确定一个字符标签作为该字符的目标标签;
[0047]依据该未标注图像中各字符的目标标签,对所述图像样本集中的该未标注图像进行标注,得到已标注图像。
[0048]根据本专利技术的一个实施例,
[0049]所述标注模块确定该字符是否被预测出正确的字符标签时,具体用于:
[0050]接收外部输入的指令;所述指令携带字符未被预测出正确的字符标签的指示信息;
[0051]若所述指令携带的指示信息指示该字符未被预测出正确的字符标签,则确定该字符未被预测出正确的字符标签,若所述指令携带的指示信息未指示该字符未被预测出正确的字符标签,则确定该字符被预测出正确的字符标签。
[0052]根据本专利技术的一个实施例,
[0053]所述指令还进一步携带:候选标签;...

【技术保护点】

【技术特征摘要】
1.一种字符识别模型训练方法,其特征在于,包括:从图像样本集中选择未标注图像;所述图像样本集包括已标注图像和未标注图像;将选择的未标注图像输入至字符识别模型,得到输入至字符识别模型的每一未标注图像的预测字符识别结果;所述字符识别模型是根据所述图像样本集中的已标注图像训练得到的;针对输入至所述字符识别模型的每一未标注图像,根据该未标注图像的预测字符识别结果对所述图像样本集中的该未标注图像进行标注,得到已标注图像;根据所述图像样本集中的已标注图像和所述字符识别模型训练出目标字符识别模型。2.如权利要求1所述的字符识别模型训练方法,其特征在于,从所述图像样本集中选择未标注图像,包括:如果所述图像样本集中未标注图像的数量大于等于设定数量,从所述图像样本集中选择设定数量个未标注图像;如果所述图像样本集中未标注图像的数量小于设定数量,从所述图像样本集中选择剩余所有未标注图像。3.如权利要求1所述的字符识别模型训练方法,其特征在于,所述预测字符识别结果包括未标注图像中各字符的预测字符信息;所述根据该未标注图像的预测字符识别结果对所述图像样本集中的该未标注图像进行标注,包括:依据该未标注图像的预测字符识别结果中的预测字符信息确定该未标注图像中各字符被预测的字符标签;针对该未标注图像中每一字符,确定该字符是否被预测出正确的字符标签,如果是,确定该字符标签为该字符的目标标签,如果否,重新确定一个字符标签作为该字符的目标标签;依据该未标注图像中各字符的目标标签,对所述图像样本集中的该未标注图像进行标注,得到已标注图像。4.如权利要求3所述的字符识别模型训练方法,其特征在于,确定该字符是否被预测出正确的字符标签,包括:接收外部输入的指令;所述指令携带字符未被预测出正确的字符标签的指示信息;若所述指令携带的指示信息指示该字符未被预测出正确的字符标签,则确定该字符未被预测出正确的字符标签,若所述指令携带的指示信息未指示该字符未被预测出正确的字符标签,则确定该字符被预测出正确的字符标签。5.如权利要求4所述的字符识别模型训练方法,其特征在于,所述指令还进一步携带:候选标签;所述重新确定一个字符标签作为该字符的目标标签,包括:从所述指令携带的候选标签中选择一个候选标签,将选择的候选标签确定为该字符的目标标签。6.如权利要求1所述的字符识别模型训练方法,其特征在于,根据所述图像样本集中的已标注图像和所述字符识别模型训练出目标字符识别模型,包括:根据所述图像样本集中的已标注图像训练所述字符识别模型;
检查当前是否满足设定的训练结束条件,若否,返回从图像样本集中选择未标注图像的操作,若是,将所述字符识别模型确定为目标字符识别模型。7.如权利要求1所述的字符识别模型训练方法,其特征在于,从图像样本集中选择未标注图像之前,还包括:获取从指定场景中采集的图像,所述指定场景中字符的风格为指定风格;从采集的每一图像中截取出字符区域,所述字符区域包含至少一个字符;根据截取出的所有字符区域确定所述图像样本集。8.一种字符识别模型训练装置,其特征在于,包括:选择模块,用于从图像样本集中选择未标注图像;所述图像样本集包括已标注图像和未标注图像;预测模块,用于将选择的未标注图像输入至字符识别...

【专利技术属性】
技术研发人员:徐博
申请(专利权)人:上海高德威智能交通系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1