一种字符图像识别方法、装置、设备及介质制造方法及图纸

技术编号：34105892 阅读：47 留言：0更新日期：2022-07-12 00:26

本申请公开了一种字符识别方法、装置、设备及介质，包括：将目标域数据集和源域数据集分别进行图像预处理，以获取与所述目标域数据集对应的目标域图像和与所述源域数据集对应的源域图像；利用自编码器模型中的编码器和解码器对所述目标域图像进行自监督重建训练，并利用所述编码器对所述源域图像进行有监督分类训练与验证；判断当前是否满足预设训练结束条件，如果否则重新跳转至所述利用自编码器模型中的编码器和解码器对所述目标域图像进行自监督重建训练的步骤，直到满足所述预设训练结束条件，以得到字符识别模型；利用所述字符识别模型确定所述目标域数据集对应的字符识别结果。通过上述方案，能够对字符图像进行精确识别。确识别。确识别。

全部详细技术资料下载

【技术实现步骤摘要】
一种字符图像识别方法、装置、设备及介质

[0001]本专利技术涉及图像识别
，特别涉及一种字符图像识别方法、装置、设备及介质。

技术介绍

[0002]光学字符识别(Optical Character Recognition,OCR)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程。当前光学字符识别方法主要采用传统的深度学习方法进行识别，目的是识别出图像中的字符。由于深度学习方法需要大量的有标签样本进行有监督训练，但是标注大量的样本会极大增加训练成本；因此在实际应用中，有标签样本数量通常较少，那么在样本不充足的情况下，训练通常难以得到泛化性高的模型，这导致在新增样本识别任务中，极易出现误识别问题；同时在制造、供应、办公、交通等场景下，字符字体、背景等纷繁复杂，对识别结果产生严重干扰，导致字符识别的准确度难以提高。
[0003]综上可见，如何提高字符识别的准确度并降低训练成本是本领域有待解决的问题。

技术实现思路

[0004]有鉴于此，本专利技术的目的在于提供一种字符识别方法、装置、设备及介质，能够提高字符识别的准确度并降低训练成本。其具体方案如下：
[0005]第一方面，本申请公开了一种字符识别方法，包括：
[0006]将目标域数据集和源域数据集分别进行图像预处理，以获取与所述目标域数据集对应的目标域图像和与所述源域数据集对应的源域图像；
[0007]利用自编码器模型中的编码器和解...

【技术保护点】

【技术特征摘要】
1.一种字符识别方法，其特征在于，包括：将目标域数据集和源域数据集分别进行图像预处理，以获取与所述目标域数据集对应的目标域图像和与所述源域数据集对应的源域图像；利用自编码器模型中的编码器和解码器对所述目标域图像进行自监督重建训练，并利用所述编码器对所述源域图像进行有监督分类训练与验证；判断当前是否满足预设训练结束条件，如果否则重新跳转至所述利用自编码器模型中的编码器和解码器对所述目标域图像进行自监督重建训练的步骤，直到满足所述预设训练结束条件，以得到字符识别模型；利用所述字符识别模型确定所述目标域数据集对应的字符识别结果。2.根据权利要求1所述的字符识别方法，其特征在于，所述将目标域数据集和源域数据集分别进行图像预处理，包括：将目标域数据集和源域数据集中任一字符图像映射成初始灰度图，并对所述初始灰度图进行高斯滤波降噪，以获得所述字符图像对应的灰度图像；将所述字符图像进行高斯平滑处理以得到高斯平滑后图像，并利用边缘检测算子对所述高斯平滑后图像进行边缘特征提取，以获得所述字符图像对应的边缘特征图；提取所述字符图像的梯度的方向分布，以获得所述字符图像对应的方向梯度直方图；分别将所述目标域数据集和所述源域数据集中每一所述字符图像对应的所述灰度图像、所述边缘特征图以及所述方向梯度直方图进行拼接，以得到所述目标域数据集中每一所述字符图像对应的目标域图像以及所述源域数据集中每一所述字符图像对应的源域图像。3.根据权利要求1所述的字符识别方法，其特征在于，所述利用自编码器模型中的编码器和解码器对所述目标域图像进行自监督重建训练，包括：利用自编码器模型中的编码器提取所述目标域图像的特征向量，并利用所述自编码器模型中的解码器以及所述特征向量进行图像重建，以得到重建后图像；计算出所述目标域图像和所述重建后图像对应的第一损失函数结果，以实现自监督重建训练，并基于所述第一损失函数结果判断当前是否满足预设训练结束条件。4.根据权利要求1所述的字符识别方法，其特征在于，所述利用所述编码器对所述源域图像进行有监督分类训练与验证，包括：对所述源域图像进行小样本采样以得到与所述源域图像对应的训练支持集、训练查询集、验证支持集和验证查询集，并基于元学习的训练方式，利用所述编码器对所述训练支持集、所述训练查询集、所述验证支持集和所述验证查询集进行有监督分类训练与验证。5.根据权利要求4所述的字符识别方法，其特征在于，所述对所述源域图像进行小样本采样以得到与所述源域图像对应的训练支持集、训练查询集、验证支持集和验证查询集，包括：将所述源域图像划分为训练集和验证集；所述训练集和所述验证集中的每个图像...

【专利技术属性】
技术研发人员：周涛，吴婕，邵蒙悦，庄林志，李天鹏，吴吉灵，
申请(专利权)人：济南博观智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人