文本识别方法、装置、存储介质及电子设备制造方法及图纸

技术编号：34726719 阅读：60 留言：0更新日期：2022-08-31 18:14

本公开涉及一种文本识别方法、装置、存储介质及电子设备，所述方法包括：获取待识别图像；将所述待识别图像输入预先训练的文本识别模型，以获取所述文本识别模型输出的目标文本；其中，所述文本识别模型通过以下方式训练得到：获取多个样本图像；针对每个所述样本图像，对所述样本图像进行图像处理，得到目标样本图像，并根据所述目标样本图像，对目标神经网络模型进行迭代训练，得到所述文本识别模型。也就是说，本公开在获取多个样本图像后，可以先对每个样本图像进行图像处理，得到目标样本图像，该目标样本图像更逼真、样式更多样，这样，根据多个目标样本图像训练得到的文本识别模型的准确率更高。模型的准确率更高。模型的准确率更高。

全部详细技术资料下载

【技术实现步骤摘要】
文本识别方法、装置、存储介质及电子设备

[0001]本公开涉及图像处理
，具体地，涉及一种文本识别方法、装置、存储介质及电子设备。

技术介绍

[0002]在文本识别过程中，文字背景颜色和前景颜色多种多样，除常规白纸黑字外，还有大量丰富的颜色，为了书籍等的整体美观，文字底部常有非完全覆盖式色块，对文字识别造成干扰，另外，手持文档或者翻页等形式，还会造成文字扭曲，极大影响文字识别的准确率。
[0003]相关技术中，通过预先训练的文本识别模型对图像中的文本进行识别，但是，在训练文本识别模型时需要大量的样本图像，基于此，如何获取大量逼真且样式多样的样本图像成为亟待解决的问题。

技术实现思路

[0004]为了解决上述问题，本公开提供一种文本识别方法、装置、存储介质及电子设备。
[0005]第一方面，本公开提供一种文本识别方法，所述方法包括：
[0006]获取待识别图像；
[0007]将所述待识别图像输入预先训练的文本识别模型，以获取所述文本识别模型输出的目标文本；
[0008]其中，所述文本识别模型通过以下方式训练得到：
[0009]获取多个样本图像；
[0010]针对每个所述样本图像，对所述样本图像进行图像处理，得到目标样本图像，并根据所述目标样本图像，对目标神经网络模型进行迭代训练，得到所述文本识别模型。
[0011]可选地，所述图像处理包括以下一个或多个：
[0012]为所述样本图像添加背景图像；
[0013]调节所述样...

【技术保护点】

【技术特征摘要】
1.一种文本识别方法，其特征在于，所述方法包括：获取待识别图像；将所述待识别图像输入预先训练的文本识别模型，以获取所述文本识别模型输出的目标文本；其中，所述文本识别模型通过以下方式训练得到：获取多个样本图像；针对每个所述样本图像，对所述样本图像进行图像处理，得到目标样本图像，并根据所述目标样本图像，对目标神经网络模型进行迭代训练，得到所述文本识别模型。2.根据权利要求1所述的方法，其特征在于，所述图像处理包括以下一个或多个：为所述样本图像添加背景图像；调节所述样本图像的亮度和/或对比度；对所述样本图像进行反色增强处理；在所述样本图像的字符的底部添加色块；对所述样本图像的字符进行扭曲增强处理。3.根据权利要求2所述的方法，其特征在于，所述为所述样本图像添加背景图像包括：获取预设背景图像；将所述样本图像与所述预设背景图像进行融合处理。4.根据权利要求3所述的方法，其特征在于，所述预设背景图像通过以下方式预先确定：确定所述样本图像的图像尺寸；根据所述图像尺寸，获取初始二维数组图像；针对所述初始二维数组图像中的每个像素点，根据所述像素点的像素值，通过高斯分布计算所述像素点的目标像素值；根据多个所述目标像素值，确定所述预设背景图像。5.根据权利要求2所述的方法，其特征在于，所述调节所述样本图像的亮度和/或对比度包括：获取预设调节比例；按照所述预设调节比例，调节所述样本图像的亮度和/或对比度。6.根据权利要求2所述的方法，其特征在于，所述对所述样本图像进行反色增强处理包括：确定所述样本图像在每个颜色通道的最大像素值；针对每个所述颜色通道，根据所述最大像素值和预设像素阈值，随机确定所述颜色通道对应的反色阈值；针对所述样本图像的每个像素点，根据所述像素点的像素值和所述反色阈值，更新所述像素点的像素值。7.根据权利要求6所述的方法，其特征在于，所述根据所述像素点的像素值和所述反色阈值，更新所述像素点的像素值包括：确定所述像素点的像素值与所述反色阈值之间的像素差值；根据所述像素差值更新所述像素点的像素值。
8.根据权利要求2所述的方法，其特征在于，所述在所述样本图像的字符的底部添加色块包括：根据所述样本图像的图像尺寸，获取全透明的掩码图像；按照预设尺寸和预设形状，在所述掩码图像中绘制目标色块，得到目标掩码图像；将所述样本图像与所述目标掩码图像进行重叠处理。9.根据权利要求8所述的方法，其特征在于，所述按照预设尺寸和预设形状，在所述掩码图像中绘制目标色块，得到目标掩码图像包括：在所述掩码图像中随机确定预设数量的基准点；针对每个所述基准点，以所述基准点为中心，按照所述预设尺寸和所述预设形状，在所述掩码图像中绘制所述目标色块，得到所述目标掩码图像。10.根据权利要求2所述的方法，其特征在于，所述对所述样本图像的字符进行扭曲增强处理包括：根据所述样本图像的图像尺寸，确定多个源基准点；对...

【专利技术属性】
技术研发人员：王彦君，
申请(专利权)人：北京鼎事兴教育咨询有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人