【技术实现步骤摘要】
文本识别方法、装置、存储介质及电子设备
[0001]本公开涉及图像处理
,具体地,涉及一种文本识别方法、装置、存储介质及电子设备。
技术介绍
[0002]在文本识别过程中,文字背景颜色和前景颜色多种多样,除常规白纸黑字外,还有大量丰富的颜色,为了书籍等的整体美观,文字底部常有非完全覆盖式色块,对文字识别造成干扰,另外,手持文档或者翻页等形式,还会造成文字扭曲,极大影响文字识别的准确率。
[0003]相关技术中,通过预先训练的文本识别模型对图像中的文本进行识别,但是,在训练文本识别模型时需要大量的样本图像,基于此,如何获取大量逼真且样式多样的样本图像成为亟待解决的问题。
技术实现思路
[0004]为了解决上述问题,本公开提供一种文本识别方法、装置、存储介质及电子设备。
[0005]第一方面,本公开提供一种文本识别方法,所述方法包括:
[0006]获取待识别图像;
[0007]将所述待识别图像输入预先训练的文本识别模型,以获取所述文本识别模型输出的目标文本;
[0008]其中,所述文本识别模型通过以下方式训练得到:
[0009]获取多个样本图像;
[0010]针对每个所述样本图像,对所述样本图像进行图像处理,得到目标样本图像,并根据所述目标样本图像,对目标神经网络模型进行迭代训练,得到所述文本识别模型。
[0011]可选地,所述图像处理包括以下一个或多个:
[0012]为所述样本图像添加背景图像;
[0013]调节所述样 ...
【技术保护点】
【技术特征摘要】
1.一种文本识别方法,其特征在于,所述方法包括:获取待识别图像;将所述待识别图像输入预先训练的文本识别模型,以获取所述文本识别模型输出的目标文本;其中,所述文本识别模型通过以下方式训练得到:获取多个样本图像;针对每个所述样本图像,对所述样本图像进行图像处理,得到目标样本图像,并根据所述目标样本图像,对目标神经网络模型进行迭代训练,得到所述文本识别模型。2.根据权利要求1所述的方法,其特征在于,所述图像处理包括以下一个或多个:为所述样本图像添加背景图像;调节所述样本图像的亮度和/或对比度;对所述样本图像进行反色增强处理;在所述样本图像的字符的底部添加色块;对所述样本图像的字符进行扭曲增强处理。3.根据权利要求2所述的方法,其特征在于,所述为所述样本图像添加背景图像包括:获取预设背景图像;将所述样本图像与所述预设背景图像进行融合处理。4.根据权利要求3所述的方法,其特征在于,所述预设背景图像通过以下方式预先确定:确定所述样本图像的图像尺寸;根据所述图像尺寸,获取初始二维数组图像;针对所述初始二维数组图像中的每个像素点,根据所述像素点的像素值,通过高斯分布计算所述像素点的目标像素值;根据多个所述目标像素值,确定所述预设背景图像。5.根据权利要求2所述的方法,其特征在于,所述调节所述样本图像的亮度和/或对比度包括:获取预设调节比例;按照所述预设调节比例,调节所述样本图像的亮度和/或对比度。6.根据权利要求2所述的方法,其特征在于,所述对所述样本图像进行反色增强处理包括:确定所述样本图像在每个颜色通道的最大像素值;针对每个所述颜色通道,根据所述最大像素值和预设像素阈值,随机确定所述颜色通道对应的反色阈值;针对所述样本图像的每个像素点,根据所述像素点的像素值和所述反色阈值,更新所述像素点的像素值。7.根据权利要求6所述的方法,其特征在于,所述根据所述像素点的像素值和所述反色阈值,更新所述像素点的像素值包括:确定所述像素点的像素值与所述反色阈值之间的像素差值;根据所述像素差值更新所述像素点的像素值。
8.根据权利要求2所述的方法,其特征在于,所述在所述样本图像的字符的底部添加色块包括:根据所述样本图像的图像尺寸,获取全透明的掩码图像;按照预设尺寸和预设形状,在所述掩码图像中绘制目标色块,得到目标掩码图像;将所述样本图像与所述目标掩码图像进行重叠处理。9.根据权利要求8所述的方法,其特征在于,所述按照预设尺寸和预设形状,在所述掩码图像中绘制目标色块,得到目标掩码图像包括:在所述掩码图像中随机确定预设数量的基准点;针对每个所述基准点,以所述基准点为中心,按照所述预设尺寸和所述预设形状,在所述掩码图像中绘制所述目标色块,得到所述目标掩码图像。10.根据权利要求2所述的方法,其特征在于,所述对所述样本图像的字符进行扭曲增强处理包括:根据所述样本图像的图像尺寸,确定多个源基准点;对...
【专利技术属性】
技术研发人员:王彦君,
申请(专利权)人:北京鼎事兴教育咨询有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。