文字识别方法、装置、存储介质及电子设备制造方法及图纸

技术编号：38365424 阅读：13 留言：0更新日期：2023-08-05 17:32

本公开涉及计算机技术领域，具体涉及一种文字识别方法、装置、存储介质及电子设备。该方法包括：获取待识别的文本图像；将所述待识别的文本图像输入训练好的文字识别模型，得到文字识别结果，所述训练好的文字识别模型是通过文本图像训练集对初始的文字识别模型训练得到的，所述文本图像训练集包括多个携带有文本标签的目标文本图像，多个所述目标文本图像包括文本内容在不同文本图像展示形式下的图像。由于进行模型训练的文本图像训练集中包括不同的文字展示形式，提高了文字识别模型的文字识别效果，进而提高了文字识别结果的准确度。进而提高了文字识别结果的准确度。进而提高了文字识别结果的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
文字识别方法、装置、存储介质及电子设备

[0001]本公开涉及计算机
，具体涉及一种文字识别方法、装置、存储介质及电子设备。

技术介绍

[0002]当前各行业的信息化进程不断加快，文字识别技术在工作和学习的过程中发挥着越来越重要的作用，在文字识别技术的帮助下，可以大幅度提升工作和学习的效率，减轻负担。例如在教育场景中，书籍、试卷和幻灯片等常见的教学素材中往往包含大量的文字，诸如试卷题目归档、书籍转可编辑格式等常见的教学任务中均采用文字识别技术来提高效率。
[0003]然而，在很多场景下，文字的表现形式多种多样，并且常规的通过对文字进行拍照取样并进行识别的方法，均受限于拍照角度和教学素材本身的特性，使得拍照时易产生图像的畸变或者文字形态的扭曲，从而导致文字识别的准确率降低。

技术实现思路

[0004]为克服相关技术中存在的问题，本公开提供一种文字识别方法、装置、存储介质及电子设备。
[0005]根据本公开实施例的第一方面，提供一种文字识别方法，包括：
[0006]获取待识别的文本图像；
[0007]将所述待识别的文本图像输入训练好的文字识别模型，得到文字识别结果，所述训练好的文字识别模型是通过文本图像训练集对初始的文字识别模型训练得到的，所述文本图像训练集包括多个携带有文本标签的目标文本图像，多个所述目标文本图像包括文本内容在不同文本图像展示形式下的图像。
[0008]可选地，所述文本图像训练集通过以下步骤获得：
[0009]获取携带有文本标签的初始...

【技术保护点】

【技术特征摘要】
1.一种文字识别方法，其特征在于，包括：获取待识别的文本图像；将所述待识别的文本图像输入训练好的文字识别模型，得到文字识别结果，所述训练好的文字识别模型是通过文本图像训练集对初始的文字识别模型训练得到的，所述文本图像训练集包括多个携带有文本标签的目标文本图像，多个所述目标文本图像包括文本内容在不同文本图像展示形式下的图像。2.根据权利要求1所述的方法，其特征在于，所述文本图像训练集通过以下步骤获得：获取携带有文本标签的初始文本图像；随机调整所述初始文本图像中的文字的颜色，得到第一文本图像；融合所述第一文本图像以及预设类型的背景图像，获得第二文本图像；对所述第二文本图像进行图像增强处理，得到第三文本图像，所述图像增强处理包括图像对比度调节、图像亮度调节和文字扭曲度调节中的至少一种；将所述第二文本图像以及所述第三文本图像作为所述目标文本图像，获得所述文本图像训练集。3.根据权利要求2所述的方法，其特征在于，所述预设类型的背景图像包括扫描背景、纸张背景、高斯噪声背景以及混合背景，所述混合背景是基于所述纸张背景以及所述高斯噪声背景得到的；所述训练好的文字识别模型通过以下步骤得到：基于属于所述扫描背景的第二文本图像，对所述初始的文字识别模型进行训练，获得第一模型；基于属于所述扫描背景的第二文本图像以及所述第三文本图像，对所述第一模型进行训练，获得第二模型；基于属于所述纸张背景的第二文本图像以及属于所述高斯噪声背景的第二文本图像，对所述第二模型进行训练，获得第三模型；基于属于所述纸张背景的第二文本图像、属于所述高斯噪声背景的第二文本图像以及属于所述混合背景的第二文本图像，对所述第三模型进行训练，获得第四模型；基于属于所述扫描背景的第二文本图像、属于所述纸张背景的第二文本图像、属于所述高斯噪声背景的第二文本图像、属于所述混合背景的第二文本图像以及所述第三文本图像，对所述第四模型进行训练，获得所述训练好的文字识别模型。4.根据权利要求1
‑
3任一项所述的方法，其特征在于，所述文字识别模型包括特征提取网络、语义分割网络和序列识别网络，所述将所述待识别的文本图像输入训练好的文字识别模型，得到文字识别结果，包括：将所述待识别的文本图像输入所述特征提取网络，得到视觉特征向量；将所述视觉特征向量输入所述语义分割网络，得到语义分割向量，所述语义分割网络用于对所述视觉特征向量进行像素级别的语义分割处理；将所述视觉特征向量和所述语义分割向量输入所述序列识别网络，得到所述文字识别结果。5.根据权利...

【专利技术属性】
技术研发人员：王彦君，
申请(专利权)人：北京鼎事兴教育咨询有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人