文本识别方法及装置制造方法及图纸

技术编号：31318587 阅读：11 留言：0更新日期：2021-12-13 00:00

本申请提供文本识别方法及装置，其中所述文本识别方法包括：获取待识别文本；将所述待识别文本输入至识别模块进行处理，获得所述待识别文本中目标字符，以及所述目标字符对应的文本框；建立所述目标字符与所述文本框的位置关系，并根据所述位置关系生成所述待识别文本对应的目标文本。对应的目标文本。对应的目标文本。

全部详细技术资料下载

【技术实现步骤摘要】
文本识别方法及装置

[0001]本申请涉及人工智能
，特别涉及一种文本识别方法。本申请同时涉及一种文本识别装置、一种计算设备，以及一种计算机可读存储介质。

技术介绍

[0002]随着互联网技术的发展，文本识别功能成为了大多数业务场景中不可缺少的一项技术，如拍照搜题场景，档案录入场景，纸质信息电子化场景，文档格式转换场景等，都会涉及到文本识别技术。而文本识别的精准度在各个业务场景中都显得尤为重要。现有技术中，在文档格式转换场景中，针对文本识别需求大多数采用OCR识别技术；然而随着对识别精准度的需求提高，OCR识别技术很难满足大多数场景的识别精准度需求，因此亟需一种有效的方案以解决上述问题。

技术实现思路

[0003]有鉴于此，本申请实施例提供了一种文本识别方法，以解决现有技术中存在的技术缺陷。本申请实施例同时提供了一种文本识别装置，一种计算设备，以及一种计算机可读存储介质。
[0004]根据本申请实施例的第一方面，提供了一种文本识别方法，包括：
[0005]获取待识别文本；
[0006]将所述待识别文本输入至识别模块进行处理，获得所述待识别文本中目标字符，以及所述目标字符对应的文本框；
[0007]建立所述目标字符与所述文本框的位置关系，并根据所述位置关系生成所述待识别文本对应的目标文本。
[0008]可选地，所述将所述待识别文本输入至识别模块进行处理，获得所述待识别文本中目标字符，包括：
[0009]将所述待识别文本输入至所述识别模块，通过所述识别...

【技术保护点】

【技术特征摘要】
1.一种文本识别方法，其特征在于，包括：获取待识别文本；将所述待识别文本输入至识别模块进行处理，获得所述待识别文本中目标字符，以及所述目标字符对应的文本框；建立所述目标字符与所述文本框的位置关系，并根据所述位置关系生成所述待识别文本对应的目标文本。2.根据权利要求1所述的文本识别方法，其特征在于，所述将所述待识别文本输入至识别模块进行处理，获得所述待识别文本中目标字符，包括：将所述待识别文本输入至所述识别模块，通过所述识别模块中的字符识别单元进行处理获得初始字符以及所述初始字符对应的字符坐标；计算所述字符坐标之间的坐标相似度，根据计算结果筛选目标字符坐标；基于所述目标字符坐标在所述初始字符中筛选出所述目标字符，并通过所述识别模块输出。3.根据权利要求1所述的文本识别方法，其特征在于，所述将所述待识别文本输入至识别模块进行处理，获得所述目标字符对应的文本框，包括：将所述待识别文本输入至所述识别模块，通过所述识别模块中的文本处理单元进行处理获得文本图片以及所述文本图片对应的尺寸信息；检测所述文本图片中包含的文本组成元素，并基于所述尺寸信息创建所述文本组成元素对应的文本框；将所述文本组成元素对应的文本框作为所述目标字符对应的文本框，并通过所述识别模块输出。4.根据权利要求3所述的文本识别方法，其特征在于，所述文本组成元素包括下述至少一项：页眉、页脚、文本行；相应的，所述基于所述尺寸信息创建所述文本组成元素对应的文本框，包括：基于所述尺寸信息确定所述页眉对应的页眉坐标、所述页脚对应的页脚坐标，以及所述文本行对应的文本行坐标；根据所述页眉坐标创建页眉文本框、根据所述页脚坐标创建页脚文本框，以及根据所述文本行坐标创建文本行文本框；将所述页眉文本框、所述页脚文本框以及所述文本行文本框作为所述文本组成元素对应的文本框。5.根据权利要求1
‑
4中任意一项所述的文本识别方法，其特征在于，所述建立所述目标字符与所述文本框的位置关系步骤执行之前，还包括：确定所述目标字符对应的字符坐标信息以及所述文本框对应的文本框坐标信息；相应的，所述建立所述目标字符与所述文本框的位置关系，包括：基于所述字符坐标信息和所述文本框坐标信息建立所述目标字符与所述文本框的...

【专利技术属性】
技术研发人员：徐支勇，李长亮，
申请(专利权)人：北京金山数字娱乐科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人