图像文本识别方法、装置、计算机设备及计算机存储介质制造方法及图纸

技术编号：24458532 阅读：24 留言：0更新日期：2020-06-10 16:17

本申请公开了一种图像文本识别方法、装置及计算机存储介质，涉及计算机技术领域，针对场景复杂的图像，能够对文本识别结果进行结构化处理，提高图像文本识别的准确率。所述方法包括：获取待识别图像，对所述待识别图像进行预处理，得到目标识别图像；基于预先训练的文本区域检测模型，确定所述目标识别图像中文本区域的位置信息；将所述目标识别图像以及所述目标识别图像中文本区域的位置信息输入至预先训练的文本识别模型中，得到文本区域中的文本信息；对所述文本区域中的文本信息进行结构化处理，得到具有映射关系的文本字段。

Image text recognition method, device, computer equipment and computer storage medium

全部详细技术资料下载

【技术实现步骤摘要】
图像文本识别方法、装置、计算机设备及计算机存储介质
本专利技术涉及计算机
，尤其是涉及到图像文本识别方法、装置、计算机设备及计算机存储介质。
技术介绍
随着科技的发展，图像在信息传播方面起到极大的作用。为了更好地起到宣传作用，越来越多的图像中被加入文本，例如，在涉及医疗交易平台，医疗机构需要用户上传发票图像，从而基于上传发票图像中的文本内容对发票进行核对。因此，由于图像中的文本通常包含着比较丰富的信息，对图像中的文本进行提取和识别，对于图像内容的分析、理解和信息检索等方面具有重要的意义。现有的图像文本识别方法，一般首先检测图像中的文本信息框，然后对检测到的文本信息框进行识别，最后返回识别得到的结果，达到自动化识别，节省人力录入成本。然而，在实际应用场景的图像中，存在复杂多样的图像内容，发票类图像或很多自然图像中的文本，通常受到不规则图像背景内容的影响，使得采用现有的图像文本识别方法存在很多漏检、误检的情况，识别准确率较低，从而导致最终的文本识别结果不全，识别得到的字段与所需字段无法对应的问题，严重影响后续的文本使用。
技术实现思路
有鉴于此，本专利技术提供了一种图像文本识别方法、装置、计算机设备及计算机存储介质，主要目的在于解决目前针对场景复杂的图像文本识别准确率较低的问题。依据本专利技术一个方面，提供了一种图像文本识别方法，该方法包括：获取待识别图像，对所述待识别图像进行预处理，得到目标识别图像；基于预先训练的文本区域检测模型，确定所述目标识别图像中...

【技术保护点】
1.一种图像文本识别方法，其特征在于，所述方法包括：/n获取待识别图像，对所述待识别图像进行预处理，得到目标识别图像；/n基于预先训练的文本区域检测模型，确定所述目标识别图像中文本区域的位置信息；/n将所述目标识别图像以及所述目标识别图像中文本区域的位置信息输入至预先训练的文本识别模型中，得到文本区域中的文本信息；/n对所述文本区域中的文本信息进行结构化处理，得到具有映射关系的文本字段。/n

【技术特征摘要】
1.一种图像文本识别方法，其特征在于，所述方法包括：
获取待识别图像，对所述待识别图像进行预处理，得到目标识别图像；
基于预先训练的文本区域检测模型，确定所述目标识别图像中文本区域的位置信息；
将所述目标识别图像以及所述目标识别图像中文本区域的位置信息输入至预先训练的文本识别模型中，得到文本区域中的文本信息；
对所述文本区域中的文本信息进行结构化处理，得到具有映射关系的文本字段。

2.根据权利要求1所述的方法，其特征在于，所述对所述文本区域中的文本信息进行结构化处理，得到具有映射关系的文本字段，具体包括：
从所述文本区域中的文本信息中选取预设字段作为关键字段，获取所述关键字段对应文本区域的位置信息；
根据所述关键字段对应文本区域的位置信息，确定与所述关键字段具有映射关系的模糊区域；
检测并查询所述模糊区域内所识别得到的文本信息，确认与所述关键字段具有映射关系的文本信息。

3.根据权利要求2所述的方法，其特征在于，所述根据所述关键字段对应文本区域的位置信息，确定与所述关键字段具有映射关系的模糊区域，具体包括：
将所述关键字段对应文本区域沿水平和垂直方向移动预设距离，根据所述关键字段对应的文本区域的位置信息，获取移动后文本区域的位置信息；
基于所述移动后文本区域的位置信息，对所述移动预设距离后文本区域进行放大处理，确定与所述关键字段具有映射关系的模糊区域。

4.根据权利要求2所述的方法，其特征在于，所述检测并查询所述模糊区域内所识别得到的文本信息，确认与所述关键字段具有映射关系的文本信息，具体包括：
检测位于所述模糊区域内所有文本区域的位置信息，并提取模糊区域内所有文本区域的文本信息；
采用正则匹配的方式遍历模糊区域内每个文本区域的文本信息，确认与所述关键字段具有映射关系的文本信息。

5.根据权利要求4所述的方法，其特征在于，所述采用正则匹配的方式遍历模糊区域内每个文本区域的文本信息，确认与所述关键字段具有映射关系的文本信息，具体包括：
通过获取适用于关键字段的模式字符，构造与关键字段相匹配的正则表达式；
根据所述与关键字段相匹配的正则表达式，对模糊区域内每个文本区域的文本信息进行校验，确认与所述关键字段具有映射关系的文...

【专利技术属性】
技术研发人员：刘舒萍，
申请(专利权)人：平安医疗健康管理股份有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人