对图像中的文本信息进行识别的方法及相关设备技术

技术编号:22330729 阅读:43 留言:0更新日期:2019-10-19 12:23
本发明专利技术公开了一种对图像中的文本信息进行识别的方法及相关设备,涉及图像识别领域,该方法包括:获取用户端发送的待识别的图像,提取所述图像的色阶图,将所述色阶图输入第一机器学习模型,获取由所述第一机器学习模型输出的优化后的色阶图,基于所述优化后的色阶图及相应的所述图像,获取优化的图像,基于光学字符识别OCR,获取所述优化的图像中包含的文本信息。该方法提高了OCR识别率。

Method and related equipment of text information recognition in image

【技术实现步骤摘要】
对图像中的文本信息进行识别的方法及相关设备
本专利技术涉及图像识别领域,特别是涉及对图像中的文本信息进行识别的方法及相关设备。
技术介绍
光学字符识别,简称OCR(OpticalCharacterRecognition),是对输入图像进行电子扫描并从中提取文字的过程,相比人工手打文字速度快,出错率低,能节省大量人力资源,还可用于各种领域的自动化识别如车牌识别、身份证识别、银行卡识别等。相应的,OCR识别率,即从图像中识别出文字的准确率。未识别出文字,已识别出文字的顺序,识别出来的文字是否正确都会对其产生影响。现有技术的缺陷在于,由于待识别图像的来源存在多方面的客观差异性,会出现难以识别待识别图像的情况,导致对待识别图像中的文本信息的识别造成一定困难。
技术实现思路
基于此,为解决相关技术中的OCR识别率低所面临的技术问题,本专利技术提供了一种对图像中的文本信息进行识别的方法及相关设备。第一方面,提供了一种对图像中的文本信息进行识别的方法,包括:获取用户端发送的待识别图像;提取所述图像的色阶图;将所述色阶图输入第一机器学习模型,获取由所述第一机器学习模型输出的优化后的色阶图;基于所述优化后的色阶图及相应的所述图像,获取优化的图像;基于光学字符识别OCR,获取所述优化的图像中包含的文本信息。在本公开的一示例性实施例中,在所述获取用户端发送的待识别图像之前包括:接收用户端发送的识别所述图像中的文本信息的请求;向用户端发送对所述待识别图像的预设要求。在本公开的一示例性实施例中,在所述提取所述图像的色阶图之前包括:将所述图像的输入第二机器学习模型,由第二机器学习模型输出所述图像是否曝光异常的判断结果,若第二机器学习模型输出的判断结果为曝光异常,则提取所述图像的色阶图,若第二机器学习模型输出的判断结果为曝光正常则将所述图像确定为所述优化的图像。在本公开的一示例性实施例中,所述第二机器学习模型通过以下方式训练:将预先识别出是否曝光异常的图像样本,输入第二机器学习模型,由第二机器学习模型输出是否曝光异常的判断结果,将第二机器学习模型输出的判断结果与预先识别出的结果相比较,如不一致则调整第二机器学习模型,使第二机器学习模型输出的判断结果与预先识别出的是否曝光异常的结果一致。在本公开的一示例性实施例中,所述提取所述图像的色阶图包括:将所述图像切分为预定数目个同等大小的区域;确定所述各区域的图像对应的色阶值;确定色阶值相同的所述区域的数目;将基于所述色阶值相同的所述区域数目和相应的色阶值得到的直方图、确定为所述图像的色阶图,所述直方图横轴方向表示色阶值、纵轴方向表示色阶值相同的所述区域数目。在本公开的一示例性实施例中,所述第一机器学习模型通过以下方式训练:将预先调好的图像色阶图及相应的未调整的图像色阶图样本,输入第一机器学习模型,由机器学习模型输出优化后的图像色阶图,将第一机器学习模型输出的优化后的图像色阶图与预先调好的图像色阶图相比较,如不一致,则调整第一机器学习模型,使第一机器学习模型输出的优化后的图像色阶图与预先调好的图像色阶图一致。在本公开的一示例性实施例中,所述基于所述优化后的色阶图及相应的所述图像,获取优化的图像包括:将所述图像的色阶按照所述优化后的色阶图进行调整,得到所述优化的图像。根据本公开的第二方面,提供了一种对图像中的文本信息进行识别的装置包括:第一获取模块:用于获取用户终端发送的待识别图像;第二获取模块:用于提取所述图像的色阶图;色阶图优化模块:用于将所述色阶图输入第一机器学习模型,获取由所述第一机器学习模型输出的优化后的色阶图;图像优化模块:用于基于所述优化后的色阶图及相应的所述图像,获取优化的图像;OCR识别模块:用于基于光学字符识别OCR,获取所述优化的图像中包含的文本信息。根据本公开的第三方面,提供了一种对图像中的文本信息进行识别的电子设备,包括:存储器,配置为存储可执行指令。处理器,配置为执行所述存储器中存储的可执行指令,以执行以上所述的方法。根据本公开的第四方面,提供一种计算机可读存储介质,其存储有计算机程序指令,当所述计算机指令被计算机执行时,使计算机执行以上所述的方法。与传统技术中通过提高获取图像质量的方式来提高OCR的识别率相比,本公开的实施例通过获取用户端发送的待识别图像,提取所述图像的色阶图,将所述色阶图输入第一机器学习模型,获取由所述第一机器学习模型输出的优化后的色阶图,基于所述优化后的色阶图及相应的所述图像,获取优化的图像,基于光学字符识别OCR,获取所述优化的图像中包含的文本信息,提高了OCR对图像中文本信息的识别率。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。附图说明图1示出根据本公开一示例实施方式的对图像中的文本信息进行识别的流程图。图2示出根据本公开一示例实施方式的对图像中的文本信息进行识别的装置。图3示出根据本公开一示例实施方式的在获取用户端发送的待识别图像之前的详细流程图。图4示出根据本公开一示例实施方式的在提取所述图像的色阶图之前的详细流程图。图5示出根据本公开一示例实施方式的提取所述图像的色阶图的详细流程图。图6示出根据本公开一示例实施方式的对图像中的文本信息进行识别的系统架构图。图7示出根据本公开一示例实施方式的对图像中的文本信息进行识别的电子设备图。图8示出根据本公开一示例实施方式的对图像中的文本信息进行识别的计算机可读存储介质图。具体实施方式现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。本公开的目的在于从技术方面提高OCR识别率。根据本公开一实施例的对图像中的文本信息进行识别的方法,包括:获取用户端发送的待识别图像;提取所述图像的色阶图;将所述色阶图输入第一机器学习模型,获取由所述第一机器学习模型输出的优化后的色阶图;基于所述优化后的色阶图及相应的所述图像,获取优化的图像;基于光学字符识别OCR,获取所述优化的图像中包含的文本信息。与传统技术中通过提高获取图像的质量来提高OCR的识别率相比,本公开的实施例通过提取待识别图像的色阶图;将所述色阶图输入第一机器学习模型,获取由所本文档来自技高网...

【技术保护点】
1.一种对图像中的文本信息进行识别的方法,其特征在于,所述方法包括:获取用户端发送的待识别的图像;提取所述图像的色阶图;将所述色阶图输入第一机器学习模型,获取由所述第一机器学习模型输出的优化后的色阶图;基于所述优化后的色阶图及相应的所述图像,获取优化的图像;基于光学字符识别OCR,获取所述优化的图像中包含的文本信息。

【技术特征摘要】
1.一种对图像中的文本信息进行识别的方法,其特征在于,所述方法包括:获取用户端发送的待识别的图像;提取所述图像的色阶图;将所述色阶图输入第一机器学习模型,获取由所述第一机器学习模型输出的优化后的色阶图;基于所述优化后的色阶图及相应的所述图像,获取优化的图像;基于光学字符识别OCR,获取所述优化的图像中包含的文本信息。2.根据权利要求1所述的方法,其特征在于,在所述获取用户端发送的待识别图像之前包括:接收用户端发送的识别所述图像中的文本信息的请求;向所述用户端发送对所述待识别图像的预设要求。3.根据权利要求1所述的方法,其特征在于,在所述提取所述图像的色阶图之前包括:将所述图像输入第二机器学习模型,由第二机器学习模型输出所述图像是否曝光异常的判断结果,若第二机器学习模型输出的判断结果为曝光异常,则提取所述图像的色阶图,若第二机器学习模型输出的判断结果为曝光正常则将所述图像确定为所述优化的图像。4.根据权利要求3所述的方法,其特征在于,所述第二机器学习模型通过以下方式训练:将预先识别出是否曝光异常的图像样本,输入第二机器学习模型,由第二机器学习模型输出是否曝光异常的判断结果,将第二机器学习模型输出的判断结果与预先识别出的结果相比较,如不一致则调整第二机器学习模型,使第二机器学习模型输出的判断结果与预先识别出的是否曝光异常的结果一致。5.根据权利要求1所述的方法,其特征在于,所述提取所述图像的色阶图包括:将所述图像切分为预定数目个同等大小的区域;确定所述各区域的图像对应的色阶值;确定色阶值相同的所述区域的数目;将基于所述色阶值相同的所述区域数目和相应的色阶值得到...

【专利技术属性】
技术研发人员:张克明
申请(专利权)人:平安普惠企业管理有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1