对图像中的文本信息进行识别的方法及相关设备技术

技术编号：22330729 阅读：43 留言：0更新日期：2019-10-19 12:23

本发明专利技术公开了一种对图像中的文本信息进行识别的方法及相关设备，涉及图像识别领域，该方法包括：获取用户端发送的待识别的图像，提取所述图像的色阶图，将所述色阶图输入第一机器学习模型，获取由所述第一机器学习模型输出的优化后的色阶图，基于所述优化后的色阶图及相应的所述图像，获取优化的图像，基于光学字符识别OCR，获取所述优化的图像中包含的文本信息。该方法提高了OCR识别率。

Method and related equipment of text information recognition in image

全部详细技术资料下载

【技术实现步骤摘要】
对图像中的文本信息进行识别的方法及相关设备
本专利技术涉及图像识别领域，特别是涉及对图像中的文本信息进行识别的方法及相关设备。
技术介绍
光学字符识别，简称OCR(OpticalCharacterRecognition)，是对输入图像进行电子扫描并从中提取文字的过程，相比人工手打文字速度快，出错率低，能节省大量人力资源，还可用于各种领域的自动化识别如车牌识别、身份证识别、银行卡识别等。相应的，OCR识别率，即从图像中识别出文字的准确率。未识别出文字，已识别出文字的顺序，识别出来的文字是否正确都会对其产生影响。现有技术的缺陷在于，由于待识别图像的来源存在多方面的客观差异性，会出现难以识别待识别图像的情况，导致对待识别图像中的文本信息的识别造成一定困难。
技术实现思路
基于此，为解决相关技术中的OCR识别率低所面临的技术问题，本专利技术提供了一种对图像中的文本信息进行识别的方法及相关设备。第一方面，提供了一种对图像中的文本信息进行识别的方法，包括：获取用户端发送的待识别图像；提取所述图像的色阶图；将所述色阶图输入第一机器学习模型，获取由所述第一机器学习模型输出的优化后的色阶图；基于所述优化后的色阶图及相应的所述图像，获取优化的图像；基于光学字符识别OCR，获取所述优化的图像中包含的文本信息。在本公开的一示例性实施例中，在所述获取用户端发送的待识别图像之前包括：接收用户端发送的识别所述图像中的文本信息的请求；向用户端发送对所述待识别图像的预设要求。在本公开的一示例性实施例中，在所述提取所述图像的色阶图之前包括：将所述图像的输入第二机器学习模型，由第二机器学习模型输出...

【技术保护点】
1.一种对图像中的文本信息进行识别的方法，其特征在于，所述方法包括：获取用户端发送的待识别的图像；提取所述图像的色阶图；将所述色阶图输入第一机器学习模型，获取由所述第一机器学习模型输出的优化后的色阶图；基于所述优化后的色阶图及相应的所述图像，获取优化的图像；基于光学字符识别OCR，获取所述优化的图像中包含的文本信息。

【技术特征摘要】
1.一种对图像中的文本信息进行识别的方法，其特征在于，所述方法包括：获取用户端发送的待识别的图像；提取所述图像的色阶图；将所述色阶图输入第一机器学习模型，获取由所述第一机器学习模型输出的优化后的色阶图；基于所述优化后的色阶图及相应的所述图像，获取优化的图像；基于光学字符识别OCR，获取所述优化的图像中包含的文本信息。2.根据权利要求1所述的方法，其特征在于，在所述获取用户端发送的待识别图像之前包括：接收用户端发送的识别所述图像中的文本信息的请求；向所述用户端发送对所述待识别图像的预设要求。3.根据权利要求1所述的方法，其特征在于，在所述提取所述图像的色阶图之前包括：将所述图像输入第二机器学习模型，由第二机器学习模型输出所述图像是否曝光异常的判断结果，若第二机器学习模型输出的判断结果为曝光异常，则提取所述图像的色阶图，若第二机器学习模型输出的判断结果为曝光正常则将所述图像确定为所述优化的图像。4.根据权利要求3所述的方法，其特征在于，所述第二机器学习模型通过以下方式训练：将预先识别出是否曝光异常的图像样本，输入第二机器学习模型，由第二机器学习模型输出是否曝光异常的判断结果，将第二机器学习模型输出的判断结果与预先识别出的结果相比较，如不一致则调整第二机器学习模型，使第二机器学习模型输出的判断结果与预先识别出的是否曝光异常的结果一致。5.根据权利要求1所述的方法，其特征在于，所述提取所述图像的色阶图包括：将所述图像切分为预定数目个同等大小的区域；确定所述各区域的图像对应的色阶值；确定色阶值相同的所述区域的数目；将基于所述色阶值相同的所述区域数目和相应的色阶值得到...

【专利技术属性】
技术研发人员：张克明，
申请(专利权)人：平安普惠企业管理有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人