图像中的字符识别方法、装置及相关设备制造方法及图纸

技术编号:38969385 阅读:15 留言:0更新日期:2023-09-28 09:32
本发明专利技术公开了一种图像中的字符识别方法、装置及相关设备,涉及图像识别技术领域,以解决OCR模型对铭牌信息的识别精确度较低的问题。该方法包括:将第一图像输入至旋转检测模型进行检测,确定目标字符区域,目标字符区域为第一图像中的部分或全部字符区域;将第一图像中与目标字符区域对应的第二图像输入至OCR模型中进行字符识别,得到第二图像中包含的第一字符内容;将第一字符内容输入至NLP模型中进行字符校验处理,得到第二字符内容,第二字符内容为第一字符经过字符校验处理后的字符内容;基于第二字符内容确定目标字符区域的识别结果。本发明专利技术实施例可提高OCR模型对铭牌信息的识别精确度。息的识别精确度。息的识别精确度。

【技术实现步骤摘要】
图像中的字符识别方法、装置及相关设备


[0001]本专利技术涉及图像识别
,尤其涉及一种图像中的字符识别方法、装置及相关设备。

技术介绍

[0002]光学字符识别(Optical Character Recognition,OCR)技术是指电子设备通过检测暗、亮的模式确定图片或纸张上的各种形状,然后用字符识别方法将形状翻译成计算机文字的过程。
[0003]OCR技术可以用于对基站的铭牌图片进行智能识别,即通过对拍摄到的铭牌图片进行光学字符识别,得到图片中的铭牌对应的基站设备信息。为了提高对图片中铭牌信息识别的准确性,通常要求拍摄到的图片质量较高,且图片中的铭牌信息较为清晰。
[0004]目前,由于基站现场环境复杂,使得人工拍摄的难度较大,因此拍摄到的铭牌图片清晰度通常较低。OCR技术对于图片的清晰度要求较高,因此图片清晰度较低会导致OCR模型对铭牌信息的识别精确度较低。

技术实现思路

[0005]本专利技术实施例提供一种图像中的字符识别方法、装置及相关设备,以解决OCR模型对铭牌信息的识别精确度较低的问题。
[0006]第一方面,本专利技术实施例提供了一种图像中的字符识别方法,包括:
[0007]将第一图像输入至旋转检测模型进行检测,确定目标字符区域,所述目标字符区域为所述第一图像中的部分或全部字符区域;
[0008]将所述第一图像中与所述目标字符区域对应的第二图像输入至光学字符识别OCR模型中进行字符识别,得到所述第二图像中包含的第一字符内容;
[0009]将所述第一字符内容输入至自然语言处理NLP模型中进行字符校验处理,得到第二字符内容,所述第二字符内容为所述第一字符经过字符校验处理后的字符内容;
[0010]基于所述第二字符内容确定所述目标字符区域的识别结果。
[0011]可选地,所述基于所述第二字符内容确定所述目标字符区域的识别结果,包括:
[0012]将所述第二字符内容与目标预存字符库进行对比;
[0013]在所述第二字符内容与所述目标预存字符库匹配的情况下,将所述第二字符内容确定为所述目标字符区域的识别结果。
[0014]可选地,所述将所述第二字符内容与目标预存字符库进行对比,包括:
[0015]根据所述第二字符内容确定设备种类;
[0016]将所述设备种类对应的预存字符库确定为目标预存字符库;
[0017]将所述第二字符内容与所述目标预存字符库进行对比。
[0018]可选地,所述将所述第一图像中与所述目标字符区域对应的第二图像输入至光学字符识别OCR模型中进行字符识别,得到所述第二图像中包含的第一字符内容之前,所述方
法还包括:
[0019]将所述第一图像中与所述目标字符区域对应的部分图像确定为中间图像;
[0020]对所述中间图像进行仿射变换,得到第二图像。
[0021]可选地,所述将第一图像输入至旋转检测模型进行检测,确定目标字符区域,包括:
[0022]将第一图像输入至包围框的边缘感知向量BBAVectors旋转检测模型进行检测,确定目标字符区域。
[0023]可选地,所述BBAVectors旋转检测模型包括至少两个卷积层,所述至少两个卷积层中至少一个卷积层为空洞卷积。
[0024]可选地,所述将所述第一字符内容输入至自然语言处理NLP模型中进行字符校验处理,得到第二字符内容,包括:
[0025]将所述字符内容输入至连续词袋CBOW模型中进行字符校验处理,得到第二字符内容。
[0026]第二方面,本专利技术实施例还提供一种图像中的字符识别装置,包括:
[0027]第一确定模块,用于将第一图像输入至旋转检测模型进行检测,确定目标字符区域,所述目标字符区域为所述第一图像中的部分或全部字符区域;
[0028]第一输入模块,用于将所述第一图像中与所述目标字符区域对应的第二图像输入至OCR模型中进行字符识别,得到所述第二图像中包含的第一字符内容;
[0029]第二输入模块,用于将所述第一字符内容输入至NLP模型中进行字符校验处理,得到第二字符内容,所述第二字符内容为所述第一字符经过字符校验处理后的字符内容;
[0030]第二确定模块,用于基于所述第二字符内容确定所述目标字符区域的识别结果。
[0031]第三方面,本专利技术实施例还提供一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的方法中的步骤。
[0032]第四方面,本专利技术实施例还提供一种可读存储介质,所述计可读存储介质上存储程序,所述程序被处理器执行时实现如第一方面所述的方法中的步骤。
[0033]在本专利技术实施例提供的图像中的字符识别方法中,将第一图像输入至旋转检测模型进行检测,由于旋转检测模型使用旋转包围框来进行区域的选择,可以减小所述目标字符区域内无效区域的占比,提升了所述OCR模型对所述目标字符区域进行识别的准确度。同时,在通过OCR模型得到第一字符内容后,将所述第一字符内容输入至NLP模型中进行字符校验处理,可以对所述第一字符内容进行纠错或补全,进一步地提高了所述第二字符内容的准确度。因此,通过上述设置,提高了对图像中的字符进行识别的准确度。
附图说明
[0034]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0035]图1是本专利技术实施例提供的图像中的字符识别方法的流程图之一;
[0036]图2a是带方向的包围框的表示方式之一;
[0037]图2b是带方向的包围框的表示方式之二;
[0038]图2c是边角案例的示例图;
[0039]图3是本专利技术实施例提供的BBAVectors旋转检测模型的结构示意图;
[0040]图4a是本专利技术实施例提供的中间图像的形状示意图;
[0041]图4b是本专利技术实施例提供的仿射变换示意图;
[0042]图4c是本专利技术实施例提供的第二图像的形状示意图;
[0043]图5是本专利技术实施例提供的连续词袋模型的结构示意图;
[0044]图6是本专利技术实施例提供的跳字模型的结构示意图;
[0045]图7是本专利技术实施例提供的图像中的字符识别方法的流程图之二;
[0046]图8是本专利技术实施例提供的图像中的字符识别装置的结构示意图;
[0047]图9是本专利技术实施例提供的电子设备的结构示意图。
具体实施方式
[0048]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像中的字符识别方法,其特征在于,包括:将第一图像输入至旋转检测模型进行检测,确定目标字符区域,所述目标字符区域为所述第一图像中的部分或全部字符区域;将所述第一图像中与所述目标字符区域对应的第二图像输入至光学字符识别OCR模型中进行字符识别,得到所述第二图像中包含的第一字符内容;将所述第一字符内容输入至自然语言处理NLP模型中进行字符校验处理,得到第二字符内容,所述第二字符内容为所述第一字符经过字符校验处理后的字符内容;基于所述第二字符内容确定所述目标字符区域的识别结果。2.根据权利要求1所述的方法,其特征在于,所述基于所述第二字符内容确定所述目标字符区域的识别结果,包括:将所述第二字符内容与目标预存字符库进行对比;在所述第二字符内容与所述目标预存字符库匹配的情况下,将所述第二字符内容确定为所述目标字符区域的识别结果。3.根据权利要求2所述的方法,其特征在于,所述将所述第二字符内容与目标预存字符库进行对比,包括:根据所述第二字符内容确定设备种类;将所述设备种类对应的预存字符库确定为目标预存字符库;将所述第二字符内容与所述目标预存字符库进行对比。4.根据权利要求1所述的方法,其特征在于,所述将所述第一图像中与所述目标字符区域对应的第二图像输入至光学字符识别OCR模型中进行字符识别,得到所述第二图像中包含的第一字符内容之前,所述方法还包括:将所述第一图像中与所述目标字符区域对应的部分图像确定为中间图像;对所述中间图像进行仿射变换,得到第二图像。5.根据权利要求1所述的方法,其特征在于,所述将第一图像输入至旋转检测模型进行检测,...

【专利技术属性】
技术研发人员:纪拓黄文辉冯俊兰邓超
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1