【技术实现步骤摘要】
文本识别方法、装置、电子设备及存储介质
[0001]本专利技术涉及计算机
,尤其涉及一种文本识别方法、装置、电子设备及存储介质。
技术介绍
[0002]光学字符识别(OCR,Optical Character Recognition)技术可以用于识别图像中的文本内容,在高并发场景下,OCR文本识别模型处理速度慢。相关技术解决高并发问题的方案包括:系统拆分、缓存机制和消息队列。上述相关技术的方案主要是针对结构化数据的,与OCR文本检测与识别场景使用的服务器资源是不一样的,结构化数据使用的资源是数据库、服务器集群等,但是OCR文本检测与识别服务使用的资源主要是单机单卡,所以相关技术解决高并发问题的方案并不适合OCR文本检测与识别场景。
技术实现思路
[0003]有鉴于此,本专利技术实施例提供了一种文本识别方法、装置、电子设备及存储介质,旨在提高对图像进行文本识别的处理速度,解决高并发问题。
[0004]本专利技术实施例的技术方案是这样实现的:
[0005]一方面,本专利技术实施例提供了一种文 ...
【技术保护点】
【技术特征摘要】
1.一种文本识别方法,其特征在于,所述方法包括:确定第一数据库中是否包括待识别图像的第一编码值;所述第一数据库存储有已识别图像的第一编码值和文本识别结果;若所述第一数据库不包括所述待识别图像的第一编码值,则确定所述待识别图像的每个图像块的文本检测框;所述图像块由所述待识别图像进行图像切割后得到;确定每个图像块的文本检测框中的检测框图像的第二编码值是否与第二数据库匹配;所述第二数据库存储有已识别图像对应的检测框图像的文本识别结果和第二编码值;从所述第二数据库中获取匹配成功的检测框图像的文本识别结果。2.根据权利要求1所述的方法,其特征在于,所述确定所述待识别图像的每个图像块的文本检测框,包括:确定每个图像块的第三编码值是否与第三数据库匹配;所述第三数据库存储有已识别图像的图像块的第三编码值和文本检测框;若匹配成功的图像块的数量大于或等于设定值,则从所述第三数据库中获取匹配成功的图像块的文本检测框,并对匹配失败的图像块进行文本检测,得到匹配失败的图像块的文本检测框。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:对匹配失败的检测框图像进行文本识别,得到匹配失败的检测框图像的文本识别结果。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:将所述匹配失败的图像块的文本检测框和第三编码值存入所述第三数据库;在所述第三数据库中为新存入的数据设置生命周期。5.根据权利要求2所述的方法,其特征在于,在对匹配失败的图像块进行文本检测,得到匹配失败的图像块的文本检测框之后,所述方法还包括:将得到的匹配失败的图像块的文本检测框的坐标,转换为相对于所述待识别图像的坐标。6.根据权利要求2所述的方法,其特征在于,所述方法还包括:若匹配成功的图像块的数量小于所述设定值,则对所述待识别图像进行文本检测,得到所述待识别图像对应的多个文本检测框;将所述多个文本检测框分配给所述待识别图像的图像块。7.根据权利要求3所述的方法,其特征在...
【专利技术属性】
技术研发人员:李一龙,王银婷,
申请(专利权)人:中国移动通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。