文本识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:27773048 阅读:40 留言:0更新日期:2021-03-23 12:57
本申请公开了一种文本识别方法、装置、电子设备及存储介质,该方法包括获取待识别文本图像;基于预先构建的文本检测网络,提取待识别文本图像的特征图,并对经过融合的特征图进行文字像素分类,生成至少一个候选文本框,其中文本检测网络包括第一特征提取层、第二特征提取层和第三特征提取层,第二特征提取层上采样第一特征提取层的输出结果,第三特征提取层下采样第二特征提取层的输出结果;根据预设目标文本格式,筛选候选文本框得到目标文本框,并对目标文本框进行识别,得到识别结果。基于此,本申请能够同时利用低层特征的高分辨率信息以及高层特征的高语义信息,使得文本像素位置检测更加精确,提升了文本识别准确度和效率。

【技术实现步骤摘要】
文本识别方法、装置、电子设备及存储介质
本申请一般涉及图像处理
,具体涉及一种文本识别方法、装置、电子设备及存储介质。
技术介绍
智能取餐柜又称配送点餐系统,主要用于储存快餐食物,方便了人们的日常生活。实际使用时,智能取餐柜可以通过按键和扫描取餐码等方式对用户身份进行验证,从而完成取餐。在实现本专利技术的过程中,专利技术人发现相关技术识别取餐码的准确度低,尤其是当取餐码上存在旋转或者弯曲角度的文本时,误差更大,同时检测所消耗的时间长。
技术实现思路
鉴于相关技术中的上述缺陷或不足,期望提供一种文本识别方法、装置、电子设备及存储介质,能够提升文本识别准确度和效率。第一方面,本申请提供一种文本识别方法,所述方法包括:获取待识别文本图像;基于预先构建的文本检测网络,提取所述待识别文本图像的特征图,并对经过融合的所述特征图进行文字像素分类,生成至少一个候选文本框,其中所述文本检测网络包括第一特征提取层、第二特征提取层和第三特征提取层,所述第二特征提取层上采样所述第一特征提取层的输出结果,所述第三本文档来自技高网...

【技术保护点】
1.一种文本识别方法,其特征在于,所述方法包括:/n获取待识别文本图像;/n基于预先构建的文本检测网络,提取所述待识别文本图像的特征图,并对经过融合的所述特征图进行文字像素分类,生成至少一个候选文本框,其中所述文本检测网络包括第一特征提取层、第二特征提取层和第三特征提取层,所述第二特征提取层上采样所述第一特征提取层的输出结果,所述第三特征提取层下采样所述第二特征提取层的输出结果;/n根据预设目标文本格式,筛选所述候选文本框得到目标文本框,并对所述目标文本框进行识别,得到识别结果。/n

【技术特征摘要】
1.一种文本识别方法,其特征在于,所述方法包括:
获取待识别文本图像;
基于预先构建的文本检测网络,提取所述待识别文本图像的特征图,并对经过融合的所述特征图进行文字像素分类,生成至少一个候选文本框,其中所述文本检测网络包括第一特征提取层、第二特征提取层和第三特征提取层,所述第二特征提取层上采样所述第一特征提取层的输出结果,所述第三特征提取层下采样所述第二特征提取层的输出结果;
根据预设目标文本格式,筛选所述候选文本框得到目标文本框,并对所述目标文本框进行识别,得到识别结果。


2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述第一特征提取层的输出结果进行残差特征增强处理,得到比率不变的上下文信息。


3.根据权利要求1所述的方法,其特征在于,所述根据预设目标文本格式,筛选所述候选文本框得到目标文本框,包括:
获取所述目标文本格式中字符类型和数目;
遍历所述候选文本框中的字符,确定与所述字符类型和数目均相同的文本框作为所述目标文本框。


4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
检测所述候选文本框的宽高比例,若所述宽高比例与第一预设阈值不同,则滤除所述候选文本框;和/或,
检测所述候选文本框中文字像素的数目,若所述文字像素的数目与第二预设阈值不同,则滤除所述候选文本框。


5.根据权利要求3至4中任意一项所述的方法,其特征在于,所述方法还包括:
计算所述目标文本框的边缘和角点;
当所述边缘和角点存在形变时,校正所述目标文本框得到标准文本框。

【专利技术属性】
技术研发人员:胡鹏黄光伟
申请(专利权)人:京东方科技集团股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1