【技术实现步骤摘要】
文字识别方法、装置、电子设备及存储介质
本申请涉及数据处理
,具体涉及一种文字识别方法、装置、电子设备及存储介质。
技术介绍
文字识别作为计算机视觉中的一种常用技术,被广泛应用于文档分析、证照识别、街景识别、资质审核、自动录入等场景中,为人们的日常生活和工作提供了很大的便利。但是现有技术依然存在着很多不足之处,如现有文字识别的方法对比较标准的水平或垂直文字行能够有效识别,但是,针对不规则排列的文字,识别效果普遍不好,识别正确率较低,仅能识别其中部分弯曲、倾斜的文字行,而在中文文字图像中,不规则的排列比其他一些字母文字(例如英文、法文等)更加显著,针对这种不规则的文字,现有技术还缺乏有效的解决方案。
技术实现思路
鉴于上述问题,提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的文字识别方法、装置、电子设备及存储介质。依据本申请的一个方面,提供了一种文字识别方法,该方法包括:提取目标图像的纹理特征;基于第一类注意力机制对纹理特征进行过滤,得到注意力增强特征,其中,第 ...
【技术保护点】
1.一种文字识别方法,其特征在于,包括:/n提取目标图像的纹理特征;/n基于第一类注意力机制对所述纹理特征进行过滤,得到注意力增强特征,其中,所述第一类注意力机制包括空间注意力机制和/或通道注意力机制;/n基于第二类注意力机制和所述注意力增强特征得到文字识别结果,其中,所述第二类注意力机制包括互注意力机制。/n
【技术特征摘要】
1.一种文字识别方法,其特征在于,包括:
提取目标图像的纹理特征;
基于第一类注意力机制对所述纹理特征进行过滤,得到注意力增强特征,其中,所述第一类注意力机制包括空间注意力机制和/或通道注意力机制;
基于第二类注意力机制和所述注意力增强特征得到文字识别结果,其中,所述第二类注意力机制包括互注意力机制。
2.根据权利要求1所述的方法,其特征在于,所述基于第一类注意力机制对所述纹理特征进行过滤,得到注意力增强特征包括:
基于所述第一类注意力机制生成所述纹理特征的信息矫正掩模;
将生成的各信息矫正掩模分别与所述纹理特征进行融合,得到相应的注意力增强特征。
3.根据权利要求1所述的方法,其特征在于,所述第一类注意力机制还包括全局注意力机制和/或局部注意力机制。
4.根据权利要求3所述的方法,其特征在于,所述基于第二类注意力机制和所述注意力增强特征得到文字识别结果包括:
将基于所述全局注意力机制得到的注意力增强特征作为互注意力机制的V输入和K输入,将基于所述局部注意力机制得到的注意力增强特征作为互注意力机制的Q输入。
5.根据权利要求1所述的方法,其特征在于,所述第二类注意力机制还包括自注意力机制,所述基于第二类注意力机制和所述注意力增强特征得到文字识别结果包括:
利用所述自注意力机制确定文字预测结果;
基于所述互注意力机制、所述注意力增强特征和...
【专利技术属性】
技术研发人员:宋祺,姜仟艺,张睿,
申请(专利权)人:北京三快在线科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。