文字识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号：26260716 阅读：38 留言：0更新日期：2020-11-06 17:56

本申请公开了文字识别方法、装置、电子设备及存储介质，该方法包括：提取目标图像的纹理特征；基于第一类注意力机制对纹理特征进行过滤，得到注意力增强特征，其中，第一类注意力机制包括空间注意力机制和/或通道注意力机制；基于第二类注意力机制和注意力增强特征得到文字识别结果，其中，第二类注意力机制包括互注意力机制。本申请的有益效果在于：将多种注意力机制有机结合应用于文字识别，能够快速识别字符特征，而不受文字排版的影响，显著提升文字识别的准确率，尤其对于不规则文字的识别，效果显著，且计算量小、计算速度快、可用性强、适用范围广。

全部详细技术资料下载

【技术实现步骤摘要】
文字识别方法、装置、电子设备及存储介质
本申请涉及数据处理
，具体涉及一种文字识别方法、装置、电子设备及存储介质。
技术介绍
文字识别作为计算机视觉中的一种常用技术，被广泛应用于文档分析、证照识别、街景识别、资质审核、自动录入等场景中，为人们的日常生活和工作提供了很大的便利。但是现有技术依然存在着很多不足之处，如现有文字识别的方法对比较标准的水平或垂直文字行能够有效识别，但是，针对不规则排列的文字，识别效果普遍不好，识别正确率较低，仅能识别其中部分弯曲、倾斜的文字行，而在中文文字图像中，不规则的排列比其他一些字母文字(例如英文、法文等)更加显著，针对这种不规则的文字，现有技术还缺乏有效的解决方案。
技术实现思路
鉴于上述问题，提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的文字识别方法、装置、电子设备及存储介质。依据本申请的一个方面，提供了一种文字识别方法，该方法包括：提取目标图像的纹理特征；基于第一类注意力机制对纹理特征进行过滤，得到注意力增强特征，其中，第...

【技术保护点】
1.一种文字识别方法，其特征在于，包括：/n提取目标图像的纹理特征；/n基于第一类注意力机制对所述纹理特征进行过滤，得到注意力增强特征，其中，所述第一类注意力机制包括空间注意力机制和/或通道注意力机制；/n基于第二类注意力机制和所述注意力增强特征得到文字识别结果，其中，所述第二类注意力机制包括互注意力机制。/n

【技术特征摘要】
1.一种文字识别方法，其特征在于，包括：
提取目标图像的纹理特征；
基于第一类注意力机制对所述纹理特征进行过滤，得到注意力增强特征，其中，所述第一类注意力机制包括空间注意力机制和/或通道注意力机制；
基于第二类注意力机制和所述注意力增强特征得到文字识别结果，其中，所述第二类注意力机制包括互注意力机制。

2.根据权利要求1所述的方法，其特征在于，所述基于第一类注意力机制对所述纹理特征进行过滤，得到注意力增强特征包括：
基于所述第一类注意力机制生成所述纹理特征的信息矫正掩模；
将生成的各信息矫正掩模分别与所述纹理特征进行融合，得到相应的注意力增强特征。

3.根据权利要求1所述的方法，其特征在于，所述第一类注意力机制还包括全局注意力机制和/或局部注意力机制。

4.根据权利要求3所述的方法，其特征在于，所述基于第二类注意力机制和所述注意力增强特征得到文字识别结果包括：
将基于所述全局注意力机制得到的注意力增强特征作为互注意力机制的V输入和K输入，将基于所述局部注意力机制得到的注意力增强特征作为互注意力机制的Q输入。

5.根据权利要求1所述的方法，其特征在于，所述第二类注意力机制还包括自注意力机制，所述基于第二类注意力机制和所述注意力增强特征得到文字识别结果包括：
利用所述自注意力机制确定文字预测结果；
基于所述互注意力机制、所述注意力增强特征和...

【专利技术属性】
技术研发人员：宋祺，姜仟艺，张睿，
申请(专利权)人：北京三快在线科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人