文本识别方法和装置制造方法及图纸

技术编号：38135869 阅读：12 留言：0更新日期：2023-07-08 09:47

本申请提供了一种文本识别方法和装置，该方法包括：获得文本图像；对文本图像进行特征提取，得到文本图像的浅层文本特征；对浅层文本特征进行移位卷积处理，得到文本图像的第一中间文本特征；利用逐组多窗口自注意力模块对第一中间文本特征进行多组不同窗口尺寸的自注意力计算，将计算得到的多组自注意力特征进行融合，得到文本图像的第二中间文本特征；将浅层文本特征与第二中间文本特征进行残差连接，得到文本图像的深层文本特征；基于浅层文本特征和深层文本特征，识别文本图像中的文本。通过本申请的方案可以提升文本图像识别的准确性。准确性。准确性。

全部详细技术资料下载

【技术实现步骤摘要】
文本识别方法和装置

[0001]本申请涉及图像处理
，尤其涉及一种文本识别方法和装置。

技术介绍

[0002]随着图像处理技术的不断发展，对图像进行文本识别的应用场景日益增多。如，图像的文本识别技术可以应用于车牌识别、街道标志识别、文献检索、工业自动化中的零件识别以及自动驾驶中的导航匹配等等诸多领域。
[0003]但是，自然场景中存在的图像普遍存在分辨率低，且图像中包含的文本通常在布局、字体以及大小等方面有所不同，很容易出现文本识别错误，导致文本识别的准确率不高。

技术实现思路

[0004]有鉴于此，本申请提供了一种文本识别方法和装置，以提高文本识别的准确性。
[0005]为实现上述目的，一方面，本申请提供了一种文本识别方法，包括：
[0006]获得文本图像；
[0007]对所述文本图像进行特征提取，得到所述文本图像的浅层文本特征；
[0008]对所述浅层文本特征进行移位卷积处理，得到所述文本图像的第一中间文本特征；
[0009]利用逐组多窗口自注意力模块对所述第一中间文本特征进行多组不同窗口尺寸的自注意力计算，将计算得到的多组自注意力特征进行融合，得到所述文本图像的第二中间文本特征；
[0010]将所述浅层文本特征与第二中间文本特征进行残差连接，得到所述文本图像的深层文本特征；
[0011]基于所述浅层文本特征和深层文本特征，识别所述文本图像中的文本。
[0012]在一种可能的实现方式中，所述基于所述浅层文本特征和深层文本...

【技术保护点】

【技术特征摘要】
1.一种文本识别方法，其特征在于，包括：获得文本图像；对所述文本图像进行特征提取，得到所述文本图像的浅层文本特征；对所述浅层文本特征进行移位卷积处理，得到所述文本图像的第一中间文本特征；利用逐组多窗口自注意力模块对所述第一中间文本特征进行多组不同窗口尺寸的自注意力计算，将计算得到的多组自注意力特征进行融合，得到所述文本图像的第二中间文本特征；将所述浅层文本特征与第二中间文本特征进行残差连接，得到所述文本图像的深层文本特征；基于所述浅层文本特征和深层文本特征，识别所述文本图像中的文本。2.根据权利要求1所述的方法，其特征在于，所述基于所述浅层文本特征和深层文本特征，识别所述文本图像中的文本，包括：基于所述浅层文本特征和深层文本特征，构建所述文本图像的超分辨率文本图像；识别所述超分辨率文本图像中的文本。3.根据权利要求2所述的方法，其特征在于，所述基于所述浅层文本特征和深层文本特征，构建所述文本图像的超分辨率文本图像，包括：对所述浅层文本特征和深层文本特征进行融合处理，得到所述文本图像的融合文本特征；对所述融合文本特征进行像素重组，得到重组后的文本图像；利用像素级注意力模块对重组后的文本图像进行上采样，得到所述文本图像的超分辨率文本图像。4.根据权利要求1所述的方法，其特征在于，所述对所述浅层文本特征进行移位卷积处理，得到所述文本图像的第一中间文本特征，包括：对所述浅层文本特征进行第一移位卷积处理，得到所述文本图像的第一文本特征；利用第一激活函数对所述第一文本特征进行激活处理；对激活处理后的第一文本特征进行第二移位卷积处理，得到所述文本图像的第二文本特征；基于所述第二文本特征，确定所述文本图像的第一中间文本特征。5.根据权利要求4所述的方法，其特征在于，所述基于所述第二文本特征，确定所述文本图像的第一中间文本特征，包括：将所述第二文本特征与所述浅层文本特征进行残差连接，得到所述文本图像的第一中间文本特征。6.根据权利要求1所述的方法，其特征在于，在提取所述文本图像的浅层特征之前，还包括：对所述文本图像进行文本矫正；利用第二激活函数对文本矫正后的文本图像进行激...

【专利技术属性】
技术研发人员：张信明，贾堡钧，马金，陈一凡，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人