文本串识别方法、装置及电子设备制造方法及图纸

技术编号：26846410 阅读：26 留言：0更新日期：2020-12-25 13:09

本申请提供了文本串识别方法、装置及电子设备。本申请中，通过对目标图像进行划分(也称画格子)，依据目标图像的图像特征图确定S*S个通道的通道特征图(用于表征目标图像中与该通道对应的图像块相关联的文本串位置)，以实现通过画格子方式将目标图像中每一文本串映射至不同通道上来学习文本串位置，最终在不借助抠图操作的前提下实现了文本识别，这相比抠图操作，可大大减少计算量。

全部详细技术资料下载

【技术实现步骤摘要】
文本串识别方法、装置及电子设备
本申请涉及识别处理技术，特别涉及文本串识别方法、装置及电子设备。
技术介绍
文本串识别，是模式识别的一个重要应用。这里的文本串，从一个方面来讲，其可以是一个文字、一个句子(Sentence)、一个段落(Paragraph)或者一个篇章(Discourse)等；从另一个方面来讲，其也可以是一个字符、一个符号、一串由相同或不同字符和/或符号等组成的字符串等。本申请中的文本串可不受限于目前文学领域中的文本解释，本申请并不限定文本的具体形式。文本串识别可应用于许多业务领域，比如：阅读、翻译、文献资料的检索、商品发票的统计汇总、商品编码的识别、商品仓库的管理、证件识别、车牌识别等。通过文本串识别可提高工作效率。但是，目前的文本串识别方法常需要抠图，比如借助感兴趣区域(RoI:RegionofInterest)技术抠出特征图或者在原图上抠出候选框等。而抠图在文本串密集时会导致抠出的图像区域中出现其它文本串的片段，文本串识别准确率会降低。
技术实现思路
本申请实施例提供了文本串识...

【技术保护点】
1.一种文本串识别方法，其特征在于，该方法包括：/n依据目标图像的图像特征图确定S*S个通道的通道特征图；每一通道的通道特征图用于表征所述目标图像中与该通道对应的图像块相关联的文本串位置；所述S*S个通道为已被配置的通道；所述目标图像被划分为与所述S*S个通道中每一通道对应的图像块；/n依据所述S*S个通道的通道特征图识别所述文本串位置上的目标文本串。/n

【技术特征摘要】
1.一种文本串识别方法，其特征在于，该方法包括：
依据目标图像的图像特征图确定S*S个通道的通道特征图；每一通道的通道特征图用于表征所述目标图像中与该通道对应的图像块相关联的文本串位置；所述S*S个通道为已被配置的通道；所述目标图像被划分为与所述S*S个通道中每一通道对应的图像块；
依据所述S*S个通道的通道特征图识别所述文本串位置上的目标文本串。

2.根据权利要求1所述的方法，其特征在于，所述依据目标图像的图像特征图确定S*S个通道的通道特征图包括：
将所述目标图像的图像特征图输入至已训练的文本识别模型中的第一空间注意力模块以得到S*S个通道的通道特征图；所述第一空间注意力模块用于利用已训练的文本串位置监督信息并基于输入的所述图像特征图得到S*S个通道分别对应的通道特征图，所述S*S个通道为所述第一空间注意力模块被配置的通道。

3.根据权利要求1所述的方法，其特征在于，所述依据目标图像的图像特征图确定S*S个通道的通道特征图包括：
将所述目标图像的图像特征图输入至已训练的文本识别模型中的第二空间注意力模块以学习到S*S个通道的通道特征图；所述第二空间注意力模块用于利用已训练的单字位置监督信息并基于输入的所述图像特征图学习S*S个通道的通道特征图，每一通道的通道特征图包括L个单字位置分割图，每一单字位置分割图用于表征对应的单字位置；每一通道的通道特征图包含的L个单字位置分割图对应的单字位置组成所述目标图像中与该通道对应的图像块相关联的文本串位置；L为已配置的单一文本串最大长度，所述S*S个通道为所述第二空间注意力模块被配置的通道。

4.根据权利要求1至3任一所述的方法，其特征在于，所述依据所述S*S个通道的通道特征图识别所述文本串位置上的目标文本串包括：
将所述S*S个通道的通道特征图与所述图像特征图进行融合得到融合特征图；
依据所述融合特征图识别所述文本串位置上的目标文本串。

5.根据权利要求4所述的方法，其特征在于，所述将所述S*S个通道的通道特征图与所述图像特征图进行融合得到融合特征图包括：
将所述S*S个通道的通道特征图、以及所述图像特征图输入至已训练的文本识别模型中的注意力融合模块得到融合特征图；所述注意力融合模块用于通过对输入的所述S*S个通道分别对应的通道特征图、以及所述图像特征图进行设定矩阵运算得到所述融合特征图。

6.根据权利要求4所述的方法，其特征在于，所述依据融合特征图识别所述文本串位置上的目标文本串包括：
基于所述融合特征图预测所述目标图像中各文本串位置上的预测文本串得到文本串预测结果；所述文本串预测结果包括所述目标图像中各图像块相关联的文本串位置上的预测文本串；
依据所述文本串预测结果识别所述文本串位置上的目标文本串。

7.根据权利要求6所述的方法，其特征在于，所述基于所述融合特征图预测所述目标图像中各图像块相关联的文本串位置上的预测文本串得到文本串预测结果...

【专利技术属性】
技术研发人员：乔梁，
申请(专利权)人：上海高德威智能交通系统有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人