确定字符序列的方法、装置和电子设备制造方法及图纸

技术编号：29975699 阅读：16 留言：0更新日期：2021-09-08 09:59

本公开提供了用于确定字符序列的方法、装置、电子设备和计算机可读存储介质，涉及人工智能技术领域，具体为计算机视觉和深度学习技术领域，可应用于智慧城市、智慧金融场景下。具体实现方案为：确定原始图像的图像特征数据；基于图像特征数据确定第一字符特征数据，第一字符特征数据至少包括原始图像中包括的多个字符的相应字符特征数据；基于第一字符特征数据，确定由多个字符组成的目标字符序列；从目标字符序列中获取第二字符特征数据，第二字符特征数据包含字符特征信息和字符序列特征信息；以及基于图像特征数据和第二字符特征数据，确定多个字符的更新的目标字符序列。本公开提升了字符序列识别结果的正确率，改善了用户体验。户体验。户体验。

全部详细技术资料下载

【技术实现步骤摘要】
确定字符序列的方法、装置和电子设备

[0001]本公开涉及人工智能
，具体为计算机视觉和深度学习
，可应用于智慧城市、智慧金融场景下，例如涉及用于确定字符序列的方法、装置、电子设备、计算机可读存储介质和计算机程序产品。

技术介绍

[0002]在工业、服务业等智能化的趋势下，自然场景下的文字检测识别技术(例如，光学字符识别技术，Optical Character Recognition，简称“OCR”)已经被广泛的应用于社会各个行业，如金融、教育、医疗等领域。文档录入、发票识别、车牌识别、证件识别等文字检测识别的具体应用，提高了各行各业的工作效率、简化了用户的操作流程。虽然一些高性能的文字检测识别方法在通用场景下的识别率已经达到90％以上，但对于有遮挡、光照不均匀、有艺术字符等的情况，目前的识别技术通常会存在识别错误、漏识别等问题。

技术实现思路

[0003]本公开提供了一种用于确定字符序列的方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
[0004]根据本公开的第一方面，提供了一种用于确定字符序列的方法。该方法可以包括确定原始图像的图像特征数据。进而，可以基于图像特征数据确定第一字符特征数据，该第一字符特征数据至少包括原始图像中包括的多个字符的相应字符特征数据。该方法还可以包括基于第一字符特征数据，确定由多个字符组成的目标字符序列。进而，可以从目标字符序列中获取第二字符特征数据，第二字符特征数据包含字符特征信息和字符序列特征信息。此外，该方法可以进一步包括基于图像特征数...

【技术保护点】

【技术特征摘要】
1.一种用于确定字符序列的方法，包括：确定原始图像的图像特征数据；基于所述图像特征数据确定第一字符特征数据，所述第一字符特征数据至少包括所述原始图像中包括的多个字符的相应字符特征数据；基于所述第一字符特征数据，确定由所述多个字符组成的目标字符序列；从所述目标字符序列中获取第二字符特征数据，所述第二字符特征数据包含字符特征信息和字符序列特征信息；以及基于所述图像特征数据和所述第二字符特征数据，确定所述多个字符的更新的目标字符序列。2.根据权利要求1所述的方法，其中所述第一字符特征数据包括冗余的字符特征数据，并且其中确定所述目标字符序列包括：基于所述第一字符特征数据获取冗余分类信息，以确定包含冗余字符的字符序列；以及响应于所述包含冗余字符的字符序列中的字符组合命中备选字符序列的概率大于阈值概率，将所述备选字符序列确定为所述目标字符序列。3.根据权利要求1所述的方法，其中确定所述更新的目标字符序列包括：通过将所述图像特征数据和所述第二字符特征数据输入注意图模型，确定所述多个字符的注意力掩码信息；基于所述图像特征数据和所述注意力掩码信息，确定所述第三字符特征数据；以及基于所述第三字符特征数据，确定所述多个字符的分类信息，以确定所述更新的目标字符序列。4.根据权利要求1所述的方法，其中确定所述图像特征数据包括：通过利用第一网络对所述原始图像进行处理，确定所述原始图像的特征图，作为所述图像特征数据。5.根据权利要求4所述的方法，其中所述第一网络是卷积神经网络。6.根据权利要求3所述的方法，其中确定所述第三字符特征数据包括：利用所述注意力掩码信息对所述图像特征数据进行掩码处理，以确定分别对应于所述多个字符的多个特征向量，作为所述第三字符特征数据。7.根据权利要求6所述的方法，其中确定所述多个字符的分类信息包括：利用神经网络中的第二网络基于所述多个特征向量确定所述多个字符的分类信息。8.根据权利要求7所述的方法，其中所述第二网络是全连接网络。9.根据权利要求3所述的方法，其中确定所述多个字符的分类信息包括：将所述第三字符特征数据应用于字符识别模型以确定所述多个字符的分类信息，所述字符识别模型是将被设置的参考字符特征数据作为输入以及对应的经标注的参考字符分类信息作为输出来训练得到的。10.根据权利要求3所述的方法，其中所述注意图模型是将参考字符特征数据、参考图像特征数据作为输入以及将对应的经标注的参考注意力掩码信息作为输出来训练得到的。11.根据权利要求1所述的方法，其中从所述目标字符序列中获取所述第二字符特征数据包括：
通过对每个字符进行编码，确定所述字符特征信息；以及基于每个字符与所述目标字符序列中的其他字符的组合关系，确定所述字符序列特征信息。12.一种用于确定字符序列的装置，包括：图像特征数据确定模块，被配置为确定原始图像的图像特征数据；第一字符特征数据确定模块，被配置为基于所述图像特征数据确定第一字符特征数据，所述第一字符特征数据至少包括所述原始图像中包括的多个字符的相应字符特征数据；目标字符序列确定模块，被配置为基于所述第一字符特征数据，确定由所述多个字符组成的目标字符序列；第二字符特征数据获取模块，被配置为从所述目标字符序列中获取第二字符特征数据，所述第二字符特征...

【专利技术属性】
技术研发人员：吕鹏原，李景泉，章成全，姚锟，韩钧宇，刘经拓，丁二锐，吴甜，王海峰，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人