文本确定方法、装置、电子设备和计算机可读存储介质制造方法及图纸

技术编号：29975769 阅读：56 留言：0更新日期：2021-09-08 10:00

本公开提供了文本确定方法、装置、电子设备和计算机可读存储介质，涉及人工智能技术领域，具体为计算机视觉和深度学习技术领域，可应用于智慧城市、智慧金融场景下。具体实现方案为：确定原始图像的图像特征数据；基于图像特征数据，确定原始图像中包括的多个字符的字符特征数据；基于字符特征数据，确定多个字符的分类信息；以及通过基于多个字符的分类信息确定由多个字符组成的备选文本，确定对应于备选文本的目标文本。以此方式，本公开的技术方案可以在对没有提供足够视觉信息的原始图片进行文本识别时提供较高的识别正确率。进行文本识别时提供较高的识别正确率。进行文本识别时提供较高的识别正确率。

全部详细技术资料下载

【技术实现步骤摘要】
文本确定方法、装置、电子设备和计算机可读存储介质

[0001]本公开涉及人工智能
，具体为计算机视觉和深度学习
，可应用于智慧城市、智慧金融场景下，例如涉及文本确定方法、装置、电子设备、计算机可读存储介质和计算机程序产品。

技术介绍

[0002]在工业、服务业等智能化的趋势下，自然场景下的文字检测识别技术(例如，光学字符识别技术，Optical Character Recognition，简称“OCR”)已经被广泛的应用于社会各个行业，如金融、教育、医疗等领域。文档录入、发票识别、车牌识别、证件识别等文字检测识别的具体应用，提高了各行各业的工作效率、简化了用户的操作流程。虽然一些高性能的文字检测识别方法在通用场景下的识别率已经达到90％以上，但对于有遮挡、光照不均匀、有艺术字符等的情况，目前的识别技术通常会存在识别错误、漏识别等问题。

技术实现思路

[0003]本公开提供了一种文本确定方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
[0004]根据本公开的第一方面，提供了一种文本确定方法。该方法可以包括确定原始图像的图像特征数据。进而，可以基于图像特征数据，确定原始图像中包括的多个字符的字符特征数据。该方法还可以包括基于字符特征数据，确定多个字符的分类信息。此外，该方法可以进一步包括通过基于多个字符的分类信息确定由多个字符组成的备选文本，确定对应于备选文本的目标文本。
[0005]在本公开的第二方面中，提供了一种文本确定装置，包括：图像特征数据确定模块，被配置为...

【技术保护点】

【技术特征摘要】
1.一种文本确定方法，包括：确定原始图像的图像特征数据；基于所述图像特征数据，确定所述原始图像中包括的多个字符的字符特征数据；基于所述字符特征数据，确定所述多个字符的分类信息；以及通过基于所述多个字符的分类信息确定由所述多个字符组成的备选文本，确定对应于所述备选文本的目标文本。2.根据权利要求1所述的方法，其中确定所述图像特征数据包括：通过第一网络对所述原始图像进行处理，确定所述原始图像的特征图，作为所述图像特征数据。3.根据权利要求2所述的方法，其中所述第一网络是卷积神经网络。4.根据权利要求2所述的方法，其中确定所述字符特征数据包括：基于所述特征图确定所述多个字符所在的区域；以及基于所述特征图中的对应于所述区域的特征数据，确定分别对应于所述多个字符的多个特征向量，作为所述字符特征数据。5.根据权利要求4所述的方法，其中确定所述多个字符的分类信息包括：利用第二网络基于所述多个特征向量确定所述多个字符的分类信息。6.根据权利要求5所述的方法，其中所述第二网络是全连接网络。7.根据权利要求1所述的方法，其中确定所述多个字符的分类信息包括：将所述字符特征数据应用于字符识别模型以确定所述多个字符的分类信息，所述字符识别模型是将被设置的参考字符特征数据作为输入以及对应的经标注的参考字符分类信息作为输出来训练得到的。8.根据权利要求1所述的方法，其中确定所述目标文本包括：将所述备选文本应用于语义纠错模型；以及从所述语义纠错模型中获取经确定的所述目标文本。9.根据权利要求8所述的方法，其中所述语义纠错模型是将被设置的参考备选文本作为输入以及将经标注的参考目标文本作为输出来训练得到的，所述参考备选文本是基于所述参考目标文本修改后的文本。10.一种文本确定装置，包括：图像特征数据确定模块，被配置为确定原始图像的图像特征数据；字符特征数据确定模块，被配置为基于所述图像特征数据确定所述原始图像中包括的多个字符的字符特征数据；分类信息确定模块，被配置为基于所述字符特征数据确定所述多个字符的分类信息；以及目标文本确定模块，被配置为通过基于所述多个字符的分类信息确定由所述多个字符组成的备选文本来确定对应于所述备选文本的目标文本。11.根...

【专利技术属性】
技术研发人员：吕鹏原，李景泉，章成全，姚锟，韩钧宇，刘经拓，丁二锐，吴甜，王海峰，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人