基于智能语料库的图像文字识别方法、系统及设备技术方案

技术编号：33777979 阅读：51 留言：0更新日期：2022-06-12 14:31

本发明专利技术属于图像文字识别领域，具体涉及了一种基于智能语料库的图像文字识别方法、系统及设备，旨在解决现有技术忽略图像文字之外的源语言、场景、语义关联等信息，导致存在字迹模糊、遮挡等的待识别图像的文字识别准确性低的问题。本发明专利技术包括：进行多种源语言对照语料信息的语义提取及对齐，构建多源语言语料库；训练获取多种源语言对应的图像文字识别模型；进行存在文字模糊和文字遮挡的待识别图像的OCR文字识别；提取待识别图像的源语言种类，结合OCR文字识别结果，获取待识别图像的推荐识别结果和各识别结果的置信度；以高于设定阈值的推荐识别结果和对应的置信度为识别结果。本发明专利技术可结合场景进行多种源语言的图像文字识别，准确性高。准确性高。准确性高。

全部详细技术资料下载

【技术实现步骤摘要】
基于智能语料库的图像文字识别方法、系统及设备

[0001]本专利技术属于图像文字识别领域，具体涉及了一种基于智能语料库的图像文字识别方法、系统及设备。

技术介绍

[0002]图像文字识别是利用光学技术对图像中的文字和字符进行扫描识别，最终将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工的技术。它是计算机视觉研究领域的分支之一，归属于模式识别和人工智能，是计算机科学的重要组成部分。
[0003]目前图片识别应用非常广泛，例如各类印刷和手写文档图像文字识别，身份证、银行卡、营业执照、户口本、护照等常用卡片及证件照的文字识别，交通场景中车牌、车辆合格证等的文字识别，以及财务票据、医疗票据、教育场景中试卷、作业的文字识别等等。
[0004]然而，由于一些待识别图像存在字迹模糊、遮挡等原因，导致部分文字无法识别，给用户带来不好体验。而一些图像中的场景也未能得到利用，从而未能有效提升识别准确性和用户体验。此外，不同的源语言(指图片中的语言种类)也带来了文字识别的困难。

技术实现思路

[0005]...

【技术保护点】

【技术特征摘要】
1.一种基于智能语料库的图像文字识别方法，其特征在于，该图像文字识别方法包括：步骤S10，获取多种源语言对照的语料信息，进行所述语料信息的语义提取及对齐，构建多源语言语料库；步骤S20，构建图像文字识别模型，并基于所述多源语言语料库进行模型训练，获得多种源语言对应的图像文字识别模型；步骤S30，进行存在文字模糊和文字遮挡的待识别图像的OCR文字识别，获得初步识别结果；步骤S40，提取存在文字模糊和文字遮挡的待识别图像的源语言种类，并结合所述初步识别结果，通过当前待识别图像的源语言对应的图像文字识别模型，获取待识别图像的推荐识别结果和各识别结果的置信度；步骤S50，输出置信度高于设定阈值的推荐识别结果和对应的置信度，作为待识别图像的识别结果。2.根据权利要求1所述的基于智能语料库的图像文字识别方法，其特征在于，所述图像文字识别模型基于深度神经网络构建。3.根据权利要求1所述的基于智能语料库的图像文字识别方法，其特征在于，所述多种源语言对照的语料信息，其获取方法为：通过网络爬虫进行在线数据抓取，获得多种源语言对照的语料信息；或者通过语料生成器生成数据，获得多种源语言对照的语料信息；或者结合网络爬虫进行在线数据抓取和通过语料生成器生成数据，获得多种源语言对照的语料信息。4.根据权利要求3所述的基于智能语料库的图像文字识别方法，其特征在于，所述通过语料生成器生成数据，其方法为：输入多种源语言对应的语句并进行实体词语识别；若所述输入语句多个实体词语，则获取预设的词槽组合列表，所述词槽组合列表中包含有多个词槽组合，每一词槽组合包括一个或一个以上的词槽；基于所述词槽组合，针对多种源语言对应的所述输入语句所包含的多个实体词语，分别进行各源语言对应的匹配及替换；对替换后的语句进行匹配和对齐，获得多种源语言对照的语料信息。5.根据权利要求1所述的基于智能语料库的图像文字识别方法，其特征在于，所述图像文字识别方法还包括知识图谱模型的构建，其方法为：提取所述多源语言语料库中的实体语料和语料关联关系；基于所述实体语料和语料关联关系，构建多种源语...

【专利技术属性】
技术研发人员：张婷，曲笑辰，王方，
申请(专利权)人：中译语通科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人