基于智能语料库的图像文字识别方法、系统及设备技术方案

技术编号:33777979 阅读:51 留言:0更新日期:2022-06-12 14:31
本发明专利技术属于图像文字识别领域,具体涉及了一种基于智能语料库的图像文字识别方法、系统及设备,旨在解决现有技术忽略图像文字之外的源语言、场景、语义关联等信息,导致存在字迹模糊、遮挡等的待识别图像的文字识别准确性低的问题。本发明专利技术包括:进行多种源语言对照语料信息的语义提取及对齐,构建多源语言语料库;训练获取多种源语言对应的图像文字识别模型;进行存在文字模糊和文字遮挡的待识别图像的OCR文字识别;提取待识别图像的源语言种类,结合OCR文字识别结果,获取待识别图像的推荐识别结果和各识别结果的置信度;以高于设定阈值的推荐识别结果和对应的置信度为识别结果。本发明专利技术可结合场景进行多种源语言的图像文字识别,准确性高。准确性高。准确性高。

【技术实现步骤摘要】
基于智能语料库的图像文字识别方法、系统及设备


[0001]本专利技术属于图像文字识别领域,具体涉及了一种基于智能语料库的图像文字识别方法、系统及设备。

技术介绍

[0002]图像文字识别是利用光学技术对图像中的文字和字符进行扫描识别,最终将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。它是计算机视觉研究领域的分支之一,归属于模式识别和人工智能,是计算机科学的重要组成部分。
[0003]目前图片识别应用非常广泛,例如各类印刷和手写文档图像文字识别,身份证、银行卡、营业执照、户口本、护照等常用卡片及证件照的文字识别,交通场景中车牌、车辆合格证等的文字识别,以及财务票据、医疗票据、教育场景中试卷、作业的文字识别等等。
[0004]然而,由于一些待识别图像存在字迹模糊、遮挡等原因,导致部分文字无法识别,给用户带来不好体验。而一些图像中的场景也未能得到利用,从而未能有效提升识别准确性和用户体验。此外,不同的源语言(指图片中的语言种类)也带来了文字识别的困难。

技术实现思路

[0005]为了解决现有技术中的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于智能语料库的图像文字识别方法,其特征在于,该图像文字识别方法包括:步骤S10,获取多种源语言对照的语料信息,进行所述语料信息的语义提取及对齐,构建多源语言语料库;步骤S20,构建图像文字识别模型,并基于所述多源语言语料库进行模型训练,获得多种源语言对应的图像文字识别模型;步骤S30,进行存在文字模糊和文字遮挡的待识别图像的OCR文字识别,获得初步识别结果;步骤S40,提取存在文字模糊和文字遮挡的待识别图像的源语言种类,并结合所述初步识别结果,通过当前待识别图像的源语言对应的图像文字识别模型,获取待识别图像的推荐识别结果和各识别结果的置信度;步骤S50,输出置信度高于设定阈值的推荐识别结果和对应的置信度,作为待识别图像的识别结果。2.根据权利要求1所述的基于智能语料库的图像文字识别方法,其特征在于,所述图像文字识别模型基于深度神经网络构建。3.根据权利要求1所述的基于智能语料库的图像文字识别方法,其特征在于,所述多种源语言对照的语料信息,其获取方法为:通过网络爬虫进行在线数据抓取,获得多种源语言对照的语料信息;或者通过语料生成器生成数据,获得多种源语言对照的语料信息;或者结合网络爬虫进行在线数据抓取和通过语料生成器生成数据,获得多种源语言对照的语料信息。4.根据权利要求3所述的基于智能语料库的图像文字识别方法,其特征在于,所述通过语料生成器生成数据,其方法为:输入多种源语言对应的语句并进行实体词语识别;若所述输入语句多个实体词语,则获取预设的词槽组合列表,所述词槽组合列表中包含有多个词槽组合,每一词槽组合包括一个或一个以上的词槽;基于所述词槽组合,针对多种源语言对应的所述输入语句所包含的多个实体词语,分别进行各源语言对应的匹配及替换;对替换后的语句进行匹配和对齐,获得多种源语言对照的语料信息。5.根据权利要求1所述的基于智能语料库的图像文字识别方法,其特征在于,所述图像文字识别方法还包括知识图谱模型的构建,其方法为:提取所述多源语言语料库中的实体语料和语料关联关系;基于所述实体语料和语料关联关系,构建多种源语...

【专利技术属性】
技术研发人员:张婷曲笑辰王方
申请(专利权)人:中译语通科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1