光学字符识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号：32644320 阅读：36 留言：0更新日期：2022-03-12 18:23

本申请提供一种光学字符识别方法、装置、电子设备及存储介质，方法包括：检测待处理图片中的文字的语言类型；采用所述语言类型对应的文字识别模型，对所述待处理图片进行光学字符识别。这样就无需使用每一种语言类型对应的文字识别模型均对待处理图片进行光学字符识别，可以有效避免产生大量的重复识别操作，提高光学字符识别效率低，降低性能开销。降低性能开销。降低性能开销。

全部详细技术资料下载

【技术实现步骤摘要】
光学字符识别方法、装置、电子设备及存储介质

[0001]本申请涉及图像识别
，具体而言，涉及一种光学字符识别方法、装置、电子设备及存储介质。

技术介绍

[0002]现有的OCR(Optical Character Recognition，光学字符识别)技术可以将图片上的文字识别成文本格式，具有较高的实际应用价值。
[0003]而目前使用的OCR技术主要基于人工智能实现的。具体而言，在进行光学字符识别时，首先需要确定OCR两个阶段的人工智能模型，包括文字检测模型与文字识别模型，然后通过某种语言的大量已标注样本训练上述的两个模型。采用不同语言样本集合，重复上述训练步骤，训练得到多种语言的相应的模型，每种语言都具有上述两种模型。对需要识别的图片，通过各语言类型对应的两种模型对该图片进行处理，得到各语言类型对应的输出文本。然后针对各语言类型对应的输出文本进行识别，比如识别哪一种输出文本中的文字信息最多，从而输出该文字信息最多的语言类型对应的输出文本。
[0004]但是，上述方案中，需要采用各语言类型对应的模型都...

【技术保护点】

【技术特征摘要】
1.一种光学字符识别方法，其特征在于，包括：检测待处理图片中的文字的语言类型；采用所述语言类型对应的文字识别模型，对所述待处理图片进行光学字符识别。2.如权利要求1所述的光学字符识别方法，其特征在于，检测当前待处理图片中的文字的语言类型，包括：检测所述待处理图片的文字区域；检测各文字区域内的文字的语言类型；采用所述语言类型对应的文字识别模型，对所述待处理图片进行光学字符识别，包括：采用各所述文字区域对应的语言类型所对应的文字识别模型，分别对各所述文字区域进行光学字符识别。3.如权利要求1所述的光学字符识别方法，其特征在于，检测当前待处理图片中的文字的语言类型，包括：检测所述待处理图片的文字区域；检测各文字区域内的文字的语言类型；根据各所述文字区域对应的语言类型，确定所述待处理图片对应的目标语言类型；采用所述语言类型对应的文字识别模型，对所述待处理图片进行光学字符识别，包括：采用所述目标语言类型对应的文字识别模型，对所述待处理图片进行光学字符识别。4.如权利要求3所述的光学字符识别方法，其特征在于，根据各所述文字区域对应的语言类型，确定所述待处理图片对应的目标语言类型，包括：统计各语言类型所对应的文字区域的数量；确定出对应文字区域数量最多的语言类型；所述对应文字区域数量最多的语言类型为所述待处理图片对应的目标语言类型。5.如权利要求1
‑
4任一项所述的光学字符识别方法，其特征在于，在采用所述语言类型对应的文字识别模型，对所述待处理图片进行光学字符识别之前，所述方法还包括：确定本机的算力水平；从所述语言类型对应的多个文字识别模型中，确定出与本机的算力水平匹配的目标文字识别模型；所述语言类型对应的多个文字识别模型具有不同的算力需求；采用所述语言类型对应的文字识别模型，对所述待处理图片进行光学字符识别，包括：采用所述语言类型对应的目标文字识别模型，对所述待处理图片进行光学字符识别。6.如权利要求5所述的光学字符识别方法，其特征在于，所述确定本机的算力水平，包括：获取本机的硬件情况；根据本机的硬件情况确定用于进行光学字符识别的计算环境；在所述计算环境中调用预设的算力检测程序，得到本机的算力水平。7.如权利要求6所述的光学字符识别方法，其特征在于，根据本机的硬件情况确定用于进行光学字符识别的计算环境，包括：若本机没有图形处理器GPU，则确定用于进行光学字符识别的计算环境为中央处理器CPU；若本机具有独立的GPU，且所述GPU支持统一计算设备架构CUDA，则确定用于进行光学
字符识别的计算环境为使用CUDA模块的所述GPU；若本机具有独立的GPU，且所述GPU不支持CUDA...

【专利技术属性】
技术研发人员：马勇，王佳华，顾永翔，
申请(专利权)人：网神信息技术北京股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人