文字识别方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:32728149 阅读:12 留言:0更新日期:2022-03-20 08:33
本申请公开了一种文字识别方法、装置、电子设备及可读存储介质,属于图像处理技术领域。其中,所述方法包括:当获取到待识别图像时,发送目标图像;接收所述待识别图像的文字信息,所述文字信息基于所述目标图像得到,所述文字信息包括第一文本和所述第一文本的文本类别信息;在所述第一文本的文本类别信息不为预设文本类别的情况下,根据所述第一文本得到第二文本,所述第二文本的文本类别信息为所述预设文本类别。本申请能够提高文字识别的灵活性。活性。活性。

【技术实现步骤摘要】
文字识别方法、装置、电子设备及可读存储介质


[0001]本申请属于图像处理
,具体涉及一种文字识别方法、装置、电子设备及可读存储介质。

技术介绍

[0002]光学字符识别(Optical Character Recognition,OCR)是指用字符识别方法将字符形状翻译成计算机文字的过程。OCR通常可以根据字符识别不同的语言,并将字符形状转换为对应语言的文本内容。
[0003]然而,在使用OCR识别技术的一些应用场景中,常用语言通常仅为一种,若基于OCR识别的文本内容为其他语言的文本内容,需要额外通过人工或其他软件、工具转换为常用语言。可见,现有技术中文字识别的灵活性较低。

技术实现思路

[0004]本申请实施例的目的是提供一种文字识别方法、装置、电子设备及可读存储介质,能够解决现有技术中文字识别的灵活性较低的问题。
[0005]第一方面,本申请实施例提供了一种文字识别方法,包括:
[0006]当获取到待识别图像时,发送目标图像;
[0007]接收所述待识别图像的文字信息,所述文字信息基于所述目标图像得到,所述文字信息包括第一文本和所述第一文本的文本类别信息;
[0008]在所述第一文本的文本类别信息不为预设文本类别的情况下,根据所述第一文本得到第二文本,所述第二文本的文本类别信息为所述预设文本类别。
[0009]第二方面,本申请实施例提供了一种文字识别装置,包括:
[0010]处理模块,用于当获取到待识别图像时,发送目标图像;
[0011]接收模块,用于接收的所述待识别图像的文字信息,所述文字信息基于所述目标图像得到,所述文字信息包括第一文本和所述第一文本对应的文本类别信息;
[0012]转换模块,用于在所述第一文本的文本类别信息不为预设文本类别的情况下,根据所述第一文本得到第二文本,所述第二文本的文本类别信息为所述预设文本类别。
[0013]第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
[0014]第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
[0015]第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
[0016]在本申请实施例中,在所述第一文本的文本类别信息不为预设文本类别的情况
下,终端可以根据所述第一文本得到文本类别信息为所述预设文本类别的第二文本。这样,不论待识别图像中文字的文本类别信息是哪种,终端均可根据所述预设文本类别,得到所述待识别图像中文字对应的文本,所述预设文本类别的丰富性和可变性,使得文字识别的灵活性更高,也就可以更灵活地应用于各种文字识别场景中,提高文字识别的效率和有用性。
附图说明
[0017]图1是本申请实施例提供的一种文字识别方法的流程图;
[0018]图2是本申请实施例提供的一种待识别图像的示例图之一;
[0019]图3a是本申请实施例提供的一种处理前的文字区域的图像的示意图;
[0020]图3b是本申请实施例提供的一种处理后的文字区域的图像的示意图;
[0021]图4是本申请实施例提供的一种畸变矫正的示意图;
[0022]图5是本申请实施例提供的一种待识别图像的示例图之二;
[0023]图6是本申请实施例提供的一种文字识别装置的结构框图;
[0024]图7是本申请实施例提供的一种电子设备的结构框图。
具体实施方式
[0025]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。
[0026]本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
[0027]下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的文字识别方法进行详细地说明。
[0028]请参见图1,图1是本申请实施例提供的一种文字识别方法的流程示意图之一。需要说明的是,所述文字识别方法可以由终端执行,所述终端可以是手机、平板电脑(Tablet Personal Computer)、膝上型电脑(Laptop Computer)、可穿戴式设备(Wearable Device)等电子设备,也可以是其他存在文字识别需求的电子设备,例如图文扫描仪等,具体可根据实际情况决定,本申请实施例在此不作限定。
[0029]如图1所示,所述文字识别方法包括以下步骤:
[0030]步骤101、当获取到待识别图像时,发送目标图像。
[0031]具体实现时,终端可以通过摄像头获取所述待识别图像,此情况下,终端可以通过摄像头取景框中的预览图像,例如拍摄时的预览图像或者扫描(例如使用扫一扫功能)时的预览图像,来获取待识别图像;或者,终端也可以基于摄像头拍摄生成的图像来获取所述待识别图像。终端也可以接收获取其他设备发送的待识别图像。终端还可以基于如截屏、显示
等操作来获取待识别图像。可以理解的是,终端获取所述待识别图像的方式并不限于此,具体可以根据所述文字识别方法的应用场景具体确定,本申请实施例在此不作具体限定。
[0032]终端在获取到所述待识别图像后,可以确定目标图像并发送。所述目标图像可以为所述待识别图像,也可以为对所述待识别图像进行处理得到的图像,可以理解的是,所述目标图像与所述待识别图像相关联。终端可以向云端的服务器、计算机等具备图像处理、文字识别等功能的设备或数据处理平台发送所述目标图像,云端可以基于所述目标图像得到所述待识别图像的文字信息。在此以终端向服务器发送所述目标图像为例对本申请实施例进行说明,并不作具体限定。
[0033]步骤102、接收所述待识别图像的文字信息,所述文字信息基于所述目标图像得到,所述文字信息包括第一文本和所述第一文本的文本类别信息。
[0034]服务器在接收到所述目标图像后,可以基于所述目标图像得到文字信息,所述文字信息为所述待识别图像的文字信息。具体的,服务器可以对所述目标图像进行文字识别,可选地,服务器可以基于OCR技术对所述目标图像进行文字本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文字识别方法,其特征在于,包括:当获取到待识别图像时,发送目标图像;接收所述待识别图像的文字信息,所述文字信息基于所述目标图像得到,所述文字信息包括第一文本和所述第一文本的文本类别信息;在所述第一文本的文本类别信息不为预设文本类别的情况下,根据所述第一文本得到第二文本,所述第二文本的文本类别信息为所述预设文本类别。2.根据权利要求1所述的方法,其特征在于,所述当获取到待识别图像时,发送目标图像,包括:当获取到待识别图像,确定所述待识别图像中的文字区域;根据所述文字区域对应的图像,确定目标图像;发送所述目标图像。3.根据权利要求2所述的方法,其特征在于,所述待识别图像包括二维码图像;所述确定所述待识别图像中的文字区域,包括:识别所述待识别图像中的二维码区域;根据二维码区域与文字区域之间的预设相对位置信息,确定所述待识别图像中的文字区域。4.根据权利要求2所述的方法,其特征在于,所述根据所述文字区域对应的图像,确定目标图像,包括以下至少一项:截取所述文字区域对应的图像,得到目标图像;对所述文字区域对应的图像进行灰度处理,得到目标图像;对所述文字区域对应的图像进行畸变矫正,得到目标图像。5.根据权利要求2所述的方法,其特征在于,所述待识别图像包括二维码图像;所述当获取到待识别图像,确定所述待识别图像中的文字区域,包括:当获取到待识别图像,确定所述二维码图像的畸变信息;根据所述二维码图像的畸变信息对所述待识别图像进行畸变矫正,得到所述待识别图像的矫正图像;确定矫正后的所...

【专利技术属性】
技术研发人员:张含波苏少炜陈孝良
申请(专利权)人:北京声智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1