一种文字识别方法及终端、存储介质技术

技术编号:32173090 阅读:11 留言:0更新日期:2022-02-08 15:32
本申请实施例提供了一种文字识别方法及终端、存储介质,包括:对当前图像帧进行图形识别,得到当前图像帧中的文字图像对应的纹理信息;从预设纹理信息和文字信息对应关系中,查找纹理信息对应的文字信息;预设纹理信息和文字信息对应关系中存储本次文字识别过程中前几帧文字识别结果;若从预设纹理信息和文字对应关系中查找到纹理信息对应的第一预设文字信息,则将第一预设文字信息确定为纹理信息对应的文字信息。应的文字信息。应的文字信息。

【技术实现步骤摘要】
一种文字识别方法及终端、存储介质


[0001]本申请涉及电子应用领域,尤其涉及一种文字识别方法及终端、存储介质。

技术介绍

[0002]随着电子技术的日益发展,终端上可继承越来越多的软件,而辅助增强这些软件需要识别软件界面的文字。目前,通常通过的做法是先识别文字图像,之后在对每一个文字图像进行文字识别,确定出文字图像对应的文字信息。当软件界面的文字数量庞大时,这种方法会导致文字识别速度变慢。

技术实现思路

[0003]本申请实施例提供一种文字识别方法及终端、存储介质,能够提高文字识别速度。
[0004]本申请的技术方案是这样实现的:
[0005]第一方面,本申请实施例提出一种文字识别方法,所述方法包括:
[0006]对当前图像帧进行图形识别,得到所述当前图像帧中的文字图像对应的纹理信息;
[0007]从预设纹理信息和文字信息对应关系中,查找所述纹理信息对应的文字信息;所述预设纹理信息和文字信息对应关系中存储本次文字识别过程中前几帧文字识别结果;
[0008]若从预设纹理信息和文字对应关系中查找到所述纹理信息对应的第一预设文字信息,则将所述第一预设文字信息确定为所述纹理信息对应的文字信息。
[0009]第二方面,本申请实施例提出一种终端,所述终端包括:
[0010]图形识别模块,用于对当前图像帧进行图形识别,得到所述当前图像帧中的文字图像对应的纹理信息;
[0011]查找模块,用于从预设纹理信息和文字信息对应关系中,查找所述纹理信息对应的文字信息;所述预设纹理信息和文字信息对应关系中存储本次文字识别过程中前几帧文字识别结果;
[0012]确定模块,用于若从预设纹理信息和文字对应关系中查找到所述纹理信息对应的第一预设文字信息,则将所述第一预设文字信息确定为所述纹理信息对应的文字信息。
[0013]第三方面,本申请实施例提出一种终端,所述终端包括:处理器、存储器及通信总线;所述处理器执行存储器存储的运行程序时实现如上述的文字识别方法。
[0014]第四方面,本申请实施例提出一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述的文字识别方法。
[0015]本申请实施例提供了一种文字识别方法及终端、存储介质,该方法包括:对当前图像帧进行图形识别,得到当前图像帧中的文字图像对应的纹理信息;从预设纹理信息和文字信息对应关系中,查找纹理信息对应的文字信息;预设纹理信息和文字信息对应关系中存储本次文字识别过程中前几帧文字识别结果;若从预设纹理信息和文字对应关系中查找到纹理信息对应的第一预设文字信息,则将第一预设文字信息确定为纹理信息对应的文字
信息。采用上述实现方案,终端将本次文字识别过程中,前几帧文字识别结果进行存储,终端在得到当前图像帧中的文字图像对应的纹理信息后,直接从预设纹理信息和文字信息对应关系中,查找纹理信息对应的文字信息,若查找到纹理信息对应的第一预设文字信息,则直接将第一预设文字信息确定为纹理信息对应的文字信息,无需对每一个文字图像进行文字识别,极大的提高了文字识别的速度。
附图说明
[0016]图1为本申请实施例提供的一种文字识别方法的流程图;
[0017]图2为本申请实施例提供的一种示例性的图像纹理的显示示意图;
[0018]图3为本申请实施例提供的一种示例性的文字识别方法的方法流程图;
[0019]图4为本申请实施例提供的一种终端1的结构示意图一;
[0020]图5为本申请实施例提供的一种终端1的结构示意图二。
具体实施方式
[0021]应当理解,此处描述的具体实施例仅仅用以解释本申请。并不用于限定本申请。
[0022]本申请实施例提供一种文字识别方法,如图1所示,该方法可以包括:
[0023]S101、对当前图像帧进行图形识别,得到当前图像帧中的文字图像对应的纹理信息。
[0024]本申请实施例提出的一种图形识别方法适用于对第三方软件界面或者游戏用户界面(User Interface,UI)界面的当前图像帧中的文字进行识别的场景中。
[0025]本申请实施例中,进行文字识别的终端可以为任何具备处理和存储功能的设备,例如:平板电脑、手机、个人计算机(Personal Computer,PC)、笔记本电脑、可穿戴设备等设备。
[0026]本申请实施例中,获取终端中的第三方软件界面或者游戏UI界面的当前图像帧,之后利用预设图形应用程序编程接口(Application Programming Interface,API)指令流,对当前图像帧进行图形识别,得到图形识别结果;从图形识别结果中确定出当前图像帧中的文字图像对应的纹理信息。
[0027]可选的,预设图形API包括但不限于以下图形API:开放运算语言(Open Computing Language,OpenGL)、嵌入式系统的OpenGL(OpenGL for Embedded Systems,OpenGL ES)、Vulkan(“下一代”开放的图形显示API)、直接扩展11(Direct eXtension,DirectX 11)、DirectX 12、Metal(低层次的渲染应用程序编程接口),具体的可以根据实际情况进行选择,本申请实施例不做具体的限定。
[0028]本申请实施例中,预设图形API指令流用于对当前图像帧进行图形识别,其中,图形识别的具体识别内容可以根据实际情况进行选择,最后可以得到包含文字图像对应的纹理信息的图形识别结果。
[0029]具体的,可以在预设图形API指令流中提取纹理信息相关的指令和缓存,得到文字图像对应的编码流,编码流中每个文字编码都包含该文字图像对应的纹理信息。
[0030]需要说明的是,当前图像帧中包括至少一个图像纹理,每一个图像纹理中可包含至少一个文字图像,故,当前图像帧中的每一个文字图像处于一个图像纹理的预设位置。因
此,要得到每一个文字图像在当前图像帧中所处的具体位置,需要确定该文字图像对应的纹理标识信息和纹理坐标信息。综上所述,纹理信息包括文字图像对应的纹理标识信息和纹理坐标信息。
[0031]示例性的,如图2所示,包括两个图像纹理:图像纹理1和图像纹理2,图像纹理1中包括“游、戏、肺、炎”这四个文字,图像纹理2中包括“抗、击、上、瘾”这四个文字。则,“抗”对应的纹理标识信息为2、纹理坐标信息为(0,0.25,0.25,1),“击”对应的纹理标识信息为2、纹理坐标信息为(0.25,0.25,1,1),“肺”对应的纹理标识信息为1、纹理坐标信息为(0,0,0.25,0.25),“炎”对应的纹理标识信息为1、纹理坐标信息为(0.25,0,1,0.25)。
[0032]S102、从预设纹理信息和文字信息对应关系中,查找纹理信息对应的预设文字信息,预设纹理信息和文字信息对应关系中存储本次文字识别过程中前几帧文字识别结果。
[0033]在本申请实施例中,在从本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文字识别方法,其特征在于,所述方法包括:对当前图像帧进行图形识别,得到所述当前图像帧中的文字图像对应的纹理信息;从预设纹理信息和文字信息对应关系中,查找所述纹理信息对应的文字信息;所述预设纹理信息和文字信息对应关系中存储本次文字识别过程中前几帧文字识别结果;若从预设纹理信息和文字对应关系中查找到所述纹理信息对应的第一预设文字信息,则将所述第一预设文字信息确定为所述纹理信息对应的文字信息。2.根据权利要求1所述的方法,其特征在于,所述从预设纹理信息和文字对应关系中,查找所述纹理信息对应的文字信息之后,所述方法还包括:若未从预设纹理信息和文字信息对应关系中查找到所述纹理信息对应的文字信息,则从所述当前图像帧中确定所述纹理信息对应的图像数据;对所述图像数据进行文字识别,得到所述图像数据对应的文字信息。3.根据权利要求2所述的方法,其特征在于,所述对所述图像数据进行文字识别,得到所述图像数据对应的文字信息之后,所述方法还包括:将所述纹理信息和所述文字信息的映射关系更新至所述预设纹理信息和文字信息对应关系中。4.根据权利要求3所述的方法,其特征在于,所述当前图像帧包括至少一个图像纹理,其中,每一个图像纹理对应一个纹理标识信息;所述纹理信息包括所述文字图像对应的纹理标识信息和纹理坐标信息。5.根据权利要求4所述的方法,其特征在于,所述从所述当前图像帧中确定所述纹理信息对应的图像数据,包括:基于所述纹理标识信息和所述纹理坐标信息,从所述当前图像帧中定位所述图像数据。6.根据权利要求1所述的方法,其特征在...

【专利技术属性】
技术研发人员:高光磊商泽利李旻昊陈汉文黄文涛
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1