一种文字识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:34459886 阅读:22 留言:0更新日期:2022-08-06 17:17
本申请提供一种文字识别方法、装置、电子设备及存储介质,所述方法包括:获取各待识别文字;提取各所述待识别文字的目标特征;所述目标特征为表征所述待识别文字在待识别图像中的大小的特征;输出目标文字;所述目标文字为所述目标特征满足预设特征条件的待识别文字;所述预设特征条件为根据各所述待识别文字的目标特征设置的,用于区分出所述待识别文字中的目标文字的条件。本申请的方案通过提取各待识别文字的目标特征(目标特征为可以表征文字在图片中的大小的特征),根据目标特征是否满足预设条件,实现对于待识别文字的滤除,使得保留下来的待识别文字中,主要都是所需类型的文字,从而提高了对所需类型的文字的识别效果。果。果。

【技术实现步骤摘要】
一种文字识别方法、装置、电子设备及存储介质


[0001]本申请涉及文字识别领域,具体而言,涉及一种文字识别方法、文字识别装置、电子设备及存储介质。

技术介绍

[0002]目前,对于图片中的文字识别,常常采用OCR(optical character recognition,光学字符识别)技术进行识别。但是当图片里同时含有多种类型的文字时,采用OCR技术进行文字识别时,会实现对图片中的所有文字的识别输出,无法实现仅针对所需识别的某一种类型的文字的输出。而在实际应用中,往往存在着某些仅希望输出所需的某一种类型的文字的需求,而现有技术则无法满足该需求。
[0003]例如,在识字教学场景中,往往需要学生进行文字的抄写作业,例如图1所示。目前对于这种场景,若采用OCR技术,会将学生手写的文字和书本中本身的文字都识别出来并全部进行输出。而在实际应用中,教师或自动批改程序往往只关注学生手写的文字,从而导致采用OCR技术无法满足该场景的需求。

技术实现思路

[0004]有鉴于此,本申请实施例的目的在于提供一种文字识别方法,用以提高对所需类型的文字的识别效果。
[0005]第一方面,本申请提供一种文字识别方法,所述方法包括:获取各待识别文字;提取各所述待识别文字的目标特征;所述目标特征为表征所述待识别文字在待识别图像中的大小的特征;输出目标文字;所述目标文字为所述目标特征满足预设特征条件的待识别文字;所述预设特征条件为根据各所述待识别文字的目标特征设置的,用于区分出所述待识别文字中的目标文字的条件。r/>[0006]在实际应用过程中,往往不同类型的文字,在图片中所展现出来的大小会有一定的差异。以图1所示的场景为例,学生手写的文字和绝大多数的印刷文字之间,存在显著的大小差异。而在上述实现过程中,通过提取各待识别文字的目标特征(目标特征为可以表征文字在图片中的大小的特征),根据目标特征是否满足预设条件,实现对于待识别文字的滤除,使得保留下来的待识别文字中,主要都是所需类型的文字,从而提高了对所需类型的文字的识别效果。仍以图1所示的场景为例,采用本上述实现方案,可以有效滤除掉图片中的绝大多数的印刷文字,从而使得输出的目标文字中主要都是学生手写的文字。
[0007]一实施例中,获取各待识别文字,包括:获取所述待识别图像;对所述待识别图像进行文本识别,得到各所述待识别文字。
[0008]一实施例中,对所述待识别图像进行文本识别,得到各所述待识别文字,包括:对所述待识别图像进行文本识别,得到所述待识别图像中的文字集合;基于预设的目标文字集,对所述文字集合进行筛选,得到各所述待识别文字。
[0009]在实际应用中,实际需要关注的文字往往仅是图片中的某一部分文字。以图1场景
为例,该场景中,实际需要关注的文字仅有“内”和“肉”这两个文字。而本申请的上述实现过程,可以通过预设的目标文字集,实现对于无需关注的文字的提前滤除,从而降低后续需要进行目标特征提取以及预设特征条件是否满足等操作的待识别文字的数量,降低方案实施过程中的处理开销,提高处理效率。
[0010]一实施例中,所述目标特征包括以下至少之一:文字的高度;文字的宽度;文字的面积。
[0011]在上述实现过程中,通过获取文字的高度、文字的宽度、文字的面积至少一个特征,即可实现对于各待识别文字的区分,便于实施。
[0012]一实施例中,所述预设特征条件为:目标特征小于目标特征阈值;其中,所述目标特征阈值为各所述待识别文字的目标特征的中位数或平均数。
[0013]在上述实现过程中,通过将待识别文字的目标特征的中位数或平均数作为目标特征阈值,使得目标特征阈值具有与各待识别文字相关的参考性,便于提高最终输出的目标文字的准确率。
[0014]一实施例中,所述预设特征条件为:目标特征与目标值之差,小于预设的目标特征阈值;其中,所述目标值为各所述待识别文字的目标特征的中位数或平均数。
[0015]在上述实现过程中,通过将预设特征条件确定为目标特征与目标值之差,使得目标文字可以根据差值确定,以降低数据处理量,提高确定目标文字的效率。
[0016]一实施例中,所述目标特征阈值为:对所述目标值缩小预设比例后得到的值。
[0017]在上述实现过程中,通过将目标特征阈值确定为目标值缩小预设比例后得到的值,可以适应不同的应用场景,提高不同场景下,确定出的目标文字的准确率,提高方案的普适性。
[0018]第二方面,本申请提供一种文字识别装置,所述装置包括:获取模块,用于获取各待识别文字;提取模块,用于提取各所述待识别文字的目标特征;所述目标特征为表征所述待识别文字在待识别图像中的大小的特征;输出模块,用于输出目标文字;所述目标文字为所述目标特征满足预设特征条件的待识别文字;所述预设特征条件为根据各所述待识别文字的目标特征设置的,可以区分出所述待识别文字中的目标文字的条件。
[0019]第三方面,本申请提供一种电子设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器用于执行所述计算机可读指令,以实现上述文字识别方法或实现上述文字识别装置的功能。
[0020]第四方面,本申请提供一种存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述文字识别方法或实现上述文字识别装置的功能。
[0021]本申请的一个或多个实施例的细节在下面的附图和描述中提出。本申请的其它特征、目的和优点将从说明书、附图以及权利要求书变得明显。
附图说明
[0022]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以
根据这些附图获得其他相关的附图。
[0023]图1为本申请实施例提供的一种待识别图像的示意图;
[0024]图2为本申请实施例提供的第一种文字识别方法的流程示意图;
[0025]图3为本申请实施例提供的第二种文字识别方法的流程示意图;
[0026]图4为本申请实施例提供的第三种文字识别方法的流程示意图;
[0027]图5为本申请实施例提供的一种确定文字集合的示意图;
[0028]图6为本申请实施例提供的一种确定待识别文字的示意图;
[0029]图7为本申请实施例提供的一种确定目标文字的示意图;
[0030]图8为本申请实施例提供的一种文字识别装置的结构示意图;
[0031]图9为本申请实施例提供的一种电子设备的结构示意图。
[0032]图标:文字识别装置100;获取模块101;提取模块102;输出模块103。
具体实施方式
[0033]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文字识别方法,其特征在于,包括:获取各待识别文字;提取各所述待识别文字的目标特征;所述目标特征为表征所述待识别文字在待识别图像中的大小的特征;输出目标文字;所述目标文字为所述目标特征满足预设特征条件的待识别文字;所述预设特征条件为根据各所述待识别文字的目标特征设置的,用于区分出所述待识别文字中的目标文字的条件。2.如权利要求1所述的文字识别方法,其特征在于,获取各待识别文字,包括:获取所述待识别图像;对所述待识别图像进行文本识别,得到各所述待识别文字。3.如权利要求2所述的文字识别方法,其特征在于,对所述待识别图像进行文本识别,得到各所述待识别文字,包括:对所述待识别图像进行文本识别,得到所述待识别图像中的文字集合;基于预设的目标文字集,对所述文字集合进行筛选,得到各所述待识别文字。4.如权利要求1所述的文字识别方法,其特征在于,所述目标特征包括以下至少之一:文字的高度;文字的宽度;文字的面积。5.如权利要求1所述的文字识别方法,其特征在于,所述预设特征条件为:目标特征小于目标特征阈值;其中,所述目标特征阈值为各所述待识别文字的目标特征的中位数或平均数。6.如权利要求1...

【专利技术属性】
技术研发人员:李念王宇航曾鹏轩
申请(专利权)人:北京思明启创科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1