文本识别方法、电子设备及存储介质技术

技术编号:36216551 阅读:53 留言:0更新日期:2023-01-04 12:13
本申请提供一种文本识别方法、电子设备及存储介质,涉及数据处理技术领域。首先实现了待识别的文本图像的自动化裁剪;而后,针对裁剪得到的相邻的两张裁剪图像,进行拼接区域图像的确定,得到拼接区域图像对应的各文件检测框,以解决上述进行图像裁剪时可能造成的相邻裁剪图像的连接处文字被截断,从而导致文本信息识别不完整或重复的问题。而针对重复识别的问题,还可进一步地通过拼接区域图像对应的文本检测框对裁剪图像对应的文本检测框进行去重处理。最后通过对各裁剪图像和拼接区域图像进行排序,并依次识别各裁剪图像对应的文件检测框和各拼接区域图像对应的文本检测框,得到待识别的文本图像(长图)的文本信息识别结果。待识别的文本图像(长图)的文本信息识别结果。待识别的文本图像(长图)的文本信息识别结果。

【技术实现步骤摘要】
文本识别方法、电子设备及存储介质


[0001]本申请涉及数据处理
,具体而言,涉及一种文本识别方法、电子设备及存储介质。

技术介绍

[0002]长图作为图像的一种,由于其能够承载更多的信息量而被广泛应用。可从图片的长边与短边之比来定义长图,一般来说长短边之比大于等于4,就可以认为是长图。由于长图的尺寸较大,包含的文字较多,对长图文本识别的难度较大。
[0003]现有技术中,对于长图文本的识别,需要用户手动将长图裁剪成多个小尺寸的图片,再分别对每一张小尺寸的图片中的文本进行识别。
[0004]由于需要用户手动裁剪多次才能完成识别需求,比较费时费力,从而导致长图文本的识别效率较低。

技术实现思路

[0005]本申请的目的在于,针对上述现有技术中的不足,提供一种文本识别方法、电子设备及存储介质,以便于解决现有技术中存在的长图识别效率较低的问题。
[0006]为实现上述目的,本申请实施例采用的技术方案如下:
[0007]第一方面,本申请实施例提供了一种文本识别方法,包括:
[0008]根据待识别的文本图像对应的各待裁剪图像的裁剪尺寸、以及各待裁剪图像的裁剪顺序,对所述待识别的文本图像进行顺序裁剪,得到按顺序依次排列的目标数量的裁剪图像,并依次确定各裁剪图像对应的至少一个文本检测框,各文本检测框中包含裁剪图像中的文本信息,各文本检测框包含的文本信息不重叠;
[0009]分别确定各相邻的两张裁剪图像的拼接区域图像、以及各拼接区域图像对应的至少一个文本检测框,并根据各拼接区域图像对应的至少一个文本检测框对各裁剪图像对应的各文本检测框进行去重处理;
[0010]根据各裁剪图像在所述待识别的文本图像中的裁剪顺序、以及各拼接区域图像与裁剪图像的归属关系,确定各裁剪图像以及各拼接区域图像的排列顺序;
[0011]按照各裁剪图像以及各拼接区域图像的排列顺序,依次对各裁剪图像对应的各文本检测框中的文本信息以及各拼接区域图像对应的各文本检测框中的文本信息进行识别,并依次输出各裁剪图像的文本信息以及各拼接区域图像的文本信息;
[0012]按照各裁剪图像的文本信息以及各拼接区域图像的文本信息的输出顺序对各文本信息进行串接,得到所述待识别的文本图像所包含的文本信息。
[0013]可选地,所述根据各拼接区域图像对应的至少一个文本检测框对各裁剪图像对应的各文本检测框进行去重处理,包括:
[0014]将各裁剪图像对应的各坐标转换后的文本检测框中与各拼接区域图像对应的各坐标转换后的文本检测框存在重叠的文本检测框确定为第一文件检测框,得到第一检测框
集合;
[0015]将各拼接区域图像对应的各坐标转换后的文本检测框确定为第二文件检测框,得到第二检测框集合;
[0016]分别计算第一检测框集合中各第一文件检测框与第二检测框集合中各第二文件检测框的重叠指标;
[0017]根据所述重叠指标,对各裁剪图像对应的各坐标转换后的文本检测框进行去重。
[0018]可选地,分别确定各相邻的两张裁剪图像的拼接区域图像、以及各拼接区域图像对应的至少一个文本检测框,包括:
[0019]根据相邻的两张裁剪图像的文本信息检测结果,分别确定相邻的两张裁剪图像中各裁剪图像的子裁剪尺寸,并按照相邻的两张裁剪图像中各裁剪图像的子裁剪尺寸分别从相邻的两张裁剪图像中裁剪得到子裁剪图像;
[0020]将子裁剪图像进行拼接,得到相邻的两张裁剪图像对应的拼接区域图像;
[0021]采用文本检测算法,确定相邻的两张裁剪图像对应的拼接区域图像所对应的至少一个文本检测框。
[0022]可选地,所述根据相邻的两张裁剪图像的文本信息检测结果,分别确定相邻的两张裁剪图像中各裁剪图像的子裁剪尺寸,包括:
[0023]若相邻的两张裁剪图像中排序在前的裁剪图像的文本信息检测结果中不包含文本信息,则根据排序在前的裁剪图像的尺寸,确定排序在前的裁剪图像的子裁剪尺寸;
[0024]若相邻的两张裁剪图像中排序在前的裁剪图像的文本信息检测结果中包含文本信息,则根据排序在前的裁剪图像的尺寸、以及排序在前的裁剪图像对应的目标文本检测框的坐标,确定排序在前的裁剪图像的子裁剪尺寸。
[0025]可选地,所述根据相邻的两张裁剪图像的文本信息检测结果,分别确定相邻的两张裁剪图像中各裁剪图像的子裁剪尺寸,包括:
[0026]若相邻的两张裁剪图像中排序在后的裁剪图像的文本信息检测结果中不包含文本信息,且排序在后的裁剪图像的排序为倒数第二,则根据排序在后的裁剪图像的尺寸、以及排序为最后一个的裁剪图像的尺寸,确定排序在后的裁剪图像的子裁剪尺寸;
[0027]若相邻的两张裁剪图像中排序在后的裁剪图像的文本信息检测结果中不包含文本信息,且排序在后的裁剪图像的排序不为倒数第二,则根据排序在后的裁剪图像的尺寸,确定排序在后的裁剪图像的子裁剪尺寸。
[0028]可选地,所述根据相邻的两张裁剪图像的文本信息检测结果,分别确定相邻的两张裁剪图像中各裁剪图像的子裁剪尺寸,包括:
[0029]若相邻的两张裁剪图像中排序在后的裁剪图像的文本信息检测结果包含文本信息,则根据排序在后的裁剪图像的尺寸、以及排序在后的裁剪图像对应的目标文本检测框的坐标,确定排序在后的裁剪图像的子裁剪尺寸。
[0030]可选地,所述根据各拼接区域图像对应的至少一个文本检测框对各裁剪图像对应的各文本检测框进行去重处理之前,所述方法包括:
[0031]根据各裁剪图像的排列顺序、以及各拼接区域图像的排列顺序,分别确定各裁剪图像的尺寸偏差、以及各拼接区域图像的尺寸偏差;
[0032]根据各裁剪图像的尺寸偏差,对各裁剪图像对应的各文本检测框的坐标进行调
整,得到各裁剪图像对应的各坐标转换后的文本检测框;
[0033]根据各拼接区域图像的尺寸偏差,对各拼接区域图像对应的各文本检测框的坐标进行调整,得到各拼接区域图像对应的各坐标转换后的文本检测框。
[0034]可选地,所述根据所述待识别的文本图像对应的各待裁剪图像的裁剪尺寸、以及各待裁剪图像的裁剪顺序,对所述待识别的文本图像进行顺序裁剪,得到按顺序依次排列的目标数量的裁剪图像之前,所述方法包括:
[0035]根据所述待识别的文本图像的尺寸,确定所述待识别的文本图像的长边与短边的比值;
[0036]根据待识别的文本图像的长边与短边的比值、以及文本检测算法允许识别的最大文本图像的长边与短边的比值,确定各待裁剪图像的尺寸、以及待裁剪图像的数量。
[0037]第二方面,本申请实施例还提供了一种文本识别装置,包括:确定模块、去重模块、文本识别模块、文本处理模块;
[0038]所述确定模块,用于根据待识别的文本图像对应的各待裁剪图像的裁剪尺寸、以及各待裁剪图像的裁剪顺序,对所述待识别的文本图像进行顺序裁剪,得到按顺序依次排列的目标数量的裁剪图像,并依次确定各裁剪图像对应的至少一个文本检测框本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本识别方法,其特征在于,包括:根据待识别的文本图像对应的各待裁剪图像的裁剪尺寸、以及各待裁剪图像的裁剪顺序,对所述待识别的文本图像进行顺序裁剪,得到按顺序依次排列的目标数量的裁剪图像,并依次确定各裁剪图像对应的至少一个文本检测框,各文本检测框中包含裁剪图像中的文本信息,各文本检测框包含的文本信息不重叠;分别确定各相邻的两张裁剪图像的拼接区域图像、以及各拼接区域图像对应的至少一个文本检测框,并根据各拼接区域图像对应的至少一个文本检测框对各裁剪图像对应的各文本检测框进行去重处理;根据各裁剪图像在所述待识别的文本图像中的裁剪顺序、以及各拼接区域图像与裁剪图像的归属关系,确定各裁剪图像以及各拼接区域图像的排列顺序;按照各裁剪图像以及各拼接区域图像的排列顺序,依次对各裁剪图像对应的各文本检测框中的文本信息以及各拼接区域图像对应的各文本检测框中的文本信息进行识别,并依次输出各裁剪图像的文本信息以及各拼接区域图像的文本信息;按照各裁剪图像的文本信息以及各拼接区域图像的文本信息的输出顺序对各文本信息进行串接,得到所述待识别的文本图像所包含的文本信息。2.根据权利要求1所述的方法,其特征在于,所述根据各拼接区域图像对应的至少一个文本检测框对各裁剪图像对应的各文本检测框进行去重处理,包括:将各裁剪图像对应的各坐标转换后的文本检测框中与各拼接区域图像对应的各坐标转换后的文本检测框存在重叠的文本检测框确定为第一文件检测框,得到第一检测框集合;将各拼接区域图像对应的各坐标转换后的文本检测框确定为第二文件检测框,得到第二检测框集合;分别计算第一检测框集合中各第一文件检测框与第二检测框集合中各第二文件检测框的重叠指标;根据所述重叠指标,对各裁剪图像对应的各坐标转换后的文本检测框进行去重。3.根据权利要求1所述的方法,其特征在于,分别确定各相邻的两张裁剪图像的拼接区域图像、以及各拼接区域图像对应的至少一个文本检测框,包括:根据相邻的两张裁剪图像的文本信息检测结果,分别确定相邻的两张裁剪图像中各裁剪图像的子裁剪尺寸,并按照相邻的两张裁剪图像中各裁剪图像的子裁剪尺寸分别从相邻的两张裁剪图像中裁剪得到子裁剪图像;将子裁剪图像进行拼接,得到相邻的两张裁剪图像对应的拼接区域图像;采用文本检测算法,确定相邻的两张裁剪图像对应的拼接区域图像所对应的至少一个文本检测框。4.根据权利要求3所述的方法,其特征在于,所述根据相邻的两张裁剪图像的文本信息检测结果,分别确定相邻的两张裁剪图像中各裁剪图像的子裁剪尺寸,包括:若相邻的两张裁剪图像中排序在前的裁剪图像的文本信息检测结果中不包含文本信息,则根据排序在前的裁剪图像的尺寸,确定排序在前的裁剪图像的子裁剪尺寸;若相邻的两张裁剪图像中排序在前的裁剪图像的文本信息检测结果中包含文本信息,则根据排序在前的裁剪图像的尺寸...

【专利技术属性】
技术研发人员:陈姝熊英超徐家伟高明
申请(专利权)人:南京中孚信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1