图像中文字的段落边界的识别方法、装置、设备及介质制造方法及图纸

技术编号:29462129 阅读:25 留言:0更新日期:2021-07-27 17:33
本申请涉及图像识别领域,揭示了一种图像中文字的段落边界的识别方法、装置、设备及介质,其中方法包括:识别获取的图像,以将所述图像中的文字进行分割;对分割后的所述文字进行位置标记,得到图像中的每一个文字的位置信息;根据所述位置信息依次选取图像的任一文字作为待定文字,以及获取与所述待定文字相邻的左边的第一文字、相邻的上边的第二文字;待定文字与第一文字、第二文字的相邻性及关联性,根据所述相邻性与关联性得到待定文字与第一文字、第二文字的连通性;将具有连通性的文字进行标记,对具有相同标记的文字进行聚合,得到聚合后的文字分段,根据文字分段确定图像中的文字的段落边界。本申请能够提高图像中文字边界的识别准确度。

Method, device, equipment and medium for recognizing paragraph boundary of text in image

【技术实现步骤摘要】
图像中文字的段落边界的识别方法、装置、设备及介质
本申请涉及到图像及文字识别领域,特别是涉及到一种图像中文字的段落边界的识别方法、装置、计算机设备及存储介质。
技术介绍
目前的段落划分算法,是在标准的正面图像中,利用图像的信息将图像中间隔较小的区域进行连通,得到段落,该方式的受限较大,当图像为不标准的图像时,如用户拍摄的图片,受限于光线,角度,单据样式等问题,其成像结果较差,此时无法准确地对图像内的文字划分出区域,且识别的段落的准确率较低。
技术实现思路
本申请的主要目的为提供一种图像中文字的段落边界的识别方法、装置、计算机设备及存储介质,旨在解决目前无法准确地对图像内的文字划分出区域的问题。为了实现上述专利技术目的,本申请提出一种图像中文字的段落边界的识别方法,包括:识别获取的图像,以将所述图像中的文字进行分割;对分割后的所述文字进行位置标记,得到图像中的每一个文字的位置信息;根据所述位置信息依次选取图像的任一文字作为待定文字,以及获取与所述待定文字相邻的左边的第一文字、相邻的上边的第二文字;计算所述待定文字分别与第一文字、第二文字的像素距离,根据所述像素距离确定待定文字分别与第一文字、第二文字的相邻性,基于文字语义确定所述待定文字分别与第一文字、第二文字的关联性,根据所述相邻性与关联性得到待定文字分别与第一文字、第二文字的连通性;将具有连通性的文字进行标记,根据文字的标记对具有相同标记的文字进行聚合,得到聚合后的文字分段,根据所述文字分段确定图像中的文字的段落边界。进一步地,所述对所述文字进行位置标记,得到图像中的每一个文字的位置信息之后,还包括:根据所述位置信息获取图像中的第一行文字,对所述第一行文字以第一预设标号进行位置标记;根据所述位置信息获取图像中的每一行文字的第一个文字,对所述每一行文字的第一个文字以第二预设标号进行位置标记。进一步地,所述根据所述位置信息依次选取图像的任一文字作为待定文字,包括:根据所述位置信息获取图像中的每一行文字的第一个文字,将所述每一行文字的第一个文字作为第一次选取的待定文字;根据所述位置信息的顺序从每一行的剩余文字依次选取一个文字作为第二次选取的待定文字,直至完成每一行所有文字的选取。进一步地,所述计算所述待定文字分别与第一文字、第二文字的像素距离,根据所述像素距离确定待定文字分别与第一文字、第二文字的相邻性,包括:获取所述待定文字分别与第一文字、第二文字的像素距离;将所述像素距离按照预设的比例进行缩放,得到缩放后的待定文字与第一文字的第一像素距离以及待定文字与第二文字的第二像素距离;若所述第一像素距离小于预设值,确定所述待定文字与第一文字具有相邻性;若所述第二像素距离小于预设值,确定所述待定文字与第二文字具有相邻性。进一步地,所述将具有连通性的文字进行标记,包括:当所述待定文字与第一文字具有连通性,将所述待定文字与第一文字以相同的标号进行标记;当所述待定文字与第二文字具有连通性,将所述待定文字与第二文字以相同的标号进行标记;当所述待定文字与第一文字、第二文字均具有连通性,将所述待定文字、第一文字以及第二文字均以相同的标号进行标记。进一步地,所述识别获取的图像,以将所述图像中的文字进行分割,包括:识别所述图像存在的文字;获取预设的分割框,将所述分割框覆盖在每一个所述文字上,以对所述图像中的文字进行分割;所述分割框为能覆盖每一个所述文字的最小面积的矩形。进一步地,所述根据所述文字分段确定图像中的文字的段落边界之后,还包括:生成所述段落边界的框线;将所述段落边界的框线叠加在所述图像的上方。本申请还提供一种图像中文字的段落边界的识别装置,包括:图像分割模块:用于识别获取的图像,以将所述图像中的文字进行分割;位置标记模块:用于对分割后的所述文字进行位置标记,得到图像中的每一个文字的位置信息;文字选取模块:用于根据所述位置信息依次选取图像的任一文字作为待定文字,以及获取与所述待定文字相邻的左边的第一文字、相邻的上边的第二文字;连通性模块:用于计算所述待定文字分别与第一文字、第二文字的像素距离,根据所述像素距离确定待定文字分别与第一文字、第二文字的相邻性,基于文字语义确定所述待定文字分别与第一文字、第二文字的关联性,根据所述相邻性与关联性得到待定文字分别与第一文字、第二文字的连通性;段落确定模块:用于将具有连通性的文字进行标记,根据文字的标记对具有相同标记的文字进行聚合,得到聚合后的文字分段,根据所述文字分段确定图像中的文字的段落边界。本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述图像中文字的段落边界的识别方法的步骤。本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述图像中文字的段落边界的识别方法的步骤。本申请例提供了一种识别图像中文字的段落边界的方法,在获取图像后,识别所述图像,先将图像中的每一个文字都作为单独存在的对象进行分割,得到图像中每一个文字的位置分布,再对分割后的文字进行位置标记,得到图像中的每一个文字的位置信息,所述位置信息可以表征一个文字处于另一个文字的方位,再选定任一文字作为待定文字,以及获取与所述待定文字相邻的左边的第一文字、相邻的上边的第二文字,计算所述待定文字与第一文字、第二文字的像素距离,根根据所述像素距离确定待定文字与第一文字、第二文字的相邻性,再基于文字语义确定所述待定文字与第一文字、第二文字的关联性,根据所述相邻性与关联性得到待定文字与第一文字、第二文字的连通性,将具有连通性的文字进行标记,根据文字的标记对文字进行聚合,确定图像中的文字的分段,可以清楚地确定图像中文字的段落边界,通过距离识别与语义识别的结合提高图像中文字的段落边界识别的准确性。附图说明图1为本申请图像中文字的段落边界的识别方法的一实施例流程示意图;图2为本申请图像中文字的段落边界的识别方法的另一实施例流程示意图;图3为本申请BERT模型的一实施例示意图;图4为本申请图像中文字的段落边界的识别装置的一实施例结构示意图;图5为本申请计算机设备的一实施例结构示意框图。本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。参照图1,本申请实施例提供一种图像中文字的段落边界的识别方法,包括步骤S10-S50,对于所述图像中文字的段落边界的识别方法的各个步骤的详细阐述如下。S10、识别获取的图像,以将所述图像中的文本文档来自技高网...

【技术保护点】
1.一种图像中文字的段落边界的识别方法,其特征在于,包括:/n识别获取的图像,以将所述图像中的文字进行分割;/n对分割后的所述文字进行位置标记,得到图像中的每一个文字的位置信息;/n根据所述位置信息依次选取图像的任一文字作为待定文字,以及获取与所述待定文字相邻的左边的第一文字、相邻的上边的第二文字;/n计算所述待定文字分别与第一文字、第二文字的像素距离,根据所述像素距离确定待定文字分别与第一文字、第二文字的相邻性,基于文字语义确定所述待定文字分别与第一文字、第二文字的关联性,根据所述相邻性与关联性得到待定文字分别与第一文字、第二文字的连通性;/n将具有连通性的文字进行标记,根据文字的标记对具有相同标记的文字进行聚合,得到聚合后的文字分段,根据所述文字分段确定图像中的文字的段落边界。/n

【技术特征摘要】
1.一种图像中文字的段落边界的识别方法,其特征在于,包括:
识别获取的图像,以将所述图像中的文字进行分割;
对分割后的所述文字进行位置标记,得到图像中的每一个文字的位置信息;
根据所述位置信息依次选取图像的任一文字作为待定文字,以及获取与所述待定文字相邻的左边的第一文字、相邻的上边的第二文字;
计算所述待定文字分别与第一文字、第二文字的像素距离,根据所述像素距离确定待定文字分别与第一文字、第二文字的相邻性,基于文字语义确定所述待定文字分别与第一文字、第二文字的关联性,根据所述相邻性与关联性得到待定文字分别与第一文字、第二文字的连通性;
将具有连通性的文字进行标记,根据文字的标记对具有相同标记的文字进行聚合,得到聚合后的文字分段,根据所述文字分段确定图像中的文字的段落边界。


2.根据权利要求1所述的图像中文字的段落边界的识别方法,其特征在于,所述对所述文字进行位置标记,得到图像中的每一个文字的位置信息之后,还包括:
根据所述位置信息获取图像中的第一行文字,对所述第一行文字以第一预设标号进行位置标记;
根据所述位置信息获取图像中的每一行文字的第一个文字,对所述每一行文字的第一个文字以第二预设标号进行位置标记。


3.根据权利要求2所述的图像中文字的段落边界的识别方法,其特征在于,所述根据所述位置信息依次选取图像的任一文字作为待定文字,包括:
根据所述位置信息获取图像中的每一行文字的第一个文字,将所述每一行文字的第一个文字作为第一次选取的待定文字;
根据所述位置信息的顺序从每一行的剩余文字依次选取一个文字作为第二次选取的待定文字,直至完成每一行所有文字的选取。


4.根据权利要求1所述的图像中文字的段落边界的识别方法,其特征在于,计算所述待定文字分别与第一文字、第二文字的像素距离,根据所述像素距离确定待定文字分别与第一文字、第二文字的相邻性,包括:
获取所述待定文字分别与第一文字、第二文字的像素距离;
将所述像素距离按照预设的比例进行缩放,得到缩放后的待定文字与第一文字的第一像素距离以及待定文字与第二文字的第二像素距离;
若所述第一像素距离小于预设值,确定所述待定文字与第一文字具有相邻性;
若所述第二像素距离小于预设值,确定所述待定文字与第二文字具有相邻性。


5.根据权利要求1所述的图像中文字的段落边界的识别方法,...

【专利技术属性】
技术研发人员:马跃
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1