【技术实现步骤摘要】
图像中文字的段落边界的识别方法、装置、设备及介质
本申请涉及到图像及文字识别领域,特别是涉及到一种图像中文字的段落边界的识别方法、装置、计算机设备及存储介质。
技术介绍
目前的段落划分算法,是在标准的正面图像中,利用图像的信息将图像中间隔较小的区域进行连通,得到段落,该方式的受限较大,当图像为不标准的图像时,如用户拍摄的图片,受限于光线,角度,单据样式等问题,其成像结果较差,此时无法准确地对图像内的文字划分出区域,且识别的段落的准确率较低。
技术实现思路
本申请的主要目的为提供一种图像中文字的段落边界的识别方法、装置、计算机设备及存储介质,旨在解决目前无法准确地对图像内的文字划分出区域的问题。为了实现上述专利技术目的,本申请提出一种图像中文字的段落边界的识别方法,包括:识别获取的图像,以将所述图像中的文字进行分割;对分割后的所述文字进行位置标记,得到图像中的每一个文字的位置信息;根据所述位置信息依次选取图像的任一文字作为待定文字,以及获取与所述待定文字相邻的左边的第一文字、相邻的上边的第二文字;计算所述待定文字分别与第一文字、第二文字的像素距离,根据所述像素距离确定待定文字分别与第一文字、第二文字的相邻性,基于文字语义确定所述待定文字分别与第一文字、第二文字的关联性,根据所述相邻性与关联性得到待定文字分别与第一文字、第二文字的连通性;将具有连通性的文字进行标记,根据文字的标记对具有相同标记的文字进行聚合,得到聚合后的文字分段,根据所述文字分段确定图像 ...
【技术保护点】
1.一种图像中文字的段落边界的识别方法,其特征在于,包括:/n识别获取的图像,以将所述图像中的文字进行分割;/n对分割后的所述文字进行位置标记,得到图像中的每一个文字的位置信息;/n根据所述位置信息依次选取图像的任一文字作为待定文字,以及获取与所述待定文字相邻的左边的第一文字、相邻的上边的第二文字;/n计算所述待定文字分别与第一文字、第二文字的像素距离,根据所述像素距离确定待定文字分别与第一文字、第二文字的相邻性,基于文字语义确定所述待定文字分别与第一文字、第二文字的关联性,根据所述相邻性与关联性得到待定文字分别与第一文字、第二文字的连通性;/n将具有连通性的文字进行标记,根据文字的标记对具有相同标记的文字进行聚合,得到聚合后的文字分段,根据所述文字分段确定图像中的文字的段落边界。/n
【技术特征摘要】
1.一种图像中文字的段落边界的识别方法,其特征在于,包括:
识别获取的图像,以将所述图像中的文字进行分割;
对分割后的所述文字进行位置标记,得到图像中的每一个文字的位置信息;
根据所述位置信息依次选取图像的任一文字作为待定文字,以及获取与所述待定文字相邻的左边的第一文字、相邻的上边的第二文字;
计算所述待定文字分别与第一文字、第二文字的像素距离,根据所述像素距离确定待定文字分别与第一文字、第二文字的相邻性,基于文字语义确定所述待定文字分别与第一文字、第二文字的关联性,根据所述相邻性与关联性得到待定文字分别与第一文字、第二文字的连通性;
将具有连通性的文字进行标记,根据文字的标记对具有相同标记的文字进行聚合,得到聚合后的文字分段,根据所述文字分段确定图像中的文字的段落边界。
2.根据权利要求1所述的图像中文字的段落边界的识别方法,其特征在于,所述对所述文字进行位置标记,得到图像中的每一个文字的位置信息之后,还包括:
根据所述位置信息获取图像中的第一行文字,对所述第一行文字以第一预设标号进行位置标记;
根据所述位置信息获取图像中的每一行文字的第一个文字,对所述每一行文字的第一个文字以第二预设标号进行位置标记。
3.根据权利要求2所述的图像中文字的段落边界的识别方法,其特征在于,所述根据所述位置信息依次选取图像的任一文字作为待定文字,包括:
根据所述位置信息获取图像中的每一行文字的第一个文字,将所述每一行文字的第一个文字作为第一次选取的待定文字;
根据所述位置信息的顺序从每一行的剩余文字依次选取一个文字作为第二次选取的待定文字,直至完成每一行所有文字的选取。
4.根据权利要求1所述的图像中文字的段落边界的识别方法,其特征在于,计算所述待定文字分别与第一文字、第二文字的像素距离,根据所述像素距离确定待定文字分别与第一文字、第二文字的相邻性,包括:
获取所述待定文字分别与第一文字、第二文字的像素距离;
将所述像素距离按照预设的比例进行缩放,得到缩放后的待定文字与第一文字的第一像素距离以及待定文字与第二文字的第二像素距离;
若所述第一像素距离小于预设值,确定所述待定文字与第一文字具有相邻性;
若所述第二像素距离小于预设值,确定所述待定文字与第二文字具有相邻性。
5.根据权利要求1所述的图像中文字的段落边界的识别方法,...
【专利技术属性】
技术研发人员:马跃,
申请(专利权)人:中国平安人寿保险股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。