图像中文字的段落边界的识别方法、装置、设备及介质制造方法及图纸

技术编号：29462129 阅读：37 留言：0更新日期：2021-07-27 17:33

本申请涉及图像识别领域，揭示了一种图像中文字的段落边界的识别方法、装置、设备及介质，其中方法包括：识别获取的图像，以将所述图像中的文字进行分割；对分割后的所述文字进行位置标记，得到图像中的每一个文字的位置信息；根据所述位置信息依次选取图像的任一文字作为待定文字，以及获取与所述待定文字相邻的左边的第一文字、相邻的上边的第二文字；待定文字与第一文字、第二文字的相邻性及关联性，根据所述相邻性与关联性得到待定文字与第一文字、第二文字的连通性；将具有连通性的文字进行标记，对具有相同标记的文字进行聚合，得到聚合后的文字分段，根据文字分段确定图像中的文字的段落边界。本申请能够提高图像中文字边界的识别准确度。

Method, device, equipment and medium for recognizing paragraph boundary of text in image

全部详细技术资料下载

【技术实现步骤摘要】
图像中文字的段落边界的识别方法、装置、设备及介质
本申请涉及到图像及文字识别领域，特别是涉及到一种图像中文字的段落边界的识别方法、装置、计算机设备及存储介质。
技术介绍
目前的段落划分算法，是在标准的正面图像中，利用图像的信息将图像中间隔较小的区域进行连通，得到段落，该方式的受限较大，当图像为不标准的图像时，如用户拍摄的图片，受限于光线，角度，单据样式等问题，其成像结果较差，此时无法准确地对图像内的文字划分出区域，且识别的段落的准确率较低。
技术实现思路
本申请的主要目的为提供一种图像中文字的段落边界的识别方法、装置、计算机设备及存储介质，旨在解决目前无法准确地对图像内的文字划分出区域的问题。为了实现上述专利技术目的，本申请提出一种图像中文字的段落边界的识别方法，包括：识别获取的图像，以将所述图像中的文字进行分割；对分割后的所述文字进行位置标记，得到图像中的每一个文字的位置信息；根据所述位置信息依次选取图像的任一文字作为待定文字，以及获取与所述待定文字相邻的左边的第一文字、...

【技术保护点】
1.一种图像中文字的段落边界的识别方法，其特征在于，包括：/n识别获取的图像，以将所述图像中的文字进行分割；/n对分割后的所述文字进行位置标记，得到图像中的每一个文字的位置信息；/n根据所述位置信息依次选取图像的任一文字作为待定文字，以及获取与所述待定文字相邻的左边的第一文字、相邻的上边的第二文字；/n计算所述待定文字分别与第一文字、第二文字的像素距离，根据所述像素距离确定待定文字分别与第一文字、第二文字的相邻性，基于文字语义确定所述待定文字分别与第一文字、第二文字的关联性，根据所述相邻性与关联性得到待定文字分别与第一文字、第二文字的连通性；/n将具有连通性的文字进行标记，根据文字的标记对具有...

【技术特征摘要】
1.一种图像中文字的段落边界的识别方法，其特征在于，包括：
识别获取的图像，以将所述图像中的文字进行分割；
对分割后的所述文字进行位置标记，得到图像中的每一个文字的位置信息；
根据所述位置信息依次选取图像的任一文字作为待定文字，以及获取与所述待定文字相邻的左边的第一文字、相邻的上边的第二文字；
计算所述待定文字分别与第一文字、第二文字的像素距离，根据所述像素距离确定待定文字分别与第一文字、第二文字的相邻性，基于文字语义确定所述待定文字分别与第一文字、第二文字的关联性，根据所述相邻性与关联性得到待定文字分别与第一文字、第二文字的连通性；
将具有连通性的文字进行标记，根据文字的标记对具有相同标记的文字进行聚合，得到聚合后的文字分段，根据所述文字分段确定图像中的文字的段落边界。

2.根据权利要求1所述的图像中文字的段落边界的识别方法，其特征在于，所述对所述文字进行位置标记，得到图像中的每一个文字的位置信息之后，还包括：
根据所述位置信息获取图像中的第一行文字，对所述第一行文字以第一预设标号进行位置标记；
根据所述位置信息获取图像中的每一行文字的第一个文字，对所述每一行文字的第一个文字以第二预设标号进行位置标记。

3.根据权利要求2所述的图像中文字的段落边界的识别方法，其特征在于，所述根据所述位置信息依次选取图像的任一文字作为待定文字，包括：
根据所述位置信息获取图像中的每一行文字的第一个文字，将所述每一行文字的第一个文字作为第一次选取的待定文字；
根据所述位置信息的顺序从每一行的剩余文字依次选取一个文字作为第二次选取的待定文字，直至完成每一行所有文字的选取。

4.根据权利要求1所述的图像中文字的段落边界的识别方法，其特征在于，计算所述待定文字分别与第一文字、第二文字的像素距离，根据所述像素距离确定待定文字分别与第一文字、第二文字的相邻性，包括：
获取所述待定文字分别与第一文字、第二文字的像素距离；
将所述像素距离按照预设的比例进行缩放，得到缩放后的待定文字与第一文字的第一像素距离以及待定文字与第二文字的第二像素距离；
若所述第一像素距离小于预设值，确定所述待定文字与第一文字具有相邻性；
若所述第二像素距离小于预设值，确定所述待定文字与第二文字具有相邻性。

5.根据权利要求1所述的图像中文字的段落边界的识别方法，...

【专利技术属性】
技术研发人员：马跃，
申请(专利权)人：中国平安人寿保险股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人