一种基于全卷积神经网络的文本行中的字符切分方法技术

技术编号：22659322 阅读：47 留言：0更新日期：2019-11-28 03:37

本发明专利技术公开了一种基于全卷积神经网络的文本行中的字符切分方法，所述方法包括：获取待检测的文本行图像区域；采用语义分割模型对所述文本行图像区域进行像素分类，获取分类结果；获取所述分类结果中属于同一类别的分类结果；对所述同一类别的分类结果进行区域划分，获得划分结果；根据划分结果，获得文字切分结果。应用本发明专利技术实施例，能够有效的避免复杂背景区域以及噪声的干扰，对大小，间距不统一的多语言文字混和的文本行图像进行精确的字符切分。

A character segmentation method in text line based on full convolution neural network

The invention discloses a character segmentation method in a text line based on the full convolution neural network, the method includes: obtaining the text line image area to be detected; using the semantic segmentation model to classify the text line image area by pixels, obtaining the classification result; obtaining the classification result belonging to the same category in the classification result; and classifying the same category According to the results, the text segmentation results are obtained. The embodiment of the invention can effectively avoid the interference of complex background area and noise, and accurately segment the text line image with mixed multilingual text of different size and spacing.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于全卷积神经网络的文本行中的字符切分方法
本专利技术涉及图像处理
，尤其涉及一种基于全卷积神经网络的文本行中的字符切分方法。
技术介绍
随着移动终端和移动互联网的快速发展与广泛普及，通过摄像录像进行资讯的获取，分享和检索成为了现代人们的日常生活方式。在通过摄像头所获得的图像信息中，文字信息往往是用户首先会去注意和理解的内容，因此，通过识别图像中的文字信息能够使用户更方便的理解图片，同样也可以使图像文字转化为语音方便人们感受。近年来，文本行的文字分割和识别是通过传统的图像处理方式进行，处理前需要经过大量的预处理，包括降噪，增强对比度，灰度化，二值化等。文字切割包括：连通域算法，识别则通过规则和特征的匹配进行。由于人工设定的阈值，特征，规则受较多的主观因素影响，通用性较差，对于多种变化的复杂场景,包括：背景遮挡文字，切分文字，污损文字，粘连文字，传统的字符切分方法往往不尽人意。另外文字的形态变化如：艺术字，手写字，渐变色文字会对规则特征匹配产生较大的影响。因此，传统的字符切分方法在对复杂背景下的文本行中的字符进行切分时很容易会产生字符过切、漏切、错切等问题，导致字符切分的准确率较低。
技术实现思路
本专利技术的目的在于提供一种基于全卷积神经网络的文本行中的字符切分方法，旨在解决现有的字符进行切分时出现字符过切、漏切、错切的问题,通过将文本行图像缩放至不同尺度与对应大小的上采样层进行跳跃连接，以还原得到初始分辨率的特征信息图，在此过程中高级的语义特征信息和低级的边缘特征信息都...

【技术保护点】
1.一种基于全卷积神经网络的文本行中的字符切分方法，其特征在于，所述方法包括：/n获取待检测的文本行图像区域；/n采用语义分割模型对所述文本行图像区域进行像素分类，获取分类结果；/n获取所述分类结果中属于同一类别的分类结果；/n对所述同一类别的分类结果进行区域划分，获得划分结果；/n根据划分结果，获得文字切分结果。/n

【技术特征摘要】
1.一种基于全卷积神经网络的文本行中的字符切分方法，其特征在于，所述方法包括：
获取待检测的文本行图像区域；
采用语义分割模型对所述文本行图像区域进行像素分类，获取分类结果；
获取所述分类结果中属于同一类别的分类结果；
对所述同一类别的分类结果进行区域划分，获得划分结果；
根据划分结果，获得文字切分结果。

2.根据权利要求1所述的一种基于全卷积神经网络的文本行中的字符切分方法，其特征在于，所述获取待检测的文本行图像区域的步骤，包括：
获取待检测文本图像；
对所述待检测文本图像进行预处理，获取所述待检测文本图像所对应的单行文本行；
将所述单行文本行所组成的区域确定为待检测的文本行图像区域。

3.根据权利要求1所述的一种基于全卷积神经网络的文本行中的字符切分方法，其特征在于，所述采用语义分割模型对所述文本行图像区域进行像素分类，获取分类结果步骤，包括：
根据语义分割模型的编码器，提取所述文本行图像区域的文字边缘特征；
根据语义分割模型中的解码器，对所述文字边缘特征信息进行空间位置还原和像素分类。

4.根据权利要求2所述的一种基于全卷积神经网络的文本行中的字符切分方法，其特征在于，所述对所述同一类别的分类结果进行区域划分，获得划分结果，步骤包括：
对连通区域进行标记搜索，在所述同一类别的分类结果中，查找连通区域并标记；
获取相邻且具有相同特性的联通区域进行合并，并对合并区域进行标记。

5.根据权利要求3所述的一种基于全卷积神经网络的文本行中的字符切分方法，其特征在于，所述根据划分结果，获得文字切分结果的步骤，包括：
根据文字的类别标记，获取文字字符块，并记录所...

【专利技术属性】
技术研发人员：刘晋，余超，
申请(专利权)人：上海海事大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人