【技术实现步骤摘要】
本专利技术涉及图像处理领域,具体而言,涉及一种文本图像的分割方法及装置。
技术介绍
在对扫描文本图像进行文字分割、字符识别之前,需要先对文本图像中的每一个文本行进行分割。现有的文本行分割方法是通过对原文本图像的二值图像进行水平投影,找到投影图像的波峰波谷,这类算法需要文本行没有倾斜,行与行之间没有重叠的部分。然而,实际应用中,扫描文本图像可能会因为一些外部原因造成图像中的文本行发生倾斜、扭曲的情况。因此,当扫描文本图像中存在发生倾斜、扭曲的文本行时,将无法得到较准确的行分割结果。
技术实现思路
鉴于此,本专利技术的目的在于提供一种文本图像的分割方法及装置,能够较准确地对文本行发生倾斜、扭曲的文本图像进行行分割。为了实现上述目的,本专利技术采用的技术方案如下:第一方面,本专利技术实施例提供了一种文本图像的分割方法,所述方法包括:对文本图像进行二值化处理获取二值化图像,其中,所述文本图像包括多个文本行;获取所述二值化图像中满足预设的阈值条件的连通区域;获取所述连通区域的字符节点构建有向图;对所述有向图进行最短路径搜索得到所述文本图像中属于每一个所述文本行的字符节点序列; ...
【技术保护点】
一种文本图像的分割方法,其特征在于,所述方法包括:对文本图像进行二值化处理获取二值化图像,其中,所述文本图像包括多个文本行;获取所述二值化图像中满足预设的阈值条件的连通区域;获取所述连通区域的字符节点构建有向图;对所述有向图进行最短路径搜索得到所述文本图像中属于每一个所述文本行的字符节点序列;根据所得到的字符节点序列对所述文本图像进行分割。
【技术特征摘要】
1.一种文本图像的分割方法,其特征在于,所述方法包括:对文本图像进行二值化处理获取二值化图像,其中,所述文本图像包括多个文本行;获取所述二值化图像中满足预设的阈值条件的连通区域;获取所述连通区域的字符节点构建有向图;对所述有向图进行最短路径搜索得到所述文本图像中属于每一个所述文本行的字符节点序列;根据所得到的字符节点序列对所述文本图像进行分割。2.根据权利要求1所述的方法,其特征在于,所述获取所述连通区域的字符节点构建有向图的步骤,包括:获取所述连通区域的字符节点;根据所述二值化图像的像素点获取多个引导节点和一个终止节点;根据所述连通区域的字符节点、所述多个引导节点及所述终止节点构建节点集;获取所述节点集中每个点与所述节点集中所有点之间的权值;根据所述节点集及所述节点集中每个点与所述节点集中所有点之间的权值构建有向图。3.根据权利要求2所述的方法,其特征在于,所述多个引导节点为增设在所述二值化图像的第一列像素点之前的一列像素点,所述终止节点为增设在所述二值化图像的最后一列像素点之后的一列像素点中的其中一个像素点。4.根据权利要求2所述的方法,其特征在于,所述获取所述节点集中每个点与所述节点集中所有点之间的权值的步骤,包括:获取所述节点集的每个所述字符节点与所述节点集中所有点之间的权值;获取所述节点集中的每个所述引导节点与所述节点集中所有点之间的权值;获取所述节点集中的所述终止节点与所述节点集中所有点之间的权值。5.根据权利要求2所述的方法,其特征在于,所述对所述有向图进行最短路径搜索得到所述文本图像中属于每一个所述文本行的字符节点序列的步骤,包括:获取所述有向图的起始节点,其中,所述起始节点为所述多个引导节点中的一个;查找所述有向图中所述起始节点到所述终止节点之间的最短路径;根据所述最短路径得到所述节点集中属于当前文本行的字符节点序列;将所述字符节点序列中的所有字符节点从所述节点集中删除;判断所述节点集中是否存在字符节点,当所述节点集中存在字符节点时,更新所述有向图;再次执行查找所述有向图中所述起始节点到所述终止节点之间的最短路径,根据所述最短路径得到所述节点集中属于下一文本行的字符节点序列,将所述字符节点序列中的所有字符节点从所述节点集中删除,直至所述节点集中没有字符节点存在。6.根据权利要求4所述的方法,其特征在于,所述获取所述节点集的每个所述字符节点与所述节点集中所有点之间的权值的步骤...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。