版面分栏方法及装置制造方法及图纸

技术编号:17779699 阅读:59 留言:0更新日期:2018-04-22 08:12
本发明专利技术公开了一种版面分栏方法及装置,该方法包括:获取待分栏文本图像;对所述文本图像进行文本行切分,得到各文本行;对所述文本行进行合并成栏处理,得到最终分栏结果。利用本发明专利技术,可以对复杂手写版面得到准确的分栏结果。

【技术实现步骤摘要】
版面分栏方法及装置
本专利技术涉及图像处理领域,具体涉及一种版面分栏方法及装置。
技术介绍
随着计算机科学与技术的发展,自动化信息处理能力和水平也得到了显著的提高。文档的电子化应用已遍及人们生活工作中各个方面,对工作方式、生活方式带来了巨大的变革,也深刻影响到了教育领域。文档中版面的分析、分栏是文档电子化过程中必不可少的步骤之一,其分析的准确性直接影响文档电子化的结果,因而一直受到相关技术研究人员的重视。现有的针对文档版面分栏的主流方法:基于印刷体文档中的栏多是规整矩形考虑,通过在空白区域进行矩阵检测与归纳,找到栏与栏之间的间隔,最终得到分栏结果。这种版面分栏方法只在排版整齐、棱角分明的文档(以印刷体文档为典型)有效,而对于书写杂乱、存在多栏,且各栏之间分布无规律可循的手写文档,尤其是数理化的解题文档,现有的版面分栏效果则很不理想。
技术实现思路
本专利技术实施例提供一种版面分栏方法及装置,以便针对复杂手写版面,也能得到理想的分栏效果。为此,本专利技术提供如下技术方案:一种版面分栏方法,所述方法包括:获取待分栏文本图像;对所述文本图像进行文本行切分,得到各文本行;对所述文本行进行合并成栏本文档来自技高网...
版面分栏方法及装置

【技术保护点】
一种版面分栏方法,其特征在于,所述方法包括:获取待分栏文本图像;对所述文本图像进行文本行切分,得到各文本行;对所述文本行进行合并成栏处理,得到最终分栏结果。

【技术特征摘要】
1.一种版面分栏方法,其特征在于,所述方法包括:获取待分栏文本图像;对所述文本图像进行文本行切分,得到各文本行;对所述文本行进行合并成栏处理,得到最终分栏结果。2.根据权利要求1所述的方法,其特征于,所述对所述文本行进行合并成栏处理,得到最终分栏结果包括:将各文本行作为独立的文本栏,依次对相邻文本栏进行合并,并计算合并后的分栏代价,得到最小分栏代价;根据所述最小分栏代价确定最终分栏结果。3.根据权利要求2所述的方法,其特征于,所述将各文本行作为独立的文本栏,依次对相邻文本栏进行合并,并计算合并后的分栏代价,得到最小分栏代价包括:(1)初始化:将每个文本行作为独立的文本栏,存入到文本栏集合中作为当前分栏结果,并计算当前分栏代价;(2)依次选择当前分栏结果中的一个文本栏作为当前文本栏进行预测:将当前文本栏与其相邻文本栏合并后的文本栏作为预测文本栏,得到预测分栏结果,计算对应所述预测分栏结果的预测分栏代价,并得到其中的最小预测分栏代价;(3)判断所述最小预测分栏代价是否小于当前分栏代价;(4)如果是,则更新当前分栏结果为所述最小预测分栏代价对应的预测分栏结果,并更新当前分栏代价为所述最小预测分栏代价,然后执行步骤(2);(5)否则,将当前分栏代价作为最小分栏代价;所述根据所述最小分栏代价确定最终分栏结果包括:将所述最小分栏代价对应的当前分栏结果作为最终分栏结果。4.根据权利要求3所述的方法,其特征在于,所述计算预测分栏代价包括:计算所述预测文本栏的栏内代价;计算所述预测文本栏的栏间代价;根据所述栏内代价和所述栏间代价得到预测分栏代价。5.根据权利要求4所述的方法,其特征在于,所述计算所述预测文本栏的栏内代价包括:基于预先构建的栏内代价模型分别计算所述预测文本栏内每两个相邻文本行属于同一栏的代价值;所述栏内代价模型的输入为以下任意一项或多项:两个相邻文本行的间距、X轴重叠比例、X轴长度比例;所述栏内代价模型的输出为两个相邻文本行属于同一栏的代价值;将得到的所有代价值取平均值,将该平均值作为所述预测文本栏的栏内代价。6.根据权利要求4所述的方法,其特征在于,所述计算所述预测文本栏的栏间代价包括:基于预先构建的栏间代价模型计算所述预测文本栏与各相邻文本栏不属于同一栏的代价值;所述栏间代价模型的输入为以下任意一项或多项:所述预测文本栏与相邻文本栏内像素外接凸包间的最小距离、X轴重叠比例、Y轴重叠比例、X轴长度比例、Y轴长度比例;所述栏间代价模型的输出为两相邻文本栏作为独立栏的代价值;将得到的所有代价值取平均值,将该平均值作为所述预测文本栏与其相邻文本栏的栏间代价。7.根据权利要求2至6任一项所述的方法,其特征在于,所述相邻文本栏是指设定范围内的所有文本栏。8.一种...

【专利技术属性】
技术研发人员:胡雨隆胡金水
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1