当前位置: 首页 > 专利查询>吴昌议专利>正文

一种基于图像列对齐特征预测所有目标区域的方法技术

技术编号:20329505 阅读:32 留言:0更新日期:2019-02-13 05:58
本发明专利技术公开了一种基于图像列对齐特征预测所有目标区域的方法。其特征在于,通过色谱仪检测报告打印件图像所包含的目标数据列对齐特征,建立包含所有目标区域的坐标系,基于坐标系预测所有目标区域。即,先从色谱仪检测报告的图像提取所有可识别的字符区域子图像,再依据子图像列对齐特征,将所有能列对齐的子图像归类到同一个坐标系,再从所有坐标系中挑选目标坐标系,最后基于目标坐标系确定所有目标区域。该方法基于图像提供的高可识别信息,完整预测所有目标区域,有效解决了某些目标区域由于图片质量不高而漏识别或识别不完整的问题、并且有效解决了神经网络概率性漏识别目标区域或识别不完整的问题。

【技术实现步骤摘要】
一种基于图像列对齐特征预测所有目标区域的方法
本专利技术属于图像文字识别技术的文本区域识别领域,尤其涉及包含列表结构图像的文本区域识别算法,该算法为自创算法。
技术介绍
色谱仪广泛应用与食品、药品、化工品等领域的成分检验,检验结果通常打印为纸件,打印件样例参见附图1。该打印件多个数据均为目标数据,目标数据样例参见附图2。该打印件从图像识别领域看具备3个特征导致难以准确、完整识别所有目标数据所在区域:特征1、版面复杂,包含图、表、文字等结构,且各结构在图像的位置、大小不固定,导致应用深度学习方法做识别时,训练难度大,识别效果不理想;特征2、字符间隔小、单个字符面积小,相邻字符图像区域容易粘结,导致误识别;特征3、由于打印机缺墨、溅墨等原因,以及纸张本身可能包含噪点,导致某些字符难以识别,从而导致某些目标区域漏识别。目前常见的开源图像文本区域识别算法,比如开源的深度学习神经网络CTPN、开源的图像文字识别软件tesseract,均属于通用图片文字识别算法,在识别色谱仪检验结果打印件时,存在较大的目标区域漏识别概率。通过开源软件CTPN识别目标数据效果参见附图3,其中蓝色边框包围区域为确认本文档来自技高网...

【技术保护点】
1.一种基于图像列对齐特征预测所有目标区域的方法,其特征在于,结合色谱仪检验结果打印件的图像特征,提出一种创新算法,确保准确、完整识别色谱仪检验结果打印件包含的所有目标区域,包括如下步骤:(1)图像倾斜矫正,将图像所有文字旋转到水平位置,以便后续文字区域切分时,不会由于区域粘结而无法分离;(2)基于倾斜矫正的图片,做二值化,然后基于二值化图像,得到所有可能包含目标文字的区域,也称为得到感兴趣区域;(3)根据感兴趣区域列对齐特征,建立所有可能的坐标系;(4)依据目标区域图像特征,挑选目标坐标系;(5)从目标坐标系提取所有目标区域。

【技术特征摘要】
1.一种基于图像列对齐特征预测所有目标区域的方法,其特征在于,结合色谱仪检验结果打印件的图像特征,提出一种创新算法,确保准确、完整识别色谱仪检验结果打印件包含的所有目标区域,包括如下步骤:(1)图像倾斜矫正,将图像所有文字旋转到水平位置,以便后续文字区域切分时,不会由于区域粘结而无法分离;(2)基于倾斜矫正的图片,做二值化,然后基于二值化图像,得到所有可能包含目标文字的区域,也称为得到感兴趣区域;(3)根据感兴趣区域列对齐特征,建立所有可能的坐标系;(4)依据目标区域图像特征,挑选目标坐标系;(5)从目标坐标系提取所有目标区域。2.根据权利要求1所述基于图像列对齐特征预测所有目标区域的方法,其特征在于,感兴趣区域归属同一坐标系的定义:水平方向为X轴,垂直方向为Y轴,如果两个长行的行间距小于1.5~2倍行距、且2个长行内所有感兴趣在X轴方向的坐标不交叉,则属于同一个坐标系,所谓感兴趣区域坐标不交叉,是指感兴趣区域符合表结构列对齐特征,即任何1行的某个感兴趣区域在X轴的投影,不会和其它任何1行内超过1个感兴趣区域在X轴的投影存在重叠部分。3.根据权利要求1所述基于图像列对齐特征预测所有目标区域的方法,其特征在于,通过分析坐标系如下特征,挑选目标坐标系:(1)特征1:X轴方向感兴趣区域数量和目标区域数量相等坐标系,更可能是目标坐标系;(2)特征2:包含感兴趣区域数量更多坐标系,更可能是目标坐标系,假设感兴趣区域最多坐标系为A,包含Na个感兴趣区域,权重为1;坐标系B包含感兴趣区域个数Nb,B的权重Wn=Nb÷Na;(3)特征3:X轴方向所有感兴趣区域覆盖广度...

【专利技术属性】
技术研发人员:吴昌议
申请(专利权)人:吴昌议
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1