【技术实现步骤摘要】
一种基于图像列对齐特征预测所有目标区域的方法
本专利技术属于图像文字识别技术的文本区域识别领域,尤其涉及包含列表结构图像的文本区域识别算法,该算法为自创算法。
技术介绍
色谱仪广泛应用与食品、药品、化工品等领域的成分检验,检验结果通常打印为纸件,打印件样例参见附图1。该打印件多个数据均为目标数据,目标数据样例参见附图2。该打印件从图像识别领域看具备3个特征导致难以准确、完整识别所有目标数据所在区域:特征1、版面复杂,包含图、表、文字等结构,且各结构在图像的位置、大小不固定,导致应用深度学习方法做识别时,训练难度大,识别效果不理想;特征2、字符间隔小、单个字符面积小,相邻字符图像区域容易粘结,导致误识别;特征3、由于打印机缺墨、溅墨等原因,以及纸张本身可能包含噪点,导致某些字符难以识别,从而导致某些目标区域漏识别。目前常见的开源图像文本区域识别算法,比如开源的深度学习神经网络CTPN、开源的图像文字识别软件tesseract,均属于通用图片文字识别算法,在识别色谱仪检验结果打印件时,存在较大的目标区域漏识别概率。通过开源软件CTPN识别目标数据效果参见附图3,其中蓝 ...
【技术保护点】
1.一种基于图像列对齐特征预测所有目标区域的方法,其特征在于,结合色谱仪检验结果打印件的图像特征,提出一种创新算法,确保准确、完整识别色谱仪检验结果打印件包含的所有目标区域,包括如下步骤:(1)图像倾斜矫正,将图像所有文字旋转到水平位置,以便后续文字区域切分时,不会由于区域粘结而无法分离;(2)基于倾斜矫正的图片,做二值化,然后基于二值化图像,得到所有可能包含目标文字的区域,也称为得到感兴趣区域;(3)根据感兴趣区域列对齐特征,建立所有可能的坐标系;(4)依据目标区域图像特征,挑选目标坐标系;(5)从目标坐标系提取所有目标区域。
【技术特征摘要】
1.一种基于图像列对齐特征预测所有目标区域的方法,其特征在于,结合色谱仪检验结果打印件的图像特征,提出一种创新算法,确保准确、完整识别色谱仪检验结果打印件包含的所有目标区域,包括如下步骤:(1)图像倾斜矫正,将图像所有文字旋转到水平位置,以便后续文字区域切分时,不会由于区域粘结而无法分离;(2)基于倾斜矫正的图片,做二值化,然后基于二值化图像,得到所有可能包含目标文字的区域,也称为得到感兴趣区域;(3)根据感兴趣区域列对齐特征,建立所有可能的坐标系;(4)依据目标区域图像特征,挑选目标坐标系;(5)从目标坐标系提取所有目标区域。2.根据权利要求1所述基于图像列对齐特征预测所有目标区域的方法,其特征在于,感兴趣区域归属同一坐标系的定义:水平方向为X轴,垂直方向为Y轴,如果两个长行的行间距小于1.5~2倍行距、且2个长行内所有感兴趣在X轴方向的坐标不交叉,则属于同一个坐标系,所谓感兴趣区域坐标不交叉,是指感兴趣区域符合表结构列对齐特征,即任何1行的某个感兴趣区域在X轴的投影,不会和其它任何1行内超过1个感兴趣区域在X轴的投影存在重叠部分。3.根据权利要求1所述基于图像列对齐特征预测所有目标区域的方法,其特征在于,通过分析坐标系如下特征,挑选目标坐标系:(1)特征1:X轴方向感兴趣区域数量和目标区域数量相等坐标系,更可能是目标坐标系;(2)特征2:包含感兴趣区域数量更多坐标系,更可能是目标坐标系,假设感兴趣区域最多坐标系为A,包含Na个感兴趣区域,权重为1;坐标系B包含感兴趣区域个数Nb,B的权重Wn=Nb÷Na;(3)特征3:X轴方向所有感兴趣区域覆盖广度...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。