【技术实现步骤摘要】
烟草样品瓶标签的光学字符识别方法
[0001]本专利技术涉及图像识别
,特别是涉及一种烟草样品瓶标签的光学字符识别方法。
技术介绍
[0002]信息技术的迅猛发展为传统生产企业提供了新的发展机遇,烟草的检测流程与工业互联网相结合,融入自动化数据采集。目前对烟草的检测流程的数据存取还依赖人工输入输出,各个设备在汇总信息制表时需要手动输入样品编号等标签标注的信息和检测数据。人工对检测数据的输入输出效率较低,人工参与的环节越多,整体检测时间越长,并且通过人工的采集信息的成本也高。
[0003]目前的烟草样品瓶标签的光学字符识别方法多基于深度学习模型构建多层视觉感知机,采用Resnet、Densenet、Inception以及基于此改进的神经网络结构取得了不错的效果。同时也存在一些问题:图片识别、鉴定的准确度不高,例如,未能准确识别年幼宝宝相册、视频中的不合规的内容;另一方面,由于晒的图片涉及的场景很复杂,现有的OCR(Optical Character Recognition,光学字符识别)算法所构建的文字识别的模型 ...
【技术保护点】
【技术特征摘要】
1.一种烟草样品瓶标签的光学字符识别方法,其特征在于,包括以下步骤:S1,采用CTPN网络对采集的图像进行识别得到多个文本建议框,以及确定各文本建议框的连接情况;然后由文本连接算法对文本建议框合并,构成目标区域;S2,将目标区域输入CRNN模型进行解码,得到的文本序列即是最终的识别出的文本信息。2.根据权利要求1所述的一种烟草样品瓶标签的光学字符识别方法,其特征在于,在步骤S1中对得到的文本建议框进行角度补偿,包括以下步骤:S1
‑
1,通过最小二乘法对相邻文本建议框的中心点进行拟合操作,得到与各文本建议框中心点欧几里得距离之和最小的直线为中心线,然后通过公式(2)(3)求得中心线的截距和斜率;和斜率;其中k表示截距;m为需合并文本建议框的个数;y
i
表示第i个文本建议框的y坐标;x
i
表示第i个文本建议框的x坐标;表示文本建议框x坐标的均值;b表示斜率;S1
‑
2,对文本建议框进行角度补偿:首先要使用文本建议框合并后生成的文本框的左上和右下的x坐标,使用这两个x坐标在带入上下两条斜线,求得四个交点,获得的四个点构成一个平行四边形;根据中心线的截距b
c
结合相邻文本建议框平均高度h来求出上下两条直线的截距b1,b2,其中b1为b
c
加平均高度的一半,b2为减掉平均高度的一半;随后使用中心线的斜率k
c
即上下两条线的斜率,即可得到上下边界的两条直线,将x1,x2代入上下边界直线即可得出y1,y2,y3,y4;;;其中h
i
表示第i个文本建议框的高度。3.根据权利要求2所述的一种烟草样品瓶标签的光学字符识别方法,其特征在于,还包括:
S1
‑
3,将平行四边形补全为矩形:以三角形竖直的边为d
y
为底,高为d
x
,补全后...
【专利技术属性】
技术研发人员:周芸,梁海玲,王艳伟,昊晶晶,兰柳妮,潘玉灵,覃斌,
申请(专利权)人:广西中烟工业有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。