灌装桶标签文字定位识别方法、装置、设备及检测方法制造方法及图纸

技术编号：37860509 阅读：11 留言：0更新日期：2023-06-15 20:50

本发明专利技术涉及灌装技术领域，提供一种灌装桶标签文字定位识别方法、装置、设备及检测方法，首先使用事先标注好的工业场景标签数据集训练YOLOv5定位模型，对输入标签图像的Logo区域进行定位，计算需要识别区域的位置，对不需要识别的区域添加掩膜，减少定位与识别范围，提高文字识别效率；其次使用事先标注好的工业场景标签数据集训练DBNet文字定位模型，获取需要识别区域文字框的位置坐标，把定位结果传递给文字识别模块；最后使用事先做好的文字识别数据集训练CRNN文字识别模型，对上阶段定位区域内的文字进行识别，输出文字识别结果，完成整个文字定位识别处理，该方法可提高文字识别效率以及识别结果的准确性。效率以及识别结果的准确性。效率以及识别结果的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
灌装桶标签文字定位识别方法、装置、设备及检测方法

[0001]本专利技术涉及灌装
，特别是涉及一种灌装桶标签文字定位识别方法、装置、设备及检测方法。

技术介绍

[0002]近年来自然场景下的文字定位与识别技术得到了广泛的应用，但是由于工业场景背景复杂、字体多样、成像质量不佳等问题，导致文字定位识别精度低下，应用受限。在灌装
，灌装桶的身份识别、传输、贴标、物流、仓储等工业场景下，都需要对灌装桶铭牌、标签等进行文字定位识别，因其工作环境恶劣，铭牌、标签经常被物料污染、腐蚀，并且铭牌、标签中包含中文、英文、符号和数字等多种字符，使得工业场景下的文字定位和识别具有很大的挑战性。
[0003]目前现有的文字定位识别软件对英文和数字的识别效果较好，但是对中文的识别准确率低，甚至大部分软件不能识别中文，因此没有办法将该技术应用到工业环境中带有中文文字的识别任务中；另外在工业环境中，灌装桶标签上内容较多，包含文字、特殊的字符和图像，使用市面提供的软件和方法也没有办法识别，因此大部分工业环境下灌装桶的标签还是依赖于人工识别，不但生产效率低，而且随着工人工作时间的增长，识别准确率也会随之下降。

技术实现思路

[0004]本专利技术的目的是提出一种灌装桶标签文字定位识别方法、装置、设备及检测方法，解决工业环境下灌装桶标签文字识别效率低、准确率差的问题。
[0005]为实现上述目的，本专利技术提供如下技术方案。
[0006]一方面，本申请提供一种灌装桶标签文字定位识别方法，包括以下步骤：...

【技术保护点】

【技术特征摘要】
1.一种灌装桶标签文字定位识别方法，其特征在于，包括以下步骤：S10，将标签划分为显著特征区域、识别区域和掩膜区域;S20，获取标签图像，识别定位标签图像中的所述显著特征区域，根据所述显著特征区域与所述识别区域和所述掩膜区域固定的相对位置关系，计算出所述识别区域和所述掩膜区域位置，并对所述掩膜区域添加掩膜；S30，对上一步获得的所述识别区域内的文字进行定位，获取文字框的位置坐标；S40，对上一步获得的所述文字框进行文字识别，输出文字识别结果。2.根据权利要求1所述的灌装桶标签文字定位识别方法，其特征在于，在执行所述步骤S20之前，还包括以下步骤：构建工业场景下标签数据集，并对标签数据集内的标签图像的所述显著特征区域、识别区域和掩膜区域进行标注，使用标注好的工业场景下标签数据集训练神经网络定位模型。3.根据权利要求2所述的灌装桶标签文字定位识别方法，其特征在于，计算所述识别区域和所述掩膜区域位置的方法为：首先通过所述神经网络定位模型定位所述显著特征区域的位置，得到位置坐标，并计算得到所述显著特征区域的中心点坐标；然后根据标注好的所述识别区域和所述掩膜区域中心点与所述显著特征区域中心点的偏移量，计算出所述识别区域和所述掩膜区域的中心点坐标；最后根据标注好的所述识别区域和所述掩膜区域的宽度和高度，计算得到所述识别区域和所述掩膜区域的位置坐标。4.根据权利要求3所述的灌装桶标签文字定位识别方法，其特征在于，所述显著特征区域的定位方法为：S21,首先对获取的标签图像行特征提取，对输入图像进行切片操作，在不损失任何信息的情况下增加特征图的维度来缩小特征图的尺寸，使特征图在每个特征信息没有变化的前提下增加图像的特征数；然后对输入信息使用残差结构处理后再进行反向传播，采用四种尺寸的最大池化操作，然后再进行合并操作，增大特征网络的感受野，分离特征信息；S22,经过上述处理得到的特征图，利用上采样的方式自顶向下传达强语义特征，同时使用跨阶段局部网络加强网络的特征融合能力，输出端采用加权非极大值抑制对多个目标框进行筛选，保留最优目标框。5.根据权利要求4所述的灌装桶标签文字定位识别方法，其特征在于，所述输出端对生成的特征图分别经过卷积操作生成大小为76
×
76
×
255、38
×
38
×
255、19
×
19
×
255的特征图，做为最终的特征图用于预测目标的类别，所述神经网络定位模型使用CIOU_Loss做为损失函数，，其中，IOU代表预测框和真实框的交集面积与并集面积之比，代表预测框的中心点和真实框的中心点的欧式距离，代表预测框和真实框最小外接矩阵...

【专利技术属性】
技术研发人员：霍箭东，王玲，张静，张超，许新，丁满森，王健，赵天野，赵新，
申请(专利权)人：长春蓝舟科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人