一种集装箱文字识别方法技术

技术编号:31238531 阅读:20 留言:0更新日期:2021-12-08 10:25
本发明专利技术公开了一种集装箱文字识别方法,包括如下步骤:创建图像清晰度恢复数据集和标注集装箱OCR识别样本集;构建深度图像细节恢复网络模型、OCR检测神经网络模型、深度神经网络模型和OCR区域识别网络模型并进行保存;使用训练好的所述OCR区域识别网络模型对拍摄得到的图像进行OCR区域检测,定位出OCR区域;通过OCR检测神经网络模型对定位到的所述OCR区域的长宽进行判断,并筛选出宽度大于长度的OCR区域;对所述宽度大于长度的所述OCR区域通过所述深度图像细节恢复网络模型进行细节恢复。本发明专利技术,采用深度图像细节恢复网络模型,能够避免集装箱由于老化腐蚀等原因造成缺损时,通过集装箱侧面的竖版文字识别箱号,提升集装箱箱号识别系统实际应用中的鲁棒性。箱号识别系统实际应用中的鲁棒性。箱号识别系统实际应用中的鲁棒性。

【技术实现步骤摘要】
一种集装箱文字识别方法


[0001]本专利技术涉及文字识别
,具体为一种集装箱文字识别方法。

技术介绍

[0002]目前,因为集装箱的体积较大,因此集装箱在摆放时均会采用水平摆放的方式,而且集装箱上的文字一般要么是水平印刷在集装箱上,要么就垂直印刷在集装箱上,垂直印刷在集装箱上的文字又被称为竖向文字,传统的集装箱文字识别一般只能对横向的文字进行识别,但是针对行业中确实存在一些将集装箱对应的序列号进行竖向书写的情况,现有的识别方法中,无法很好的实现对竖向文字的进行识别。

技术实现思路

[0003]本专利技术的目的在于提供一种集装箱文字识别方法,以解决上述
技术介绍
中提出的问题。
[0004]为实现上述目的,本专利技术提供如下技术方案:一种集装箱文字识别方法,包括如下步骤:
[0005]创建图像清晰度恢复数据集和标注集装箱OCR识别样本集;
[0006]构建深度图像细节恢复网络模型、OCR检测神经网络模型、深度神经网络模型和OCR区域识别网络模型并进行保存;
[0007]使用训练好的所述OCR区域识别网络模型对拍摄得到的图像进行OCR区域检测,定位出OCR区域;
[0008]通过OCR检测神经网络模型对定位到的所述OCR区域的长宽进行判断,并筛选出宽度大于长度的OCR区域;
[0009]对所述宽度大于长度的所述OCR区域通过所述深度图像细节恢复网络模型进行细节恢复;
[0010]恢复完成后,通过所述深度神经网络模型对所述OCR区域内的文字进行识别
[0011]将识别后输出的结果结合OCR坐标信息进行关键字匹配,最后上传到数据库中进行大数据管理。
[0012]优选的,所述深度图像细节恢复网络模型的构建方法包括:
[0013]使用图像清晰度恢复数据集中的数据对神经网络进行监督训练,从而构建深度图像细节恢复网络模型;
[0014]其中,所述图像清晰度恢复数据集中的图像时基于原始清晰图像进行随机高斯模糊以及添加随机泊松噪声作为所述深度图像细节恢复网络模型构建时的网络输入,所述原始清晰图像作为所述深度图像细节恢复网络模型构建时的输出。
[0015]优选的,所述使用训练好的所述OCR区域识别网络模型对拍摄得到的图像进行OCR区域检测,定位出OCR区域进一步包括:
[0016]使用置信阈值对OCR检测结果进行筛选,消除模糊目标干扰;
[0017]使用非最大值抑制算法对相似区域进行抑制,避免同一区域重复检测;
[0018]对OCR区域检测结果进行填充处理,边界进行扩大以便更准确地截取OCR区域。
[0019]优选的,所述将识别后输出的结果结合OCR坐标信息进行关键字匹配,进一步包括:
[0020]所述深度神经网络模型对所述OCR区域内的文字进行识别时,同时构建对应的坐标系;
[0021]识别完成后,将识别出的文字结果和其中文字对应的坐标进行关键字匹配。
[0022]优选的,所述OCR检测神经网络模型、深度神经网络模型和OCR区域识别网络模型均是通过标注集装箱OCR识别样本集中的数据训练得到的。
[0023]与现有技术相比,本专利技术的有益效果是:
[0024]本专利技术,能够实现对集装箱上的竖向文字的识别,同时能够定位出OCR区域,避免了无效的识别行为,提高了效率。
[0025]本专利技术,采用深度图像细节恢复网络模型,能够避免集装箱由于老化腐蚀等原因造成的OCR缺损,提高识别准确率。
附图说明
[0026]图1为本专利技术的集装箱文字识别方法流程图。
具体实施方式
[0027]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0028]请参阅图1,本专利技术提供一种技术方案:一种集装箱文字识别方法,括如下步骤:
[0029]创建图像清晰度恢复数据集和标注集装箱OCR识别样本集;
[0030]构建深度图像细节恢复网络模型、OCR检测神经网络模型、深度神经网络模型和OCR区域识别网络模型并进行保存;
[0031]在本实施例中,深度图像细节恢复网络模型训练时采用的神经网络有SRCNN,ESCPN以及DRCN等,OCR检测神经网络模型训练时可以采用的神经网络有EAST,CTPN,YOLO,Fast

RCNN,Faster

RCNN与SSD,深度神经网络模型训练时可以采用CRNN,FOTS与CTC等神经网络,训练好的上述模型均保存在本地硬盘上。
[0032]使用训练好的OCR区域识别网络模型对拍摄得到的图像进行OCR区域检测,定位出OCR区域;
[0033]通过OCR检测神经网络模型对定位到的OCR区域的长宽进行判断,并筛选出宽度大于长度的OCR区域;
[0034]在本实施例中,长宽进行判断可以理解为,现实中的集装箱一般都会很大,因此存放过程中基本上都不会存在倾斜放置的集装箱,同时,集装箱上的文字也基本都是水平印刷和垂直水平方向印刷,因此需要判断出文字是水平的还是垂直的,才好进行文字识别,宽度大于长度的OCR区域,即可以理解为文字处于垂直设置在集装箱上的。
[0035]对宽度大于长度的OCR区域通过深度图像细节恢复网络模型进行细节恢复;
[0036]恢复完成后,通过深度神经网络模型对OCR区域内的文字进行识别;
[0037]将识别后输出的结果结合OCR坐标信息进行关键字匹配,最后上传到数据库中进行大数据管理。
[0038]在一种可选的实施方式中,深度图像细节恢复网络模型的构建方法包括:
[0039]使用图像清晰度恢复数据集中的数据对神经网络进行监督训练,从而构建深度图像细节恢复网络模型;
[0040]其中,图像清晰度恢复数据集中的图像时基于原始清晰图像进行随机高斯模糊以及添加随机泊松噪声作为深度图像细节恢复网络模型构建时的网络输入,原始清晰图像作为深度图像细节恢复网络模型构建时的输出,能够避免集装箱由于老化腐蚀等原因造成的OCR缺损,提高识别准确率。
[0041]在一种可选的实施方式中,使用训练好的OCR区域识别网络模型对拍摄得到的图像进行OCR区域检测,定位出OCR区域进一步包括:
[0042]使用置信阈值对OCR检测结果进行筛选,消除模糊目标干扰;
[0043]使用非最大值抑制算法对相似区域进行抑制,避免同一区域重复检测;
[0044]对OCR区域检测结果进行填充处理,边界进行扩大25像素以便更准确地截取OCR区域。
[0045]在一种可选的实施方式中,将识别后输出的结果结合OCR坐标信息进行关键字匹配,进一步包括:
[0046]深度神经网络模型对OCR区域内的文字进行识别时,同本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种集装箱文字识别方法,其特征在于包括如下步骤:创建图像清晰度恢复数据集和标注集装箱OCR识别样本集;构建深度图像细节恢复网络模型、OCR检测神经网络模型、深度神经网络模型和OCR区域识别网络模型并进行保存;使用训练好的所述OCR区域识别网络模型对拍摄得到的图像进行OCR区域检测,定位出OCR区域;通过OCR检测神经网络模型对定位到的所述OCR区域的长宽进行判断,并筛选出宽度大于长度的OCR区域;对所述宽度大于长度的所述OCR区域通过所述深度图像细节恢复网络模型进行细节恢复;恢复完成后,通过所述深度神经网络模型对所述OCR区域内的文字进行识别;将识别后输出的结果结合OCR坐标信息进行关键字匹配,最后上传到数据库中进行大数据管理。2.根据权利要求1所述的一种集装箱文字识别方法,其特征在于:所述深度图像细节恢复网络模型的构建方法包括:使用图像清晰度恢复数据集中的数据对神经网络进行监督训练,从而构建深度图像细节恢复网络模型;其中,所述图像清晰度恢复数据集中的图像时基于原始清晰图像进行随机高斯模糊以及添加随机泊松噪声作为所...

【专利技术属性】
技术研发人员:丁杰郑竞恒王弋李洁胡争
申请(专利权)人:苏州云箱物联科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1