当前位置: 首页 > 专利查询>东南大学专利>正文

基于卷积神经网络的钢板编号识别系统及方法技术方案

技术编号:41536620 阅读:38 留言:0更新日期:2024-06-03 23:15
本发明专利技术公开了一种基于卷积神经网络的钢板编号识别系统及方法,至少包括钢板编号定位模块、图像裁切模块和钢板编号识别模块,所述钢板编号定位模块基于Ret i naNet卷积神经网络,负责识别图像里钢板编号所在矩形框的位置,并将输出结果发送给图像裁切模块;所述图像裁切模块根据钢板编号定位模块输出的钢板编号位置,做边缘扩大后的图像裁切,并将裁切后的输出结果发送给钢板编号识别模块;所述钢板编号识别模块基于Mobi l eNet卷积神经网络,对图像裁切模块的输出结果进行图像中数字编号内容的识别,完成钢板编号的识别,适应钢板编号识别任务的特殊性,大大提高了准确率。

【技术实现步骤摘要】

本专利技术属于光学字符识别,涉及深度学习应用的产品,具体涉及一种基于卷积神经网络的钢板编号识别系统及方法


技术介绍

1、ocr(optical character recognition,光学字符识别)是指电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。

2、在实际生产中,ocr技术被广泛应用于各个
,进行文字的识别处理,但是在进行钢板编号识别这一具体任务时,现有的ocr技术方法效果差强人意,这主要是因为:一来,现有的ocr技术倾向于处理自然拍摄图片中的文本,文本框数量和长度均不定,且场景多样(印刷体文字识别、街景识别),这为准确识别背景单一但文字区域存在干扰的钢板图像带来了难度和挑战,使得识别准确率较低;二来,钢板编号识别中只有一个定长文本框,角度单一,并不需要识别编号以外的文字,而使用现有方法的话有可能识别出多个文本本文档来自技高网...

【技术保护点】

1.基于卷积神经网络的钢板编号识别系统,其特征在于:至少包括钢板编号定位模块、图像裁切模块和钢板编号识别模块,

2.如权利要求1所述的基于卷积神经网络的钢板编号识别系统,其特征在于:所述钢板编号定位模块中,RetinaNet卷积神经网络的输出分类个数为2,即钢板编号和背景;所述RetinaNet卷积神经网络包括特征金字塔网络、分类网络和矩形框网络,其中,

3.如权利要求2所述的基于卷积神经网络的钢板编号识别系统,其特征在于:所述图像裁切模块中,将钢板编号定位模块输出的钢板编号位置框,边缘扩大5%后在原始图像上裁切,即矩形框的中心位置不变,将其长和宽均增大10%。<...

【技术特征摘要】

1.基于卷积神经网络的钢板编号识别系统,其特征在于:至少包括钢板编号定位模块、图像裁切模块和钢板编号识别模块,

2.如权利要求1所述的基于卷积神经网络的钢板编号识别系统,其特征在于:所述钢板编号定位模块中,retinanet卷积神经网络的输出分类个数为2,即钢板编号和背景;所述retinanet卷积神经网络包括特征金字塔网络、分类网络和矩形框网络,其中,

3.如权利要求2所述的基于卷积神经网络的钢板编号识别系统,其特征在于:所述图像裁切模块中,将钢板编号定位模块输出的钢板编号位置框,边缘扩大5%后在原始图像上裁切,即矩形框的中心位置不变,将其长和宽均增大10%。

4.如权利要求1或2或3所述的基于卷积神经网络的钢板编号识别系统,其特征在于:所述图像裁切模块中,裁切框的位置变换公式具体为:

5.如权利要求4所述的基于卷积神经网络的钢板编号识别系统,其特...

【专利技术属性】
技术研发人员:章翔傅忱忱吕妍吴巍炜李福存李井先张波胡风杨爱玲
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1