一种适用于端子排的自底向上光学字符识别方法技术

技术编号:26172776 阅读:27 留言:0更新日期:2020-10-31 13:52
一种适用于端子排的自底向上光学字符识别方法,采集变电站端子排内容图像并进行预处理,对预处理之后的图像,采用自底向上的方法,通过CAM热力图辅助VGG16检测到细粒度字符,再由字符间的距离、角度信息判断字符间是否在同一文本行,之后在检测网络中加入长段记忆网络LSTM,保存了文本行的上下文特征以最终形成粗粒度的文本区域。最后在识别网络ResNet中,以CTC为损失函数,将上述特征信息输入以训练模型,将模型输出结果贪心编码,最终输出端子排识别结果。本发明专利技术解决传统光学字符识别技术在变电站端子排的实际应用场景中可能产生的识别准确率不高的问题,实现对变电站端子排电缆套管标号快速并准确的识别。

【技术实现步骤摘要】
一种适用于端子排的自底向上光学字符识别方法
本专利技术属于图像识别
,涉及对电子设备的文字识别,用于对变电站二次回路接线进行智能识别,为一种适用于端子排的自底向上光学字符识别方法。技术背景智能变电站数字化设计与建设目前正在进行中,相关的二次系统设计软件侧重点比较分散,缺乏系统性和标准化,尚未形成全面的数字化正向设计流程和方法。基于物联感知的识别技术可对变电站二次回路接线进行智能识别,与CAD图纸进行智能对比,可以快速发现变电站现场与竣工图纸不一致的潜在风险。光学字符识别(OpticalCharacterRecognition)简称OCR,属于模式识别的分支。OCR是一个获取文字及版面信息的过程,在这个过程中,输入图像进行文字识别,并以文本的形式返回。其工作原理是通过扫描仪、数码相机等光学输入设备获取纸张上的文字图片信息,采用光学方式将文档资料转换成由黑白点阵构成的图像文件,再利用模式识别算法分析文字体态特征,判断识别出字符文字,进而通过识别软件将图片中的文字转换成文本格式。OCR技术具有准确性高、稳定性强、适用性高、简本文档来自技高网...

【技术保护点】
1.一种适用于端子排的自底向上光学字符识别方法,其特征是采集变电站端子排内容图像并进行预处理,对预处理之后的图像,采用自底向上的方法,检测细粒度字符文本后将其连接成粗粒度的文本区域,最后训练一个文本识别网络ResNet,识别粗粒度的文本区域,然后进行贪心编码,输出端子排识别结果。/n

【技术特征摘要】
1.一种适用于端子排的自底向上光学字符识别方法,其特征是采集变电站端子排内容图像并进行预处理,对预处理之后的图像,采用自底向上的方法,检测细粒度字符文本后将其连接成粗粒度的文本区域,最后训练一个文本识别网络ResNet,识别粗粒度的文本区域,然后进行贪心编码,输出端子排识别结果。


2.根据权利要求1所述的一种适用于端子排的自底向上光学字符识别方法,其特征是所述预处理包括几何变换、畸形矫正、去除模糊和图像增强。


3.根据权利要求1所述的一种适用于端子排的自底向上光学字符识别方法,其特征是所述自底向上的方法具体为:
1)采用高斯热力图的VGG16网络将每一个字符为检测目标替代传统的将文本框作为检测目标,使用小感受野来预测文本,只关注字符级别,获得每个字符的坐标框,得到细粒度文本;
2)根据字符的中心点(x,y)、欧式距离d、角度θ信息,判断两字符是否处于同一文本区域;
3)根据步骤2)的判断结果,将属于同一文本区域的字符合并成为文本行区域,并通过双向长短期记忆网络,即双向LSTM(Longshort-termmemory),保留提取文本的上下文特征,输出每个文本行区域的坐标框,即粗粒度的文本区域;
4)训练识别网络,对粗粒度的文本区域进行文字识别,将字符坐标框信息、...

【专利技术属性】
技术研发人员:郭科白英施浩楠宋江宁王茜邵雪瑾胡广燕王新新彭海涛马俊先王金有
申请(专利权)人:宁夏宁电电力设计有限公司
类型:发明
国别省市:宁夏;64

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1