【技术实现步骤摘要】
一种适用于端子排的自底向上光学字符识别方法
本专利技术属于图像识别
,涉及对电子设备的文字识别,用于对变电站二次回路接线进行智能识别,为一种适用于端子排的自底向上光学字符识别方法。技术背景智能变电站数字化设计与建设目前正在进行中,相关的二次系统设计软件侧重点比较分散,缺乏系统性和标准化,尚未形成全面的数字化正向设计流程和方法。基于物联感知的识别技术可对变电站二次回路接线进行智能识别,与CAD图纸进行智能对比,可以快速发现变电站现场与竣工图纸不一致的潜在风险。光学字符识别(OpticalCharacterRecognition)简称OCR,属于模式识别的分支。OCR是一个获取文字及版面信息的过程,在这个过程中,输入图像进行文字识别,并以文本的形式返回。其工作原理是通过扫描仪、数码相机等光学输入设备获取纸张上的文字图片信息,采用光学方式将文档资料转换成由黑白点阵构成的图像文件,再利用模式识别算法分析文字体态特征,判断识别出字符文字,进而通过识别软件将图片中的文字转换成文本格式。OCR技术具有准确性高、稳 ...
【技术保护点】
1.一种适用于端子排的自底向上光学字符识别方法,其特征是采集变电站端子排内容图像并进行预处理,对预处理之后的图像,采用自底向上的方法,检测细粒度字符文本后将其连接成粗粒度的文本区域,最后训练一个文本识别网络ResNet,识别粗粒度的文本区域,然后进行贪心编码,输出端子排识别结果。/n
【技术特征摘要】
1.一种适用于端子排的自底向上光学字符识别方法,其特征是采集变电站端子排内容图像并进行预处理,对预处理之后的图像,采用自底向上的方法,检测细粒度字符文本后将其连接成粗粒度的文本区域,最后训练一个文本识别网络ResNet,识别粗粒度的文本区域,然后进行贪心编码,输出端子排识别结果。
2.根据权利要求1所述的一种适用于端子排的自底向上光学字符识别方法,其特征是所述预处理包括几何变换、畸形矫正、去除模糊和图像增强。
3.根据权利要求1所述的一种适用于端子排的自底向上光学字符识别方法,其特征是所述自底向上的方法具体为:
1)采用高斯热力图的VGG16网络将每一个字符为检测目标替代传统的将文本框作为检测目标,使用小感受野来预测文本,只关注字符级别,获得每个字符的坐标框,得到细粒度文本;
2)根据字符的中心点(x,y)、欧式距离d、角度θ信息,判断两字符是否处于同一文本区域;
3)根据步骤2)的判断结果,将属于同一文本区域的字符合并成为文本行区域,并通过双向长短期记忆网络,即双向LSTM(Longshort-termmemory),保留提取文本的上下文特征,输出每个文本行区域的坐标框,即粗粒度的文本区域;
4)训练识别网络,对粗粒度的文本区域进行文字识别,将字符坐标框信息、...
【专利技术属性】
技术研发人员:郭科,白英,施浩楠,宋江宁,王茜,邵雪瑾,胡广燕,王新新,彭海涛,马俊先,王金有,
申请(专利权)人:宁夏宁电电力设计有限公司,
类型:发明
国别省市:宁夏;64
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。