System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种厂站接线图文字识别方法及装置制造方法及图纸_技高网

一种厂站接线图文字识别方法及装置制造方法及图纸

技术编号:41175753 阅读:4 留言:0更新日期:2024-05-07 22:12
本发明专利技术涉及一种厂站接线图文字识别方法及装置,属于电气工程和计算机视觉技术领域。本发明专利技术获取电网厂站接线图片,对接线图片进行预处理,将预处理后的接线图片输入到经过数据增强的数据集训练得到的文本检测模型中,获取到文字在接线图片中的位置信息,将检测到有文字信息的区域图片输入到文字识别模型进行识别,得到最后的文字识别结果,提高了文字识别的准确度。

【技术实现步骤摘要】

本专利技术涉及一种厂站接线图文字识别方法及装置,属于电气工程和计算机视觉。


技术介绍

1、电网厂站接线图中的信息复杂,字符信息作为图元编号的重要标识,是接线图信息提取中极其重要的一环。厂站接线图中的文字信息极为复杂,文字字体多样、大小粗细有差异、位置多变、颜色不统一、排列有竖排横排、模糊程度不同,字符也不局限于中文、英文字母、数字和特殊字符。因此,处理电网厂站接线图文字识别任务挑战很大。

2、目前,对于处理这种复杂多变的文字识别任务,常用深度学习方法解决该问题。深度学习不需要用手工进行特征提取,通过从海量数据中进行深度学习,从而进行文字识别。但电网厂站接线图相比于自然图像,数据很难获取,在标注进行深度学习时,标注难度及工作量大,因此能够可用的数据很少,想要直接利用深度学习光学文字识别模型来检测识别厂站接线图中的文字信息,难度极大,效果不佳。


技术实现思路

1、本专利技术的目的是提供一种厂站接线图文字识别方法及装置,用以解决现有技术中识别数据少造成的厂站接线图文字识别难度大以及识别准确度低的问题。

2、为实现上述目的,本专利技术的方案包括:

3、本专利技术的一种厂站接线图文字识别方法,包括以下步骤:

4、1)获取电网厂站接线图片,对接线图片进行预处理;

5、2)将预处理后的厂站接线图片输入到文本检测模型中进行识别,得到文字在接线图片中的位置信息,所述文本检测模型是利用经过数据增强处理的训练集进行训练得到的,所述数据增强处理的过程包括:收集若干厂站接线图片,对所有厂站接线图片中的文本区域进行剪裁得到文字图片集,从所有文字图片集中随机选择若干文字图片构建若干虚拟厂站接线图片,将构建的若干虚拟厂站接线图片或若干虚拟厂站接线图片和收集的若干厂站接线图片作为训练集;

6、3)将检测到有文字信息的区域图片输入到文字识别模型进行识别,得到文字识别结果。

7、有益效果:本专利技术将厂站接线图片输入文本检测模型中进行检测,获取文字的位置信息,得到文字区域图片,并且将检测有文字信息的区域图片输入文字识别模型进行识别,得到文字识别结果。该方法采用了随机粘贴的方法进行数据增强,其随机性有利于增加样本的多样性,计算机可以基于采集的路线图得到大量样本数据进行学习,进而提升了文本检测模型的识别性能,减少厂站接线图文字漏识别率,从而提升整体流程的文字识别性能。该方法可采用不同的文本检测模型和文字识别模型组合,进而使文字识别效果更加,提高了文字识别的准确度。

8、进一步的,所述文本检测模型包括主干网络、颈部网络和头部网络,所述主干网络用于对主干网络的输入进行特征提取,所述颈部网络用于对特征提取结果进行上采样,进而将上采样结果与主干网络输出的特征提取结果进行拼接,所述头部网络用于将拼接结果进行上采样得到文本区域预测概率图,将预测概率大于设定阈值的区域视为文本区域。

9、有益效果:本专利技术文本检测模型采用了基于语义分割的方法获取文本区域,进行特征提取,将带有文字特征的区域提取出来进行特征融合,将融合后的特征图进行上采样得到文本区域预测概率图,进而得到文本位置信息。经过该检测模型获取文本区域更全面,准确率也比较高。

10、进一步的,所述主干网络采用resnet18。

11、有益效果:该网络容易优化,采用resnet18能够更好平衡运行速度和识别准确率。

12、进一步的,所述文字识别模型采用crnn网络。

13、进一步的,所述crnn网络的主干网络采用resnet34,所述crnn网络的主干网络采用resnet34,所述crnn网络的颈部网络采用双向长短期记忆网络,所述crnn网络的头部网络采用全连接层。

14、有益效果:本专利技术文字识别模型采用crnn网络,该识别模型较小,对该识别模型训练速度快,识别准确度高,crnn网络的主干网络采用resnet34,所述颈部网络采用双向长短期记忆网络,所述头部网络采用全连接层,使用的网络结构简单容易实现,层次比较少速度比较快,识别的准确率较高。

15、进一步的,虚拟厂站接线图片中文字之间的距离是随机设置的。

16、有益效果:随机放置图片的文字,距离随机设置,增加了样品多样性,提高了文字识别精度。

17、进一步的,所述步骤2)中将随机选择的若干文字图片粘贴在空白图像上得到虚拟厂站接线图片。

18、有益效果:本专利技术将随机选择的若干文字图片粘贴在空白图像上,保证待识别的虚拟厂站接线图片无其他干扰信息。

19、进一步的,所述预处理是将接线图片进行灰度化及灰度反转处理,并将接线图片缩放至设定尺寸。

20、有益效果:由于获取的接线图片多数带有多种颜色,将图片进行灰度化及灰度反转处理,得到一致的灰度图片,文本检测模型及文字识别模型识别更加精准,将接线图片缩放至设定尺寸,符合文本检测模型及文字识别模型的要求,方便进行识别处理。

21、本专利技术的一种厂站接线图文字识别装置,包括处理器,所述处理器用于执行程序指令以实现如上述的厂站接线图文字识别方法。

22、有益效果:本专利技术还设置了厂站接线图文字识别装置,通过该装置上述实现厂站接线图文字识别方法,完成对电网厂站接线图片的文字识别,提高识别准确率。

本文档来自技高网...

【技术保护点】

1.一种厂站接线图文字识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的厂站接线图文字识别方法,其特征在于,所述文本检测模型包括主干网络、颈部网络和头部网络,所述主干网络用于对主干网络的输入进行特征提取,所述颈部网络用于对特征提取结果进行上采样,进而将上采样结果与主干网络输出的特征提取结果进行拼接,所述头部网络用于将拼接结果进行上采样得到文本区域预测概率图,将预测概率大于设定阈值的区域视为文本区域。

3.根据权利要求2所述的厂站接线图文字识别方法,其特征在于,所述主干网络采用resnet18。

4.根据权利要求1所述的厂站接线图文字识别方法,其特征在于,所述文字识别模型采用CRNN网络。

5.根据权利要求4所述的厂站接线图文字识别方法,其特征在于,所述CRNN网络的主干网络采用resnet34,所述CRNN网络的颈部网络采用双向长短期记忆网络,所述CRNN网络的头部网络采用全连接层。

6.根据权利要求1所述的厂站接线图文字识别方法,其特征在于,虚拟厂站接线图片中文字之间的距离是随机设置的。

7.根据权利要求1所述的厂站接线图文字识别方法,其特征在于,所述步骤2)中将随机选择的若干文字图片粘贴在空白图像上得到虚拟厂站接线图片。

8.根据权利要求1所述的厂站接线图文字识别方法,其特征在于,所述预处理是将接线图片进行灰度化及灰度反转处理,并将接线图片缩放至设定尺寸。

9.一种厂站接线图文字识别装置,其特征在于,包括处理器,所述处理器用于执行程序指令以实现如权利要求1-8任一项所述的厂站接线图文字识别方法。

...

【技术特征摘要】

1.一种厂站接线图文字识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的厂站接线图文字识别方法,其特征在于,所述文本检测模型包括主干网络、颈部网络和头部网络,所述主干网络用于对主干网络的输入进行特征提取,所述颈部网络用于对特征提取结果进行上采样,进而将上采样结果与主干网络输出的特征提取结果进行拼接,所述头部网络用于将拼接结果进行上采样得到文本区域预测概率图,将预测概率大于设定阈值的区域视为文本区域。

3.根据权利要求2所述的厂站接线图文字识别方法,其特征在于,所述主干网络采用resnet18。

4.根据权利要求1所述的厂站接线图文字识别方法,其特征在于,所述文字识别模型采用crnn网络。

5.根据权利要求4所述的厂站接线图文字识别方法,其特征在于...

【专利技术属性】
技术研发人员:李杜林翟登辉许丹李东宾刘睿丹杨田野吕勇强张旭卢声
申请(专利权)人:许昌许继软件技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1