【技术实现步骤摘要】
基于深度学习的弱监督电力图纸OCR识别方法
本专利技术涉及电力图纸智能识别
,特别是指一种基于深度学习的弱监督电力图纸OCR识别方法。
技术介绍
目前,智慧电力在我国电网系统的应用逐步开展,智慧电力将电能流和信息流结合在一起,实现能源传输的同时实现数据的采集。但是我国电力系统发展迅速的同时也会带来相当巨大的工作量,尤其对于电力系统中的图纸,图纸中的文字符号众多,字体相对偏小而且文本方向不统一,通过人工获取图中的信息,将会耗费过多时间并且准确率也无法得到保证。例如像变电站一次接线图,它采用规定的设备文字和图形符号并按照工作顺序排列,详细地表示电气设备或成套装备的全部基本组成和连接关系。但是其中的文字类型较多,而且相对图片本身它的字体过小,人工读取将会非常的耗时耗力。为解决上述问题,近年来有许多研究工作基于计算机视觉以解决对图像中的文字进行OCR(OpticalCharacterRecognition,光学字符识别)识别等问题。然而现有的OCR识别技术主要是基于词的水平上并只针对水平文本进行识别,例如CTPN(Co ...
【技术保护点】
1.一种基于深度学习的弱监督电力图纸OCR识别方法,其特征在于,包括:/n利用预先训练好的文本检测模型对待识别图像进行检测,通过检测每个文字字符的区域与文字字符的相互关系,预测出整个单词级别的文本区域框,其中所述文本检测模型对每个单词级别的标注区域使用弱监督训练学习字符特性;/n对预测出的文本区域框进行文字识别:对于竖直文本采用字符切割得到单个字符文本,对于水平文本则直接使用文本行,之后再通过CNN+BiLSTM+CTC模型进行识别;/n对得到的识别结果进行后处理:通过先验知识对结果进行判定和修改来提高准确率。/n
【技术特征摘要】
1.一种基于深度学习的弱监督电力图纸OCR识别方法,其特征在于,包括:
利用预先训练好的文本检测模型对待识别图像进行检测,通过检测每个文字字符的区域与文字字符的相互关系,预测出整个单词级别的文本区域框,其中所述文本检测模型对每个单词级别的标注区域使用弱监督训练学习字符特性;
对预测出的文本区域框进行文字识别:对于竖直文本采用字符切割得到单个字符文本,对于水平文本则直接使用文本行,之后再通过CNN+BiLSTM+CTC模型进行识别;
对得到的识别结果进行后处理:通过先验知识对结果进行判定和修改来提高准确率。
2.根据权利要求1所述的方法,其特征在于,所述利用预先训练好的文本检测模型对待识别图像进行检测,通过检测每个文字字符的区域与文字字符的相互关系,预测出整个单词级别的文本区域框之前,包括:
对电力系统图纸进行切割,得到预设尺寸范围内的待识别图像。
3.根据权利要求1所述的方法,其特征在于,所述文本检测模型的训练包括:
数据集使用两种:字符级标签的强数据集和单词级标签的弱数据集;
标签包括:字符级的高斯热图和字符间连接的高斯热图;
对于单词级标签的弱数据集生成伪标签:首先,将单词级别的字符区域从原图中裁剪出来;之后,使用强监督训练出的预训练模型预测区域分数Regionscore,再通过分水岭算法分割字符区域得到字符框;最后,将字符框的坐标转换回原坐标;
文本检测模型训练过程分为两步:首先,在SynthText数据集上进行训练,迭代50K次;之后,在电力系统图纸数据集上进行微调fine-tuning,此时弱标签数据和强标签数据按照1:5的比例进行训练,即得到所需的文本检测模型。
4.根据权利要求3所述的方法,其特征在于,所述字符级标签的强数据集为SynthText数据集,所述单词级标签的弱数据集为电力系统图纸数据集。
5.根据权利要求3所述的方法,其特征在于,对于字符级标签的强数据集来说,字符级的高斯热图直接由字符框生成高斯热图来获得,字符间连接的高斯热图是由亲和力框AffinityBox生成高斯热图来获得,其中,AffinityBox是通过连接字符框的对角线,再对连接对角线后产生的三角形进行组合得到候选的AffinityBox,之后选出其中面积最大且为凸四边形的即为AffinityBox。
6.根据权利要求1所述的方法,其特征在于,所述利用预先...
【专利技术属性】
技术研发人员:王杉,李昊,石玮,朱玉锦,高连学,王黎,孙万珺,苗纯源,甘甜,
申请(专利权)人:国网山东省电力公司青岛供电公司,国家电网有限公司,山东大学,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。