【技术实现步骤摘要】
变电站面板文字识别方法、系统、设备及存储介质
[0001]本专利技术涉及电网巡检维护
,具体为变电站面板文字识别方法、系统、设备及存储介质。
技术介绍
[0002]文字识别(optical character recognition,OCR),传统意义上指对文本资料的图像进行识别处理,然后以计算机可理解的文本形式返回。难度系数更高的应用场景,即场景文字识别技术。近年来,由于神经网络的快速发展,对规则场景文字的识别能力已经大大提高。由神经网络提取的模式特征相比于手工制作的特征变得占主导地位。经过多年的发展,文字识别技术在我国多个领域均取得了较为可观的成果。但当前的文字识别技术仍存在许多缺陷,如何设计一种高识别性、高鲁棒性、高准确性的文字识别系统一直是当下许多研究的目标。随着文字识别新算法的不断提出和优化,以及计算机计算能力的提升,文字识别的应用也越来越广泛。随着电力系统运行的智能化,基于深度学习的文字识别技术开始逐步应用于电力领域,特别是电力系统中的文本信息处理,其中最常见的有电力设备文本信息处理和图纸文本信息处理。r/>[0003]当本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种变电站面板文字识别方法,其特征在于,所述方法包括:获取原始图片,对原始图片进行预处理;对预处理后的图片进行文字识别处理;根据提供的仪器面板信息照片构建变电站面板文字信息数据库;根据变电站面板文字信息数据库对文字识别处理结果进行纠正,得到最终识别结果。2.根据权利要求1所述的一种变电站面板文字识别方法,其特征在于:所述对原始图片进行预处理,具体包括:采用灰度化和二值化方法对于原始图片进行预处理,根据不同应用场景特点选择参数,提取图像像素点矩阵,将其灰度化后再通过阈值判断进行二值化;其中,灰度化函数为:GRAY=0.114B+0.587G+0.299R其中,GRAY为灰度化后图片灰度值矩阵,R、G、B分别为原图片每个像素点的R、G、B三个分量的值构成的矩阵。3.根据权利要求1所述的一种变电站面板文字识别方法,其特征在于:所述对预处理后的图片进行文字识别处理,包括:将CNOCR算法进行改进,通过改进的CNOCR算法对预处理后的图片进行文字识别处理;所述CNOCR算法的改进具体为:所述CNOCR算法的归一化指数函数损失函数将优化目标调整为:||W1||
·
||x||cos(θ1)>||W2||
·
||x||cos(θ2)进行严格分类,限制得到:||W1||
·
||x||cos(θ1)≥||W1||
·
||x||cos(nθ1)>||W2||
·
||x||cos(θ2)其中,x为特征层提取输出特征,x
i
为特征层提取的第i个输出特征,W为分类层的类权重矩阵,y
j
为x
i
所属类别编号,W
yj
表示矩阵的y
j
列,cosθ为两者间的余弦距离,m为正整数,代表内积间距,k取非负整数,为参数。所述归一化指数函数损失函数为:添加决策边界后,最终的大间距归一化指数函数损失函数为:通过调整m大小确定不同场景下的最佳类间间距,达到最佳识别效果。4.根据权利要求1所述的一种变电站面板文字识别方法,其特征在于:所述构建变电站面板文字信息数据库,包括:根据仪器面板信息照片,初步录入面板文字内容;针对不同设备出现的不同表达方式进行规范化处理,在匹配前对定值单进行规范化处
理,主要将常见不规范的名称规范化,将同一含义的不同表达形式归类与同一主题下,即分为规范名称与规范名称下的次级名称,属于同一规范名称的次级名称在电气逻辑关系中赋予相同的含义;对每一个面板的信息进行统计,将高频出现的规范名称优先放置在前,同一主题下高频出现的规范次级名称优先放置在前;最终得到按照出现频率由高到低排列的文字信息数据库,即排列带权重的文字信息数据库。5.根据权利要求1所述的一种变电站面板文字识别方法,其特征在于:所述根据变电站面板文字信息数据库对文字识别处理结果进行纠正,包括:根据面板文字信息库将结果中因噪点而产生的无关乱码排除;利用关键词与莱文斯坦距离相结合的模糊匹配算...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。