At present, there are a large number of equipment test reports before the information system construction is not included in the information system for structured storage, the value of these rich historical test results data has not been fully utilized. The invention relates to a power equipment condition monitoring and fault diagnosis technology field, in particular relates to a method for processing structured power equipment test report: first, the paper test report into electronic image files; secondly based on the technology of OCR image information into text information; and then combined with the configuration information template structure; followed by analysis of the check test data recognition; finally, complete test equipment and save information system. The invention creatively implement the structured processing and storage, transfer, prevention of factory test reports of power equipment and tracking test history paper, enrich the basic data analysis required, to enhance the reliability of power transmission and distribution facilities and equipment maintenance level.
【技术实现步骤摘要】
本专利技术涉及电力设备状态监测及故障诊断
,特别涉及一种电力设备试验报告的结构化处理方法。
技术介绍
预防性试验是电力设备运行和维护工作中的一个重要环节,是保证电力系统安全运行的有效手段之一。最常见的试验项目有:交流耐压试验、直流耐压试验、局部放电测量、气体的色谱分析、空载电流测量、极化指数、吸收比、极性检查、介质损耗因数tanδ试验。电力设备运维人员在分析设备是否存在缺陷时,不仅需要分析本次试验结果数据,还需要与该设备历次试验结果数据以及同类设备试验结果数据相比较,进行全面分析后再做出判断。目前,在未建立信息系统之前,电力设备预防性试验一般是先根据试验内容模板打印出纸质的试验报告,然后在试验过程中根据试验情况由人工完成试验结果数据填写,最后再将试验报告进行存档。根据设备类型和试验类型的不同,电力设备预防性试验的内容模板也不同,如图1是一种变压器耐压试验的内容模板。生产管理信息系统的建设和现场作业移动应用的推广,为电力设备试验结果数据的结构化存储提供了便利基础。但仍有大量在信息系统建设之前的设备试验结果数据,以纸质文件的形式进行存档。因为未纳入信息系统中进行结构化存储,这些丰富的历史试验数据的价值也未得到充分利用。由于纸质历史试验报告的数量很多,靠人工在信息系统中进行补录的工作量巨大。因此,为方便试验结果数据的查询与分析,试验结果数据的结构化存储是十分重要且必要的。
技术实现思路
为实现出厂、交接、预防性及跟踪试验等历史纸质的电力设备试验报告的结构化处理与存储,充分发挥电力设备历史试验数据的价值,为电力设备诊断分析提供更丰富的数据基础,促进电力设备运维 ...
【技术保护点】
一种电力设备试验报告的结构化处理方法,其特征在于包括以下步骤:(1)将纸质试验报告转成电子化图像文件;(2)基于OCR技术将图像信息转化为文本信息;(3)结合模板配置信息进行结构化处理;(4)对识别的试验数据进行校核分析;(5)完成试验设备匹配并保存至信息系统。
【技术特征摘要】
1.一种电力设备试验报告的结构化处理方法,其特征在于包括以下步骤:(1)将纸质试验报告转成电子化图像文件;(2)基于OCR技术将图像信息转化为文本信息;(3)结合模板配置信息进行结构化处理;(4)对识别的试验数据进行校核分析;(5)完成试验设备匹配并保存至信息系统。2.根据权利要求1所述的一种电力设备试验报告的结构化处理方法,其特征在于:步骤(1)首先根据设备类型、试验类型和试验内容模板,对纸质试验报告进行分类整理,然后通过高速扫描仪将所有纸质试验报告进行自动批量扫描成电子化图像文件,并按照设备类型、试验类型和试验内容模板采用不同的文件路径保存。3.根据权利要求1所述的一种电力设备试验报告的结构化处理方法,其特征在于:步骤(2)基于OCR技术,如tesseract引擎,将电子化的试验报告图像文件转化成文本信息,并生成一个box文件;所述box文件记录tesseract识别出来的每一个字和其位置坐标。4.根据权利要求1所述的一种电力设备试验报告的结构化处理方法,其特征在于:步骤(2)基于OCR技术将图像信息转化为文本信息的转化过程中,可以选择默认的简体中文语言库,也可基于tesseract提供的训练样本方法,生成自己所需的识别语言库。5.根据权利要求1所述的一种电力设备试验报告的结构化处理方法,其特征在于:针对每组设备类型、试验类型和试验内容模板的试验报告文件,设置一套模板配置信息;步骤(3)在模板配置信息的基础上,根据配置的位置信息,对步骤(2)识别出来的文本信息和其位置坐标进行对比解析...
【专利技术属性】
技术研发人员:张炜,杨健,吴秋莉,颜海俊,苏毅,邬蓉蓉,郭丽娟,邓雨荣,张玉波,吕泽承,黎新,
申请(专利权)人:广西电网有限责任公司电力科学研究院,
类型:发明
国别省市:广西;45
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。