当前位置: 首页 > 专利查询>四川大学专利>正文

一种基于机器学习的数字式表计识别方法技术

技术编号:12019118 阅读:58 留言:0更新日期:2015-09-09 16:11
本发明专利技术提供一种基于机器学习的数字式表计识别方法,属于电表设备技术领域。为了解决传统的人工抄表方式,工作量大,效率低,不安全,不利于数据统计和查询的问题。本发明专利技术提供一种基于机器学习的数字式表计识别方法,主要包括以下内容:首先对表计图像预处理得到有效区域,进而对有效区域进行图像分割,获得单个数字的图像。使用支持向量机模型对单个数字样本进行训练,用训练后的支持向量机模型为待识别的数字进行识别,从而完成数字表计的智能读数。本发明专利技术提供的基于机器学习的数字式表计识别方法,可以在复杂环境下对数字式表计进行快速、可靠、精确地远程智能读数,可在变电站中进行广泛的运用。

【技术实现步骤摘要】

本专利技术属于电表设备
,特别涉及一种基于机器学习的数字式表计识别方 法。
技术介绍
变电站是输电和配电的集合点,是电力系统的重要组成部分。变电站需要记录各 表计的读数并监测其相关状态以保障电变站的正常运作和电力数据的收集、统计。变电站 中各种表计数目繁多,传统人工抄表方式下,工作量大,效率低,不安全,不利于数据统计和 查询,同时也无法实时对变电站中基础电力设施进行监控,造成了一定的安全隐患。 随着电子信息技术高速发展,各行各业都在走向数字化和智能化的今天,利用现 代化设备和识别算法,针对复杂的实际工业环境,实现自然场景下表计的智能读数并记录, 以高效安全的方式代替落后的传统抄表方式有着非常重要的意义。 实时监控变电站中基础电力设施,在第一时间发现并解决供电故障,以保证民用 和工业的稳定供电十分重要。但是,现有的表计智能识别系统也大多基于ARM嵌入式系统, 硬件成本高,通用性低,可移植性较差。
技术实现思路
为了解决上述问题,本专利技术提供一种可在复杂环境下对数字式表计进行快速、可 靠、精确地远程智能读数的智能识别方法,采用如下技术方案: ,其特征在于,包括以下步骤: (1)对数字式表计的图像进行预处理,得到有效区域; (2)对有效区域进行图像分割,获得单个数字的图像; (3)使用支持向量机模型对单个数字样本进行训练; (4)用训练后的支持向量机模型为待识别的数字进行识别,得到数字表计的智能 读数。进一步地,步骤(4)中所述的为待识别的数字进行识别包括以下内容: al.标定图像有效识别区域;a2.对有效区域进行分割,将图像分割为统一大小的独立数字图像;a3.将分割后的各图像进行矩阵重组;a4.用训练后的支持向量机模型依次进行预测;a5.计算即得到识别结果。 本专利技术产生的有益效果如下: 传统的人工抄表方式,工作量大,效率低,不安全,不利于数据统计和查询,同时也 无法实时对变电站中基础电力设施进行监控,造成了一定的安全隐患。而本专利技术提供的基 于机器学习的数字式表计识别方法,可以复杂环境下对机械式电表进行快速、可靠、精确地 远程智能读数,可在变电站中进行广泛的运用。【附图说明】 图1为训练过程流程示意图; 图2为预测过程流程示意图。【具体实施方式】 下面参照附图对本专利技术的实施方式进行详细说明,但不限制本专利技术的保护范围。 实施例1 -种基于机器学习的数字式表计识别方法,主要采用如下方法: 基于变电站的实际情况,对表计图像预处理,用支持向量机对样本图像进行训练, 并用于判断待识别的表计图像中的数字。对数字表计的识别主要分为训练,预测两个部分; 训练数据集生成SVM模型,图1所示为训练过程流程示意图。 用训练好的SVM模型对数字表计图像进行预测(即识别),并给出预测结果,图2 所示为识别过程流程示意图: 实施例2 (基于SVM分类器),包括以下步骤: (1)对数字式表计的图像进行预处理,得到有效区域; 对数字表计图像进行标定,用配置工具获得图像中特定点的坐标值并存入xml配 置文件,在程序中读入xml配置文件,获得有效区域。 (2)对有效区域进行图像分割,获得单个数字的图像; 对有效区域进行分割,读入特定点的坐标值,将有效区域分割为统一大小50*61 的三个独立数字图像,并对这些图像文件进行分类整理,分别存入标签为0-9的文件夹,作 为训练样本。 (3)使用支持向量机模型对单个数字样本进行训练; 批量读取用于训练的数据图像及其标签,对图像做平滑降噪处理。访问图像数据, 获得矩阵,遍历图像的每个像素点,对矩阵值做归一化处理。将处理后的数据存为一个3050 维的行向量,作为训练数据。关键代码如下表所示:设置训练参数,包括SVM的类型,迭代终止准则,核函数类型,以及核函数的参数 等。SVM的类型参数有如下几种:C_SVC是C类支持向量分类机,n类分组(n彡2),允许用 异常值惩罚因子C进行不完全分类,本文训练采用的为C类支持向量机;EPS_SVR是e类支 持向量回归机。训练集中的特征向量和拟合出来的超平面的距离需要小于P,异常值惩罚因 子C被采用;NU_SVCv类支持向量分类机,n类似然不完全分类的分类器,参数为v取代C。 参数ternucrit是SVM的迭代训练过程的中止条件,解决部分受约束二次最优问题。引入 核函数用于减少(2. 13)式中因点积运算而产生的巨大的计算量和开销。结果表明,训练元 组中需点积运算的非线性映射函数完全等价于将核函数K(Xi,Xp应用于原输入数据的效 果。即: 所以,每次训练时都可用K(Xi,Xj代替点积运算攀0;) ?◎(Ay),可供使用的核函 数有h次多项式核函数,高级径向基函数核函数(RBF)和S型核函数等。其中较为常用的是RBF核函数,引入核函数的好处是可以将训练样本映射到更有利于可线性分割的样本集,即 增加样本向量的维度,核函数的参数有惩罚因子c和Y。几种常用的核函数如1. 2式到1. 5 式所示:a5.将训练好的SVM模型保存为xml文件。 (4)用训练后的支持向量机模型为待识别的数字进行识别,得到数字表计的智能 读数。 在已经训练并生成SVM模型的基础上,对数字表计读数的预测步骤如下:al.对数字表计图像进行标定,用配置工具获得图像中特定点的坐标值,此过程作 为图片配置工作,将配置结果存入xml文件。a2.读入待识别表计图像和xml配置文件,根据配置信息对图像进行分割,分割为 统一大小50*61的三个独立数字图像。 a3.依次将三个待识别图像作为测试数据输入,用SVM模型对其进行预测,获得三 个响应值,并计算得到最终预测结果。如1. 6式所示:result=ResponsetestF*100+Responsetests*10+ResponsetestT (1. 6)其中,ResponsetestF,ResponsetestdPlResponse加"分别是用SVM模型预测第一,二, 三个数字获得的响应值,result是最后计算得到的结果,即表计识别结果。 实施例3 数字表计识别结果与分析如下: 随机选取40个数字表计图像,分割后获得120个训练样本,对这120个样本进行 训练,获得支持向量机模型,并保存训练数据。用其余40个表计图像作测试样本,测试结果 如下表所示: 由上表可看出,RBF核函数较适合做支持向量机训练所用核函数。通过对终止条 件,迭代次数及核函数参数的实验,最终确定了最合适的参数,即在保证了识别准确率的前 提下,训练时间最短的参数组。 无法准确识别的图像大都是由于强烈光照或过于扭曲的拍摄角度获取到的质量 较差的图像。实验发现,当加入一些同等低质量的图像做样本集训练后,此类质量较差的图 像也可以被正确识别。即对于失败案例的解决方法有两种:一是不在强光照等恶劣环境下 采集图像;二是可以在恶劣环境中采集适当图像加入样本集参与训练,这样训练生成的支 持向量机模型可对此类低质量图片准确识别。【主权项】1. ,其特征在于,包括以下步骤: (1) 对数字式表计的图像进行预处理,得到有效区域; (2) 对有效区域进行图像分割,获得单个数字的图像; (3) 使用支持向量机模型对单个数字样本进行训练; (4) 用训练后的支持向量机模型为待识别的数字本文档来自技高网...

【技术保护点】
一种基于机器学习的数字式表计识别方法,其特征在于,包括以下步骤:(1)对数字式表计的图像进行预处理,得到有效区域;(2)对有效区域进行图像分割,获得单个数字的图像;(3)使用支持向量机模型对单个数字样本进行训练;(4)用训练后的支持向量机模型为待识别的数字进行识别,得到数字表计的智能读数。

【技术特征摘要】

【专利技术属性】
技术研发人员:张蕾章毅
申请(专利权)人:四川大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1