一种基于多特征融合的水表读数区域检测算法制造技术

技术编号：14277514 阅读：165 留言：0更新日期：2016-12-24 20:19

本发明专利技术公开的一种基于多特征融合的水表读数区域检测算法，包括以下步骤：S1、获取训练数据；S2、切割出水表图像中读数区域和非读数区域，提取该切割区域的多通道特征并进行特征融合，以该特征为输入训练目标分类器；S3、提取水表图像多通道特征，计算其特征积分图；S4、利用特征积分图计算各滑动窗特征，以融合特征为输入，利用S2训练所得分类器对滑动窗进行分类，获取目标窗口；S5、用外插方法估计原图在多个尺度下的特征图，重复S4、S5，获取多尺度的目标窗口；S6、旋转原图，重复S3、S4、S5、S6，获取多方向的目标窗口。本发明专利技术提供了一种准确、鲁棒、实用的水表读数区域检测算法。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能领域，特别涉及一种基于多特征融合的水表读数区域检测算法。
技术介绍
近几年来，随着移动互联网的发展和数字产品的普及，来自于不同设备(智能手机、数码相机，甚至自动驾驶街景车、无人机等摄像头)的图像数据持续爆发式地增长。这些海量的图像中，有相当一部分图像数据携带了文字信息，而文字信息通常蕴含着非常有益的语义信息。比如，这些文字信息可能是对建筑物、商店、交通牌、路牌、商品名称等的描述。因此，这些高层的语义信息可以广泛地应用于机器阅读、自动拍译、图像检索、视频检索、语言翻译、自动驾驶、机器人导航等场合。人类更加迫切地需要一种智能的视觉文字分析技术。视觉文字分析是从机器视觉的角度抽取和理解文字信息的一种技术。它涉及到图像处理、模式识别、计算机视觉、机器学习和心理学等一系列学科知识，一直以来都是相关领域的重要研究方向之一。基于计算机视觉的水表自动读数就是视觉文字分析中的一个重要应用，它可以取代现有的人工水表读数方式，使得水表读数成为自动化流程。基于视觉的文本分析首要解决的问题就是文字区域的检测。基于视觉的水表自动读数首要解决的问题就是读数区域的检测，目前主流的方法是基于图像处理的方法，通过图像去噪、基于颜色特征的图像二值化、基于线检测的方向检测、区域分割等步骤来确定读数区域。然而这种方法对各种复杂场景下的光照、形变、遮掩等条件适应性不好，容易受干扰，鲁棒性差。
技术实现思路
本专利技术的目的在于克服现有技术的缺点与不足，提供一种基于多特征融合的水表读数区域检测算法。本专利技术的目的通过以下的技术方案实现：一种基于多特征融合的水表读数区域检测算法，包...

【技术保护点】
一种基于多特征融合的水表读数区域检测算法，其特征在于，包含以下步骤：S1、获取训练数据，通过摄像头拍摄水表图像样本，并对图像中的水表读数区域进行人工标注，获取水表读数的中心位置、长度和宽度信息；S2、切割水表图像中读数区域和非读数区域，提取该切割区域的多通道特征并进行特征融合，以提取的多通道特征为输入训练图像分类器；所述切割区域是不确定的区域，由图像分类器进行分类，分为读数区域和非读数区域；S3、提取水表图像多通道特征，所述多通道特征包括梯度方向直方图、梯度幅值、LUV颜色特征、灰度颜色特征，计算水表图像的特征积分图；S4、遍历全部滑动窗，利用特征积分图计算各滑动窗特征，利用S2训练的图像分类器对滑动窗进行分类，获取目标窗口；S5、用外插方法估计原图在多个尺度下的特征积分图，重复S4、S5步骤，获取多尺度的目标窗口；S6、旋转原图，重复S3、S4、S5、S6步骤，获取多方向的目标窗口。

【技术特征摘要】
1.一种基于多特征融合的水表读数区域检测算法，其特征在于，包含以下步骤：S1、获取训练数据，通过摄像头拍摄水表图像样本，并对图像中的水表读数区域进行人工标注，获取水表读数的中心位置、长度和宽度信息；S2、切割水表图像中读数区域和非读数区域，提取该切割区域的多通道特征并进行特征融合，以提取的多通道特征为输入训练图像分类器；所述切割区域是不确定的区域，由图像分类器进行分类，分为读数区域和非读数区域；S3、提取水表图像多通道特征，所述多通道特征包括梯度方向直方图、梯度幅值、LUV颜色特征、灰度颜色特征，计算水表图像的特征积分图；S4、遍历全部滑动窗，利用特征积分图计算各滑动窗特征，利用S2训练的图像分类器对滑动窗进行分类，获取目标窗口；S5、用外插方法估计原图在多个尺度下的特征积分图，重复S4、S5步骤，获取多尺度的目标窗口；S6、旋转原图，重复S3、S4、S5、S6步骤，获取多方向的目标窗口。2.根据权利要求1所述基于多特征融合的水表读数区域检测算法，其特征在于，所述步骤S1具体为：S1.1、通过RGB摄像头采集实际场景中的水表图像样本；S1.2、对S1.1中所获取的水表图像样本中的水表读数区域进行人为的标注，包括水表读数区域的中心位置(x,y)、长度h、宽度w和角度a。3.根据权利要求2所述基于多特征融合的水表读数区域检测算法，其特征在于，所述水表图像样本包括以下不同的参数：光照、视角、水表类型、水表受损程度。4.根据权利要求1所述基于多特征融合的水表读数区域检测算法，其特征在于，所述步骤S2具体为：S2.1、按照步骤S1所得水表图像及读数区域标注，切割出读数区域和非读数，用于目标的分类；S2.2、提取S2.1所切割图像的多通道特征，以多通道特征为输入，训练集成决策树分类器对该区域是否为读数区域进行分类。5.根据权利要求1所述基于多特征融合的水表读数区域检测算法，其特征在于，所述步骤S3具体为:S3.1、提取水表图像多通道特征，包括梯度方向直方图、梯度幅值、LUV颜色特征、灰度颜色特征，并计算特征积分图；所述梯度方向的计...

【专利技术属性】
技术研发人员：金连文，刘孝睿，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人