【技术实现步骤摘要】
本专利技术涉及人工智能领域,特别涉及一种基于多特征融合的水表读数区域检测算法。
技术介绍
近几年来,随着移动互联网的发展和数字产品的普及,来自于不同设备(智能手机、数码相机,甚至自动驾驶街景车、无人机等摄像头)的图像数据持续爆发式地增长。这些海量的图像中,有相当一部分图像数据携带了文字信息,而文字信息通常蕴含着非常有益的语义信息。比如,这些文字信息可能是对建筑物、商店、交通牌、路牌、商品名称等的描述。因此,这些高层的语义信息可以广泛地应用于机器阅读、自动拍译、图像检索、视频检索、语言翻译、自动驾驶、机器人导航等场合。人类更加迫切地需要一种智能的视觉文字分析技术。视觉文字分析是从机器视觉的角度抽取和理解文字信息的一种技术。它涉及到图像处理、模式识别、计算机视觉、机器学习和心理学等一系列学科知识,一直以来都是相关领域的重要研究方向之一。基于计算机视觉的水表自动读数就是视觉文字分析中的一个重要应用,它可以取代现有的人工水表读数方式,使得水表读数成为自动化流程。基于视觉的文本分析首要解决的问题就是文字区域的检测。基于视觉的水表自动读数首要解决的问题就是读数区域的检测,目 ...
【技术保护点】
一种基于多特征融合的水表读数区域检测算法,其特征在于,包含以下步骤:S1、获取训练数据,通过摄像头拍摄水表图像样本,并对图像中的水表读数区域进行人工标注,获取水表读数的中心位置、长度和宽度信息;S2、切割水表图像中读数区域和非读数区域,提取该切割区域的多通道特征并进行特征融合,以提取的多通道特征为输入训练图像分类器;所述切割区域是不确定的区域,由图像分类器进行分类,分为读数区域和非读数区域;S3、提取水表图像多通道特征,所述多通道特征包括梯度方向直方图、梯度幅值、LUV颜色特征、灰度颜色特征,计算水表图像的特征积分图;S4、遍历全部滑动窗,利用特征积分图计算各滑动窗特征,利 ...
【技术特征摘要】
1.一种基于多特征融合的水表读数区域检测算法,其特征在于,包含以下步骤:S1、获取训练数据,通过摄像头拍摄水表图像样本,并对图像中的水表读数区域进行人工标注,获取水表读数的中心位置、长度和宽度信息;S2、切割水表图像中读数区域和非读数区域,提取该切割区域的多通道特征并进行特征融合,以提取的多通道特征为输入训练图像分类器;所述切割区域是不确定的区域,由图像分类器进行分类,分为读数区域和非读数区域;S3、提取水表图像多通道特征,所述多通道特征包括梯度方向直方图、梯度幅值、LUV颜色特征、灰度颜色特征,计算水表图像的特征积分图;S4、遍历全部滑动窗,利用特征积分图计算各滑动窗特征,利用S2训练的图像分类器对滑动窗进行分类,获取目标窗口;S5、用外插方法估计原图在多个尺度下的特征积分图,重复S4、S5步骤,获取多尺度的目标窗口;S6、旋转原图,重复S3、S4、S5、S6步骤,获取多方向的目标窗口。2.根据权利要求1所述基于多特征融合的水表读数区域检测算法,其特征在于,所述步骤S1具体为:S1.1、通过RGB摄像头采集实际场景中的水表图像样本;S1.2、对S1.1中所获取的水表图像样本中的水表读数区域进行人为的标注,包括水表读数区域的中心位置(x,y)、长度h、宽度w和角度a。3.根据权利要求2所述基于多特征融合的水表读数区域检测算法,其特征在于,所述水表图像样本包括以下不同的参数:光照、视角、水表类型、水表受损程度。4.根据权利要求1所述基于多特征融合的水表读数区域检测算法,其特征在于,所述步骤S2具体为:S2.1、按照步骤S1所得水表图像及读数区域标注,切割出读数区域和非读数,用于目标的分类;S2.2、提取S2.1所切割图像的多通道特征,以多通道特征为输入,训练集成决策树分类器对该区域是否为读数区域进行分类。5.根据权利要求1所述基于多特征融合的水表读数区域检测算法,其特征在于,所述步骤S3具体为:S3.1、提取水表图像多通道特征,包括梯度方向直方图、梯度幅值、LUV颜色特征、灰度颜色特征,并计算特征积分图;所述梯度方向的计...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。