一种基于区域卷积神经网络模型的品牌Logo检测与识别方法技术

技术编号:19141797 阅读:29 留言:0更新日期:2018-10-13 08:55
本发明专利技术公开了一种基于区域卷积神经网络模型的品牌Logo检测与识别方法,方法步骤如下:步骤1、进行原始数据集扩充,得到规模达到进行区域卷积神经网络模型训练要求的扩充的数据集;步骤2、利用扩充后的数据集对区域卷积神经网络模型进行训练;步骤3、基于区域卷积神经网络对输入图像进行Logo检测与识别。本发明专利技术进行原始数据集扩充、深度学习网络模型训练、基于区域卷积神经网络的Logo检测与识别,实现了复杂背景下多种Logo的检测与识别。

A method of brand Logo detection and recognition based on regional convolution neural network model

The invention discloses a brand logo detection and recognition method based on a region convolution neural network model. The method steps are as follows: 1. Expanding the original data set to obtain the expanded data set which meets the training requirements of the region convolution neural network model; 2. Using the expanded data set to carry out the region convolution neural network model training. Integral neural network model is trained; Step 3, Logo detection and recognition of input image based on region convolution neural network. The invention extends the original data set, trains the depth learning network model, detects and recognizes logos based on the area convolution neural network, and realizes the detection and recognition of multiple logos in complex background.

【技术实现步骤摘要】
一种基于区域卷积神经网络模型的品牌Logo检测与识别方法
本专利技术属于目标检测与识别
,具体涉及一种基于区域卷积神经网络模型的品牌Logo检测与识别方法。
技术介绍
Logo检测与识别技术主要是通过对输入图像的一系列处理工作,然后在图像中找出Logo所在的区域并判定目标区域Logo的具体类别。在当今的日常生产生活中,Logo检测与识别技术在城市智能交通、文档检索分类、品牌溯源追踪、商业广告分析等领域都有着巨大的应用前景。虽然目前关于目标与检测技术的研究已经相对比较成熟,但是由于在不同的应用场景下,待检测目标的背景差异、形变差异等都会导致目标检测难度的提升,所以目前进行目标检测与识别技术在不同场景中的应用还存在一定的难度和研究空间。传统的Logo检测与识别技术的研究大多以文档中的单一Logo为研究基础,其设计的背景较为简单,Logo种类单一。传统的Logo检测识别与识别算法大多采用“金字塔”式滑动窗口的机制和简单机器学习算法相结合的方式进行相关研究,其大体思想是通过可变大小的滑动窗口逐步遍历输入图像中的每个区域,然后对该区域的图像进行不变特征提取,最后用Adaboost、SVM(SupportVectorMachine)等分类器对提取特征进行分类。现阶段随着R-CNN算法思想的提出,本文研究出了一种基于区域卷积神经网络的Logo检测与识别算法。
技术实现思路
本专利技术的目的在于:解决了传统Logo检测与识别技术以单一Logo和简单背景为研究基础,难以应用于复杂背景的Logo检测与识别的问题,提供了基于区域卷积神经网络模型中的区域卷积神经网络,实现复杂背景下多种Logo的检测与识别的一种基于区域卷积神经网络模型的品牌Logo检测与识别方法。本专利技术采用的技术方案如下:一种基于区域卷积神经网络模型的品牌Logo检测与识别方法,方法步骤如下:步骤1、进行原始数据集扩充,得到规模达到进行区域卷积神经网络模型训练要求的扩充的数据集;步骤2、利用扩充后的数据集对区域卷积神经网络模型进行训练;步骤3、基于区域卷积神经网络对输入图像进行Logo检测与识别。进一步,所述步骤1具体为:步骤11、利用网络爬虫技术和手工标注相结合的方式进行品牌Logo原始数据集的构建;步骤12、获取原始数据集中所包含的所有透明背景格式的Logo图像;步骤13、获取不含原始数据集中的Logo的图像,并归一化处理图像至指定像素;步骤14、将步骤12获取的原始数据集中的每种Logo进行仿射变换,然后和步骤13中得到的图像进行合成,合成得到的图像并入原始数据集,得到扩充的数据集。进一步,所述步骤2具体为:步骤21、利用选择性搜索算法对得到的扩充的数据集中的每张图像进行候选区域获取;步骤22、计算步骤21获取的候选区域坐标与Logo区域真正的区域坐标的IoU值,进行候选区域样本分类,记IoU>0.5的区域为正样本,其余的区域为负样本;步骤23、利用步骤22得到的正负样本对区域卷积神经网络模型进行训练,模型中Softmax分类器的输出维度为Logo种类数加1。进一步,所述步骤23中区域卷积神经网络模型选取CaffeNet和VGGG16两种网络模型。进一步,所述步骤3具体为:步骤31、利用选择性搜索算法获取输入图像所有的候选区域,将输入图像和获取的候选区域坐标作为区域卷积神经网络模型的输入;步骤32:根据目标Logo区域的特征,进行步骤31得到的候选区域的二次筛选,将长宽比或宽长比大于4的区域剔除;步骤33:将整个图像输入到区域卷积神经网络进行整个图像的特征值的计算和提取;步骤34:基于步骤32的图像候选区域和步骤33得到的图像的特征值,利用RoI池化层完成对图像候选区域到候选区域特征值的映射计算;步骤35:利用softmax分类器对候选区域特征值进行分类,得到logo分类,并输出候选区域的概率向量;步骤36:最后使用位置回归器进行目标Logo区域位置回归并进行目标Logo区域的提取。综上所述,由于采用了上述技术方案,本专利技术的有益效果是:1、本专利技术中,进行原始数据集扩充、区域卷积神经网络模型训练、基于区域卷积神经网络的Logo检测与识别,实现了复杂背景下多种Logo的检测与识别;2、本专利技术中,提出的利用图像合成技术进行数据集的扩充方案,可以非常有效的进行Logo检测与识别数据集的扩充;3、本专利技术中,采用的基于去与卷积神经网络的Logo检测与识别方法,与传统的Logo检测识别方法相比,其可以显著提升检测识别效果,同时与人工选取特征进行分类相比,基于区域卷积神经网络模型的检测识别算法具有更高的迁移性;4、本专利技术中,区域卷积神经网络模型选取CaffeNet和VGGG16两种网络模型,CaffeNet模型的识别mAP值为69.6,VGG16模型的识别mAP值为70.6,识别精确度高;5、本专利技术中,利用RoI池化层完成对图像候选区域到特征值候选区域的映射计算,与对每个候选区域进行卷积操作相比,RoI池化层可以极大程度减少卷积操作运算量;6、本专利技术中,利用位置回归器进行目标Logo区域位置回归可以提升检测识别算法效果3个百分点。附图说明图1为本专利技术方法流程图;图2为本专利技术步骤3方法流程图;图3为本专利技术步骤3方法流程图;图4为本专利技术实施例透明背景Logo效果图;图5为本专利技术实施例步骤14中图像合成效果图;图6为本专利技术实施例识别与检测效果图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。一种基于区域卷积神经网络模型的品牌Logo检测与识别方法,方法步骤如下:步骤1、进行原始数据集扩充,得到规模达到进行区域卷积神经网络模型训练要求的扩充的数据集,具体为:步骤11、利用网络爬虫技术和手工标注相结合的方式进行品牌Logo原始数据集的构建;步骤12、获取原始数据集中所包含的所有透明背景格式的Logo图像,采用透明背景的Logo进行图像合成,其可以保证合成图像中Logo区域背景的多样化,从而更接近真实情况:步骤13、获取不含原始数据集中的Logo的图像,并归一化处理图像至指定像素,这里长宽不大于800像素;步骤14、将步骤12获取的原始数据集中的每种Logo进行仿射变换,可进行几百至几万次缩放、旋转、平移操作的仿射变换,然后和步骤13中得到的图像进行合成,合成得到的图像并入原始数据集,得到扩充的数据集,进行Logo的仿射变换的目的是尽可能模拟自然拍摄图片中Logo的形变情况。步骤2、利用扩充后的数据集对区域卷积神经网络模型进行训练,具体为:步骤21、利用选择性搜索算法对得到的扩充的数据集中的每张图像进行候选区域获取;步骤22、计算步骤21获取的候选区域坐标与Logo区域真正的区域坐标的IoU值,进行候选区域样本分类,记IoU>0.5的区域为正样本,其余的区域为负样本;步骤23、利用步骤22得到的正负样本对区域卷积神经网络模型进行训练,模型中Softmax分类器的输出维度为Logo种类数加1,即把背景区域作为一种Logo进行分类处理,此处可以选取CaffeNet和VGGG16两种网络模型进行训练。步骤3、基于区域卷积神经网络进行Logo检测与本文档来自技高网...

【技术保护点】
1.一种基于区域卷积神经网络的品牌Logo检测与识别方法,其特征在于:方法步骤如下:步骤1、进行原始数据集扩充,得到规模达到进行区域卷积神经网络模型训练要求的扩充的数据集;步骤2、利用扩充后的数据集对区域卷积神经网络模型进行训练;步骤3、基于区域卷积神经网络模型对输入图像进行Logo检测与识别。

【技术特征摘要】
1.一种基于区域卷积神经网络的品牌Logo检测与识别方法,其特征在于:方法步骤如下:步骤1、进行原始数据集扩充,得到规模达到进行区域卷积神经网络模型训练要求的扩充的数据集;步骤2、利用扩充后的数据集对区域卷积神经网络模型进行训练;步骤3、基于区域卷积神经网络模型对输入图像进行Logo检测与识别。2.根据权利要求1所述的一种基于区域卷积神经网络模型的品牌Logo检测与识别方法,其特征在于:所述步骤1具体为:步骤11、利用网络爬虫技术和手工标注相结合的方式进行品牌Logo原始数据集的构建;步骤12、获取原始数据集中所包含的所有透明背景格式的Logo图像;步骤13、获取不含原始数据集中的Logo的图像,并归一化处理图像至指定像素;步骤14、将步骤12获取的原始数据集中的每种Logo进行仿射变换,然后和步骤13中得到的图像进行合成,合成得到的图像并入原始数据集,得到扩充的数据集。3.根据权利要求1所述的一种基于区域卷积神经网络模型的品牌Logo检测与识别方法,其特征在于:所述步骤2具体为:步骤21、利用选择性搜索算法对得到的扩充的数据集中的每张图像进行候选区域获取;步骤22、计算步骤21获取的候选区域坐标与Logo区域真正的区域坐标的IoU值,进行候选区域样本分类,记Io...

【专利技术属性】
技术研发人员:屈鸿刘永胜张书洲季江舟贺强张亦洲郝雪洁
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1