当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于卷积神经网络的商标检测方法技术

技术编号:10487559 阅读:158 留言:0更新日期:2014-10-03 16:24
本发明专利技术公开了了一种基于卷积神经网络的商标检测方法。本发明专利技术首先收集多种类别的商标图片以及不包含商标的图片,并对包含商标的图片进行标注。然后初始化卷积神经网络,使用商标样本与非商标样本训练卷积神经网络。在测试图片过程中,首先使用目标区域选择方法选取测试图片中可能包含商标的候选窗口,并对候选窗口进行颜色空间转换和尺度缩放处理。然后将候选窗口输入到卷积神经网络中进行识别,并将识别为商标的候选窗口在测试图片中标示出来。本发明专利技术通过卷积神经网络将目标区域特征提取与识别相结合,避免特征设计带来的不确定性,并且对于旋转、平移、尺度变化有很好的不变性,基于分割的目标区域选择在提高检测速度的同时降低了误检率。

【技术实现步骤摘要】

本专利技术属于目标检测与识别领域,涉及从图像中检测特定目标尤其是商标的方法。
技术介绍
目前,随着电视、网络等大量信息媒体的迅猛发展,海量的广告信息充斥在人们的生活中,如何通过广告中包含的商标分析广告来源,对信息进行有效的筛选过滤,以保证广告的有效性以及消费者接受信息的数量,成为了一个值得关注的问题。 受尺度变换、视角变换、光照条件、遮挡、背景干扰等情况的影响,准确的检测和识别复杂场景中的商标是一项具有挑战性的任务。已有的多数目标检测与识别方法基于传统特征,在商标受角度变化、光照条件、轻微形变影响时,识别率有所下降,无法应用于日常生活。另外一方面,传统方法采用多尺度滑动窗口的方式遍历图片寻找目标,这种方式导致需要识别的窗口数量急剧增加,实时性比较差。 卷积神经网络(Convolut1nal Neural Networks, CNNs)作为深度神经网络的一种,是为识别二维形状而特别设计的一个多层感知器。这种网络结构对平移、比例缩放、倾斜或者共他形式的变形具有高度不变性,在目标分类、识别等领域取得了非常好的效果。
技术实现思路
本专利技术的目的在于提供。 为实现上述目的,本专利技术所述的基于卷积神经网络的商标检测方法包括如下步骤:I)建立包含多种商标图片和非商标图片的样本集,标注样本中商标所在的局部区域,并进行样本预处理。 2)使用商标所在区域以及不含商标的区域训练卷积神经网络,用于识别多种商标及非商标。 3)输入待检测的图片,对其进行目标区域选择,获取图片中可能包含商标的局部区域。 4)对步骤3)得到的可能包含商标的图片局部区域进行预处理,预处理后的结果作为卷积神经网络的输入,判定待检测图片中是否包含目标以及目标的位置。 所述的样本集共包含10类商标样本以及I类不包含任何商标的样本。其中包含商标的图片中商标部分均大于60*60像素。 所述样本图片标注的方法为,对于图片中包含商标的局部区域,标记可以包围该区域的矩形框,并记录该矩形框在样本图片中的相对位置。 所述样本预处理的方法为,将样本图片中包含商标的矩形区域作为正样本,从不包含任何商标的图片中随机选取局部区域作为负样本,不考虑样本的长宽比,统一缩放为大小为28*28的灰度图,由于各个商标类别所包含的初始样本个数不同,需要对其中样本较少的类别进行扩充。扩充样本的方法是将样本中包含商标的矩形区域进行多角度的旋转,为了避免旋转不规则角度后需要进行图片填充,从而引入噪声,使用的旋转角度为90。 ,180° 和 270。。 所述的卷积神经网络设置为7层,其中第I层为输入层,接受大小为28*28的灰度图像作为输入,第7层为输出层,共11个节点,分别代表10个商标类别和I个非商标类别;卷积神经网络的第2层与第4层为卷积层,分别通过多个大小为5*5的卷积核提取图片的不同特征,其中,第2层包含6个大小为24*24特征映射图,第4层包含12个大小为8*8的特征映射图;卷积神经网络的第3层与第5层为下采样层,将所连接前一层的2*2的邻域下采样为I个像素,采样的间隔为2,其中第3层包含6个12*12的特征映射图,第5层包含12个4*4的特征映射图;卷积神经网络的第6层为全连接层,与第5层公196个节点全连接。 所述的对于待检测的图片进行目标区域选择为,基于图像分割的方法,选择其中可能包含目标的少数区域输入卷积神经网络进行识别,从而避免基于滑动窗口的检测方法带来的时间开销以及对检测准确率的影响。 步骤4)中预处理的方法为,将区域转化为灰度图,不考虑区域的长宽比,将区域缩放至28*28。 本专利技术的有益效果如下:本专利技术方法是一种快速的基于卷积神经网络的商标检测方法,它基于卷积神经网络,直接使用二维图像作为输入,避免人为设计特征带来的不确定性,同时对于商标的旋转、平移、尺度变化有很好的不变性。本专利技术采用一种基于分割的目标区域选择,筛选出测试图片中可能包含商标的目标区域,大量减少了需要识别的区域,不仅极大的提高了检测速度,同时降低了基于卷积神经网络的商标检测的误检率。 与传统方法相比,本专利技术通过卷积神经网络将目标区域特征提取与识别相结合,这一方法能够避免人为设计特征带来的不确定性,同时对于旋转、平移、尺度变化有很好的不变性。在目标检测的过程中,采用了一种基于分割的目标区域选择方法,在提高检测速度的同时降低了误检率。 【附图说明】 图1是本专利技术基于卷积神经网络的商标检测方法的流程示意图;图2是本专利技术所述卷积神经网络结构示意图;图3是本专利技术在测试图片上的检测结果示意图。 【具体实施方式】 本专利技术提出了,该方法在已经标注的商标样本集上训练卷积神经网络。在测试的过程中,首先通过目标区域选择筛选测试图片的局部区域作为候选窗口,用已训练好的卷积神经网络进行识别。图1是本专利技术基于卷积神经网络的商标检测方法的流程图。如图1所示,本专利技术基于卷积神经网络的商标检测方法包括以下步骤:步骤1,建立包含多种商标图片和非商标图片的样本集,标注样本中商标所在的局部区域,并进行样本预处理。 本专利技术使用卷积神经网络进行商标识别,根据卷积神经网络的特征,需要收集大量的商标图片以保证网络的充分训练。因此,所构造的样本集应包含多种商标类别,每一类商标应包含不少于1000张的样本图片。 所收集的商标图片应保证分辨率高于100*100,图片中包含的对应商标应不小于60*60,同时图片中包含的商标应边界清晰,没有明显的遮挡。 对样本集中的图片进行标注,记录包围商标的矩形框的左上顶点坐标以及矩形框的长、宽等信息。本专利技术将样本集中标注的商标区域进行轻微的平移及多角度旋转,平移的步长不超过3个像素,旋转角度为90度的整数倍。通过上述方法将每一类商标的样本集扩充到8000个,并划分为训练集和测试集两部分,其中训练集包括7000个样本,测试集包括1000个样本。 本专利技术所述的方法用于检测图片中是否包含商标及商标的位置,因此所述卷积网络需要识别图片中的背景区域。本专利技术从不包含商标的图片中随机的选取8000个局部图片作为训练卷积神经网络的非商标样本,所述的随机选取包含随机选取背景图片的位置及尺寸。本专利技术共使用非商标样本8000个,其中7000个样本用于训练卷积神经网络,1000个样本用于测试。 将上述步骤得到的商标与非商标样本的图像由RGB三通道转变为单通道灰度图像。本专利技术所述的卷积神经网络输入为固定尺度的二维图像,因此,将提取的全部样本缩放至28*28像素。 步骤2,使用商标所在区域以及不含商标的区域训练卷积神经网络,用于识别多种商标及非商标。 本专利技术所述卷积神经网络的结构如图2所示,包括输入输出层在内共7层。卷积神经网络的输入为上述步骤所得的28*28的二维图像。图中第2层至第5层为交替出现的卷积层与下采样层。所述卷积层包括多个特征映射图,每个特征映射图通过一个大小为5*5的卷积滤波器提取输入的一种特征,每个特征映射图有多个神经元,通过卷积运算,可以增强原信号特征,并且降低噪音。所述下采样层利用图像局部相关的特性进行抽样,将所连接的上一卷积层大小为2*2的邻域中最大像素值作为下采样层对应像素的值,减少了数据处理量,同时保留了有用信息。所述第6层为全连接层,本文档来自技高网...

【技术保护点】
一种基于卷积神经网络的商标检测方法,其特征在于该方法包括如下步骤:1)建立包含多种商标图片和非商标图片的样本集,标注样本中商标所在的局部区域,并进行样本预处理;2)使用商标所在区域以及不含商标的区域训练卷积神经网络,用于识别多种商标及非商标;3)输入待检测的图片,对其进行目标区域选择,获取图片中可能包含商标的局部区域;4)对步骤3)得到的可能包含商标的图片局部区域进行预处理,预处理后的结果作为卷积神经网络的输入,判定待检测图片中是否包含目标以及目标的位置。

【技术特征摘要】
1.一种基于卷积神经网络的商标检测方法,其特征在于该方法包括如下步骤: 1)建立包含多种商标图片和非商标图片的样本集,标注样本中商标所在的局部区域,并进行样本预处理; 2)使用商标所在区域以及不含商标的区域训练卷积神经网络,用于识别多种商标及非商标; 3)输入待检测的图片,对其进行目标区域选择,获取图片中可能包含商标的局部区域; 4)对步骤3)得到的可能包含商标的图片局部区域进行预处理,预处理后的结果作为卷积神经网络的输入,判定待检测图片中是否包含目标以及目标的位置。2.根据权利要求1所述的一种基于卷积神经网络的商标检测方法,其特征在于:所述的样本集共包含10类商标样本以及I类不包含任何商标的样本;其中包含商标的图片中商标部分均大于60*60像素。3.根据权利要求1所述的一种基于卷积神经网络的商标检测方法,其特征在于:样本图片标注的方法为,对于图片中包含商标的局部区域,标记可以包围该区域的矩形框,并记录该矩形框在样本图片中的横坐标、纵坐标以及长和宽。4.根据权利要求1所述的一种基于卷积神经网络的商标检测方法,其特征在于:样本预处理的方法是将样本图片中包含商标的矩形区域作为正样本,从不包含任何商标的图片中随机选取局部区域作为负样本,不考虑样本的长宽比,统一缩放为大小为28*28的灰度图,由于各个商标类别所包含的初始样本个数不同,需要对其中样本较少的类别进行扩充。5.根据权利要求4所述的扩充样本较少的类别的方法,其特征在于:将样本中包含商标的矩形区域...

【专利技术属性】
技术研发人员:陈纯张瑞宋明黎阮莹周星辰卜佳俊
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1