基于计算机视觉鲁棒性目标检测的两阶段商标检测法制造技术

技术编号:30651465 阅读:109 留言:0更新日期:2021-11-04 01:12
本发明专利技术公开了一种基于计算机视觉鲁棒性目标检测的两阶段商标检测法,其特征在于,包括训练流程和测试流程。这种方法在数据增强和在线困难样本挖掘的作用下,能有效地处理数据各类干扰以及数据样本分布不均匀的情况,从而使该方法能提高实际商标识别的鲁棒性和精度。使该方法能提高实际商标识别的鲁棒性和精度。使该方法能提高实际商标识别的鲁棒性和精度。

【技术实现步骤摘要】
基于计算机视觉鲁棒性目标检测的两阶段商标检测法


[0001]本专利技术涉及信息
中的计算机视觉和模式识别技术,具体是一种基于计算机视觉鲁棒性目标检测的两阶段商标检测法。

技术介绍

[0002]电商领域已经涉及到人们生活的方方面面,为了方便用户的购物时对某产品下的商品进行正确的选择,避免假冒伪劣品牌。需要在不同产品的情况下识别商品的商标品牌,但是人工肉眼的筛查和选择非常费时费力。除此之外,需要对多个商标品牌有认知且不能出错,这样的工作交由人工处理不太现实。同时随着应用需求增长,互联网行业下“网红”品牌和新商业品牌的扩增。用户需要在第一时间知道购买商品的所属信息。因此,将商品商标识别带入智能化是一个高频需求,基于平台自身来调用摄像头扫描接口来对不同的商品商标图片进行有效的识别是非常方便可靠的途径。尽管不少专家学者在目标检测算法方面做出了很多研究和贡献,相关领域也取得了长足的进步。但是在实际应用实现的工业化的道路上还存在很多的因素挑战;如现实中存在干扰物,光照以及遮挡问题。同时,数据分布不均与,得到的图片数据收到拉升收缩以及RGB干扰等因素。目本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于计算机视觉鲁棒性目标检测的两阶段商标检测法,其特征在于,包括训练流程和测试流程,其中训练流程包括如下步骤:1

1)建立真实的商标数据集:对每张商标图片采用不同角度进行采集,练数据是被标注的,标注包括目标序号、目标的矩形框和目标的类别,对不同的图片和不同的商标类别有着不同的序号,同时给定商标的具体位置,练的数据分为训练集和测试集,其中,测试集的类别与训练集中的相同,测试的中的部分商标实例数据进行高斯模糊、图片拉伸缩放和RGB色域变化干扰;1

2)训练商标识别器:首先在多数的实际商品中定位并识别商标,同时对实例图片进行旋转、裁剪、高斯变换处理,两阶段检测器采用RPN结构根据前景背景分数预先生成12000个候选框,经过非极大值抑制算法NMS来选出2000个框,这2000个候选区域框是由选择区域池化层RoI Pooling层即region of interest pooling层得到的特征图,再通过候选框的回归来来预测目标的位置和类别,鲁棒性检测模型以Faster

rcnn为基准模型进行训练,鲁棒性训练样本从步骤1

1)中会根据一个相对路径来得到数据集图片和标注的存放位置,同时,训练过程中目标选择框的长宽以图片自身的长宽为参考系,训练时,训练时每次输入8个批次的图片,每训练一轮即一个epoch约75000张图片,将图片的长边缩放为1333个像素、短边缩放为800个像素,将处理好的图片输送到主干网的卷积网络中提取特征,再通过RPN网络来区分正复样本,由ROI池化层从给出的选择区域中找到选择区域对应的局部特征,最后输出目标的预测框和目标类别,其中目标边界框包括目标的坐标位置(x,y)、边界框的宽w和高h,同过这四个参数确定一个完整的边界框,再由预测值和真实值进行损失函数的计算,分类的损失函数为交叉熵,回归损失函数L
reg
的计算公式如公式(1)所下所示:其中公式(1)表示L
reg
的数学计算方法,计算整体回归框的损失函数计算如公式(2)所示:其中i是每个批次读入数据的索引,p
i
是模型分类是预测的概率框,在数据真实标签为正样本时是1,负样本时是0,t
i
表示回归分支的预测框,表示和正样本相关的真实标签边界框;1

3)商标检测模型的全方位训练:对于每张检测图片做数据增强的同时将每张检测图片调整成800*1333个像素相同尺寸,并且采用高亮和像素干扰方式训练原图片来应对测试集中出现的像素干扰以及图片模糊情况,将处理好的图片送入主干卷积的分类网络和多尺度特征提取网络,其中,网络结构定义为:首先采用的是深度为101的主干网卷积部分,第一部分主干网的卷积模块是大小为7*7且通道数为64,输出的特征图的大小为112*112,然后经过下采样,通过3*3的最大池化层将特征图变为54*54的大小,最后从主干网络中拿到四个不同尺度的输出C2—C5,以resnet101作为主干网,分别得到通道数为256、512、1024、2048,先用一个1*1的卷积将输出的特征通道数压缩到256,得到P2—P5再采用上采样,特征图的大小维度相同时,将深层特
征和浅层特征相加;第二部分卷积网络是多尺度特征网络结构,包括...

【专利技术属性】
技术研发人员:钟必能孙岩坤梁启花李先贤
申请(专利权)人:广西师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1