一种适应广泛零售场景下的香烟识别方法技术

技术编号:19635592 阅读:59 留言:0更新日期:2018-12-01 16:14
本发明专利技术公开了一种适应广泛零售场景下的香烟识别方法,该方法包括以下两个步骤:A.针对已有的各类香烟在固定场景下进行图像样本采集,并通过自动场景融合算法,实现对香烟样本图像完成实际零售场景的融合和数据增强;B.利用融合实际场景的数据,结合香烟特征,进行识别模型训练,获取香烟识别模型。本发明专利技术通过对实际场景图像的融合,可以快速便捷的增强香烟检测识别中的实际场景数据,提高了训练数据的规模和场景多样性,该方法相对于新场景中的采集获取数据进行训练,成本低廉、简便快捷、适应性强、识别精度高、效果明显,可节省大量的人力和财力成本开支。

A Cigarette Recognition Method for Wide Retail Scene

The invention discloses a cigarette recognition method adapted to a wide range of retail scenarios. The method comprises the following two steps: A. image sample acquisition for existing cigarettes in a fixed scenario, and the fusion and data enhancement of actual retail scenarios are realized through an automatic scene fusion algorithm; B. Combining the actual scene data with the characteristics of cigarettes, the recognition model is trained to obtain the cigarette recognition model. By fusing the actual scene images, the method can quickly and conveniently enhance the actual scene data in cigarette detection and recognition, and improve the scale and diversity of training data. Compared with the acquisition data in the new scene, the method has the advantages of low cost, simple and fast, strong adaptability and high recognition accuracy. It can save a lot of manpower and financial cost.

【技术实现步骤摘要】
一种适应广泛零售场景下的香烟识别方法
本专利技术涉及一种图像识别技术,具体地说,涉及一种适应广泛零售场景下的香烟识别方法。
技术介绍
图像识别是人工智能的一个重要领域。简单来说,图像识别就是利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。近几年,随着人工智能的发展和普及,尤其是深度学习技术的广泛研究和发展,图像识别技术也步入了一个新的阶段,图像识别的主要方法由以往的特征提取联合统计学习的两步化方法,逐渐向依赖以卷积特征提取为主的深度特征自主提取学习一体化方法转变。在香烟售卖过程中,各大烟草销售中心需要对各个零售点售卖的香烟数据以及售卖的对象人群进行统计和分析,通过反馈从而对香烟各个品种的生产控制和分发数量提供数据支持和指导。目前的香烟零售数据统计主要是在销售过程中,由销售人员使用扫码方式完成对香烟的数据统计,这一统计方法存在操作繁琐,容易遗漏扫描的缺点,并且难以建立香烟与购买香烟的顾客之间的联系,通过图像识别的方式不仅可以对出售过程中的香烟和顾客进行自动识别,从而简化销售人员的工作量,避免扫描遗漏的风险,而且可以有效的建立香烟和购买人群的数据关系,为后续的数据分析提供可靠的数据来源和基础。在实际的香烟图像识别中,会面临两个主要影响香烟识别精度的问题:一是各个零售点的环境和场景不尽相同,在识别模型结构相同的前提下,训练数据的规模和场景多样性,将对识别的精度和性能产生较大影响。二是部分香烟外观基本相同,只有局部区域存在显著差别,这样的相似香烟对图像整体识别的准确性存在影响。
技术实现思路
本专利技术正是为了解决上述技术问题而设计的一种适应广泛零售场景下的香烟识别方法。本专利技术解决其技术问题所采用的技术方案是:一种适应广泛零售场景下的香烟识别方法,该方法包括以下两个步骤:A.针对已有的各类香烟在固定场景下进行图像样本采集,并通过自动场景融合算法,实现对香烟样本图像完成实际零售场景的融合和数据增强;B.利用融合实际场景的数据,结合香烟特征,进行识别模型训练,获取香烟识别模型。所述的一种适应广泛零售场景下的香烟识别方法,其特征在于:步骤A的处理方法是:首先对需要识别的香烟品种在一个固定场景下进行样本图像采集,对采集的样本图像通过图像分割算法分割出需要的香烟图像,然后对香烟图像进行旋转变换、尺度变换,随机叠加噪声和亮度,完成香烟图像的多样性扩充并加以标注,然后将香烟的实际像素点融入进采集的实际零售场景中,并对不同场景的样本加以归类;其具体方法按如下步骤处理:a.在背景较为单一的场景中随机采集各类香烟品种图像,采用图像分割算法对各个品种的样本图像进行精准分割,获取香烟区域图像;分割算法采用区域分割联合边缘直线分割的方法,区域分割主要针对一些外形特征相对比较明显的香烟,边缘直线分割主要针对外形对比度与背景相近的香烟,区域分割的公式为:其中F(i,j)为当前图像坐标(i,j)处的像素值,Gmean为背景像素均值,Th为分割所需的阈值,若当前像素点与背景均值差分的一范数大于阈值Th,该像素点即为前景B(i,j)=1,否则B(i,j)=0;边缘直线分割主要依据香烟图像的边缘梯度变化,计算梯度幅值和方向,并采用区域生长的方式对梯度方向进行统计,找出直线外接矩形区域,从而进一步提取香烟的边缘直线,再依据这些边缘直线和香烟的矩形特性,分割出香烟图像;梯度计算公式如下:其中gx(i,j)为x方向的梯度,gy(i,j)为y方向的梯度,f(i,j)为图像坐标(i,j)处的像素值;梯度幅值计算公式如下:梯度方向统计计算公式如下:b.利用坐标变换和映射,对香烟图像进行角度变换,获取各个旋转角度的香烟姿态图像;假设原始香烟图像坐标为(i,j),角度变换后的坐标为(i',j'),旋转角度为θ,那么两个坐标满足以下映射关系:利用尺度变换算法,随机取不同的尺度系数λ(0.3~0.9)对香烟图像进行尺度变换,获取样本的多尺度变换特性;c.利用噪声增强系数的模拟噪声随机对样本图像加入噪声,实现样本的噪声多样性扩充;噪声函数公式如下:利用光照处理函数对样本图像进行光照变化处理,模拟不同场景下的光照变化情况,实现样本图像的光照多样性;光照增强公式如下:其中I(i,j)为输入RGB图像中的一个彩色像素点,minI(i,j)是为坐标(i,j)处像素RGB三通道中的最小值,α为需要变化大小的系数,N为图像每一行的像素个数,M为图像上每一列的像素个数,像素点的每个通道都减去三通道中的最小值;d.获取实际零售场景图象,依据图像大小和香烟图像的尺度,对场景图像依进行区域划分,并对各个子区域进行编号排列;在划分编号的子区域中,依据划分的子区域数量,每次采用随机数选择其中一个子区域作为香烟图像融入的区域范围;将实际的香烟图像像素点逐一融入实际场景中,逐一替换原有的图像像素值。所述一种适应广泛零售场景下的香烟识别方法,其步骤B的处理方法是:首先对生成的样本数据进行分类标记,生成训练数据,加入设计和优化的网络模型进行迭代训练,不断降低损失函数代价,优化模型权值系数,并测试模型精度,最终获得香烟识别模型;其具体方法按如下步骤处理:e.对增强后的训练样本数据进行分类标定,同一品种香烟的香烟图像标号一致,并与其他香烟图像标号不同;实际训练时加以一定比例再进行随机裁剪扩充;f.建立主网络提取香烟图像全局特征,用于从场景中快速准确检测识别香烟;主网络采用深度可分离方法对网络参数进行压缩的同时,先对卷积通道进行扩张,再分层提取特征;g.建立增强对难分样本分类间隔的损失函数,提升识别网络的决策能力;如下所示,pt表示损失,对再检测损失函数中扩展一个调制系数γ,用于度量难分类和易分类样本对总的损失的影响,控制难易分类样本的权重;FL(pt)=-(1-pt)γlog(pt)如下公式所示,对传统的分类损失函数,通过余弦变换和正则化等算法,将分类损失转化到角度空间,直接在角度空间最大化分类界限,增大类间距;其中,n为训练样本的数量,s为L2范数,m为用以增大类间距离的偏移项,yi为训练样本类别参数,θyi为特征向量和模型权重向量之间的夹角,cosθyi为归一化后的特征向量,其长度为n;h.针对局部特征存在区别的相似烟,对香烟图像进行子区域划分,利用子网络提取香烟图像局部深层次特征,用于增强相似香烟的分类精度;子网络通过采用深度可分离方法的通道压缩对子网络进行优化,在保证特征描述能力的同时,减少模型冗余系数;i.利用误差反向传播和随机梯度下降的优化方法,对模型参数进行优化;j.通过多次迭代计算,损失函数下降并收敛,获得对香烟识别性能进行优化的识别模型。所述一种适应广泛零售场景下的香烟识别方法,其第f步中建立主网络提取香烟图像全局特征的方法是:将香烟整体区域图像归一化到固定尺寸,采用基本的卷积单元对图像进行初步卷积,获取一定数量的特征图像,对获取的卷积特征图像先采用1*1单卷积的通道扩张模块expand对卷积通道进行扩张,然后采用基于3*3标准卷积的深度可分离模块dwise提取卷积特征,采用基于1*1单卷积的线性激活模块linear取代非线性激活,最后将原始输入的特征信息与经过扩张分离卷积后的信息进行融合得到Block,并依此进行迭代,最后依赖全连接层Fc获取一维特征向量本文档来自技高网...

【技术保护点】
1.一种适应广泛零售场景下的香烟识别方法,其特征在于:该方法包括以下两个步骤:A.针对已有的各类香烟在固定场景下进行图像样本采集,并通过自动场景融合算法,实现对香烟样本图像完成实际零售场景的融合和数据增强;B.利用融合实际场景的数据,结合香烟特征,进行识别模型训练,获取香烟识别模型。

【技术特征摘要】
1.一种适应广泛零售场景下的香烟识别方法,其特征在于:该方法包括以下两个步骤:A.针对已有的各类香烟在固定场景下进行图像样本采集,并通过自动场景融合算法,实现对香烟样本图像完成实际零售场景的融合和数据增强;B.利用融合实际场景的数据,结合香烟特征,进行识别模型训练,获取香烟识别模型。2.根据权利要求1所述的一种适应广泛零售场景下的香烟识别方法,其特征在于:步骤A的处理方法是:首先对需要识别的香烟品种在一个固定场景下进行样本图像采集,对采集的样本图像通过图像分割算法分割出需要的香烟图像,然后对香烟图像进行旋转变换、尺度变换,随机叠加噪声和亮度,完成香烟图像的多样性扩充并加以标注,然后将香烟的实际像素点融入进采集的实际零售场景中,并对不同场景的样本加以归类;其具体方法按如下步骤处理:a.在背景较为单一的场景中随机采集各类香烟品种图像,采用图像分割算法对各个品种的样本图像进行精准分割,获取香烟区域图像;分割算法采用区域分割联合边缘直线分割的方法,区域分割主要针对一些外形特征相对比较明显的香烟,边缘直线分割主要针对外形对比度与背景相近的香烟,区域分割的公式为:其中F(i,j)为当前图像坐标(i,j)处的像素值,Gmean为背景像素均值,Th为分割所需的阈值,若当前像素点与背景均值差分的一范数大于阈值Th,该像素点即为前景B(i,j)=1,否则B(i,j)=0;边缘直线分割主要依据香烟图像的边缘梯度变化,计算梯度幅值和方向,并采用区域生长的方式对梯度方向进行统计,找出直线外接矩形区域,从而进一步提取香烟的边缘直线,再依据这些边缘直线和香烟的矩形特性,分割出香烟图像;梯度计算公式如下:其中gx(i,j)为x方向的梯度,gy(i,j)为y方向的梯度,f(i,j)为图像坐标(i,j)处的像素值;梯度幅值计算公式如下:梯度方向统计计算公式如下:b.利用坐标变换和映射,对香烟图像进行角度变换,获取各个旋转角度的香烟姿态图像;假设原始香烟图像坐标为(i,j),角度变换后的坐标为(i',j'),旋转角度为θ,那么两个坐标满足以下映射关系:利用尺度变换算法,随机取不同的尺度系数λ(0.3~0.9)对香烟图像进行尺度变换,获取样本的多尺度变换特性;c.利用噪声增强系数的模拟噪声随机对样本图像加入噪声,实现样本的噪声多样性扩充;噪声函数公式如下:利用光照处理函数对样本图像进行光照变化处理,模拟不同场景下的光照变化情况,实现样本图像的光照多样性;光照增强公式如下:其中I(i,j)为输入RGB图像中的一个彩色像素点,minI(i,j)是为坐标(i,j)处像素RGB三通道中的最小值,α为需要变化大小的系数,N为图像每一行的像素个数,M为图像上每一列的像素个数,像素点的每个通道都减去三通道中的最小值;d.获取实际零售场景图象,依据图像大小和香烟图像的尺度,对场景图像依进行区域划分,并对各个子区域进行编号排列;在划分编号的子区域中,依据划分的子区域数量,每次采用随机数选择其中一个子区域作为香烟图像融入的区域范围;将实际的香烟图像...

【专利技术属性】
技术研发人员:李继凯
申请(专利权)人:北京优创新港科技股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1