商品智能打标方法、系统、终端设备及可读存储介质技术方案

技术编号:35742711 阅读:23 留言:0更新日期:2022-11-26 18:46
本申请公开了一种商品智能打标方法,包括从真实快销的场景图片中随机选取M张场景图片,对其中的待学习商品进行标记,在标记后从原场景图像中分割出来,得到n张商品图像作为训练集;其中,n<<m,m为M张场景图片中实际待学习商品图像总数;将M张场景图片中未被标记的商品分割出来生成未标注集;利用训练集和未标注集训练改进的Mixmatch模型直至模型收敛,生成目标分类器;将未标注集输入至目标分类器,将分类结果与映射表进行匹配,生成商品打标结果;映射表包含未标注集所在原图的文件名和坐标信息。本申请只需要标注少量的样本就能提升商品标注结果的准确性,加快迭代周期,标记过程更加智能化、耗时少且过程更简单。耗时少且过程更简单。耗时少且过程更简单。

【技术实现步骤摘要】
商品智能打标方法、系统、终端设备及可读存储介质


[0001]本申请涉及计算机软件及快销
,尤其涉及一种商品智能打标方法、系统、终端设备及可读存储介质。

技术介绍

[0002]随着人工智能在快销领域的不断发展,目标检测在商品识别中大规模的运用已成为趋势。它不仅能够提高业务员巡店的工作效率,还能帮助企业快速了解终端门店的铺货销售详情。
[0003]然而,在实际应用中,建立一个精确的商品检测模型需要有大量的样本数据来训练,在训练模型前若采用传统的人工打标方式必然要花费大量的人力成本,且耗时长。也有采用机器学习辅助打标的方法,如迭代模型策略,即先用一批数据训练一个弱检测模型,通过弱检测模型自动标记一批数据,通过人工检查修改后,再训练出一个更强的模型,通过重复上述过程,直到识别性能满足要求。但这种方式下的弱检测模型的分类能力往往较差,一方面需要人工修正的工作量大,迭代周期长;另一方面,这种方式容易受到漏标样本的影响,导致最终训练出的模型识别效果并不理想。

技术实现思路

[0004]本申请的目的在于提供一种商品智能打标方法、系统、终端设备及可读存储介质,以解决现有的商品打标方法中存在的工作量大、耗时长、智能化程度低且容易影响商品检测模型识别精确度的问题。
[0005]为实现上述目的,本申请提供一种商品智能打标方法,包括:
[0006]从真实快销的场景图片中随机选取M张场景图片,对其中的待学习商品进行标记,并在标记后从原场景图像中分割出来,得到n张商品图像以作为训练集;其中,n<<m,m为M张场景图片中实际待学习商品图像总数;
[0007]将M张场景图片中未被标记的商品分割出来,生成未标注集;
[0008]利用所述训练集和所述未标注集训练改进的Mixmatch模型,直至模型收敛,生成目标分类器;
[0009]将所述未标注集输入至所述目标分类器,将分类结果与映射表进行匹配,生成商品打标结果;所述映射表包含未标注集所在原图的文件名和坐标信息。
[0010]进一步地,所述将分类结果与映射表进行匹配,生成打标结果,包括:
[0011]若未标注集中图片分类结果的置信度大于第一预设值,则将当前图片预测为对应的商品类别,生成识别结果;
[0012]根据所述识别结果,按照识别顺序与所述映射表中的坐标信息进行匹配,并按照文件名进行信息聚合,生成对应场景图片的商品打标结果。
[0013]进一步地,所述训练改进的Mixmatch模型,包括:
[0014]粗分类器训练阶段,用于在竞品数量小于第二预设值时,训练得到用于分类未标
记商品的粗分类器;
[0015]粗分类器优化阶段,用于人工对于粗分类器的数据进行随机刷选,若刷选结果中存在竞品被误识别为本品或本品被漏识别时,补充竞品数据或漏识别的本品数据至训练集,以对粗分类器优化训练。
[0016]进一步地,所述将M张场景图片中未被标记的商品分割出来,包括:
[0017]利用商品检测模型将M张场景图片中未被标记的商品分割出来,所述商品检测模型根据cascadeRcnn算法训练得到。
[0018]进一步地,在所述利用商品检测模型将M张场景图片中未被标记的商品分割出来之后,还包括:
[0019]获取商品检测模型输出的检测结果,计算所述检测结果与人工标记目标的交并比;其中,检测结果为输入商品的坐标信息,人工标记目标为人工标记商品的坐标信息;
[0020]若所述交并比大于0.5,则将对应的场景图片丢弃;
[0021]若所述交并比小于或等于0.5,则将对应的场景图片中的商品图像切割出来,作为未标注集。
[0022]进一步地,在所述利用所述训练集和所述未标注集训练改进的Mixmatch模型之前,还包括获取改进的Mixmatch模型,包括:
[0023]执行负样本过滤策略,包括:
[0024]将未标注集输入目标分类器进行预测,计算正样本和负样本的置信度;
[0025]针对置信度小于第二预设值的正样本,利用以下公式提高负样本的置信值,并降低正样本的置信值:
[0026][0027]其中,
[0028]f(t)=min(0.4,0.1+(1

e

3*t/150
)/2);
[0029]式中,P为Mixmatch模型多个分支预测值的平均,P
pos
代表正样本模型预测值,P
neg
代表负样本模型预测值,t表示迭代轮次,f(t)随着迭代轮次不断增加。
[0030]进一步地,所述获取改进的Mixmatch模型,还包括执行未标注集欠采样策略,包括:
[0031]利用训练集训练得到Resnet18分类器模型,利用Resnet18分类器模型对所述未标注集进行分类,输出每张场景图片的模型预测结果;
[0032]根据所述模型预测结果,取TOP3进行求和,得到每张场景图片的得分:
[0033]score=sum(top3(P

pos
));
[0034]式中,P

pos
为Resnet18分类器模型输出中正样本类的概率;
[0035]对得分进行排序,将得分大于第二预设值的采样权重设为1,利用以下公式计算得分小于第二预设值的采样权重:
[0036]f(R)=(R/N
cls
*4)/(G

R);
[0037]式中,G为未标注集中的商品总数,N
cls
为要学习商品的类别数;
[0038]根据采样权重的大小,按照预设条件减少低采样权重对应的样本加入Mixmatch模
型的训练过程。
[0039]本申请还提供一种商品智能打标系统,包括:
[0040]训练集生成单元,用于从真实快销的场景图片中随机选取M张场景图片,对其中的待学习商品进行标记,并在标记后从原场景图像中分割出来,得到n张商品图像以作为训练集;其中,n<<m,m为M张场景图片中实际待学习商品图像总数;
[0041]未标注集生成单元,用于将M张场景图片中未被标记的商品分割出来,生成未标注集;
[0042]训练单元,用于利用所述训练集和所述未标注集训练改进的Mixmatch模型,直至模型收敛,生成目标分类器;
[0043]打标结果生成单元,用于将所述未标注集输入至所述目标分类器,将分类结果与映射表进行匹配,生成商品打标结果;所述映射表包含未标注集所在原图的文件名和坐标信息。
[0044]本申请还提供一种终端设备,包括:
[0045]一个或多个处理器;
[0046]存储器,与所述处理器耦接,用于存储一个或多个程序;
[0047]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上任一项所述的商品智能打标方法。
[0048]本申请还提供一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种商品智能打标方法,其特征在于,包括:从真实快销的场景图片中随机选取M张场景图片,对其中的待学习商品进行标记,并在标记后从原场景图像中分割出来,得到n张商品图像以作为训练集;其中,n<<m,m为M张场景图片中实际待学习商品图像总数;将M张场景图片中未被标记的商品分割出来,生成未标注集;利用所述训练集和所述未标注集训练改进的Mixmatch模型,直至模型收敛,生成目标分类器;将所述未标注集输入至所述目标分类器,将分类结果与映射表进行匹配,生成商品打标结果;所述映射表包含未标注集所在原图的文件名和坐标信息。2.根据权利要求1所述的商品智能打标方法,其特征在于,所述将分类结果与映射表进行匹配,生成打标结果,包括:若未标注集中图片分类结果的置信度大于第一预设值,则将当前图片预测为对应的商品类别,生成识别结果;根据所述识别结果,按照识别顺序与所述映射表中的坐标信息进行匹配,并按照文件名进行信息聚合,生成对应场景图片的商品打标结果。3.根据权利要求1所述的商品智能打标方法,其特征在于,所述训练改进的Mixmatch模型,包括:粗分类器训练阶段,用于在竞品数量小于第二预设值时,训练得到用于分类未标记商品的粗分类器;粗分类器优化阶段,用于人工对于粗分类器的数据进行随机刷选,若刷选结果中存在竞品被误识别为本品或本品被漏识别时,补充竞品数据或漏识别的本品数据至训练集,以对粗分类器优化训练。4.根据权利要求1所述的商品智能打标方法,其特征在于,所述将M张场景图片中未被标记的商品分割出来,包括:利用商品检测模型将M张场景图片中未被标记的商品分割出来,所述商品检测模型根据cascadeRcnn算法训练得到。5.根据权利要求4所述的商品智能打标方法,其特征在于,在所述利用商品检测模型将M张场景图片中未被标记的商品分割出来之后,还包括:获取商品检测模型输出的检测结果,计算所述检测结果与人工标记目标的交并比;其中,检测结果为输入商品的坐标信息,人工标记目标为人工标记商品的坐标信息;若所述交并比大于0.5,则将对应的场景图片丢弃;若所述交并比小于或等于0.5,则将对应的场景图片中的商品图像切割出来,作为未标注集。6.根据权利要求1所述的商品智能打标方法,其特征在于,在所述利用所述训练集和所述未标注集训练改进的Mixmatch模型之前,还包括获取改进的Mixmatch模型,包括:执行负样本过滤策略,包括:将未标注集输入目标分类器进行预测,计算正样本和负样本的置信度;针对置信度小于第二预设值的正样本,利用以下公式提高负样本的置信值,并降低正样本的置信值:
其中,f(t)=min(0.4,0.1+(1
...

【专利技术属性】
技术研发人员:李德圆丁明王杰许洁斌
申请(专利权)人:广州市玄武无线科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1