【技术实现步骤摘要】
一种电商产品图片目录构建方法
[0001]本专利技术涉及计算机视觉、度量学习以及聚类
,特别是涉及一种电商产品图片目录构建方法。
技术介绍
[0002]传统电商商品目录是基于行业文本的方式构建,同一目录下商品外观差异性大,导致用户通过目录浏览、搜索商品时,面对庞大的商品图片,浏览的商品差异性较强,无法找到相似的产品,给用户搜索浏览体验带来极大的不便。由此寻找一种便捷高效的相似商品展示、检索方法。从而基于商品外观相似性构建对应的图片目录体系,满足用户需要。构建基于图片外观相似性的目录体系,涉及到两个难点,一则是商品图片的特征表示方法,二是对同一相似性目录商品图片的划分方法。
[0003]图片特征的表示,要求外观相似商品图片的特征向量相似度尽量高,外观不相似的图片相似度尽可能低。这个目标主要难点在于,如何进行图片特征的表示。业界常用表征学习或度量学习进行图片特征向量化。表征学习以分类任务为驱动,网络的作用是将图片提取特征后输出图片所属类别;度量学习以学习图片相似度为驱动,网络的作用是学习特征提取方法使得相似图片在特 ...
【技术保护点】
【技术特征摘要】
1.一种电商产品图片目录构建方法,其特征在于,包括以下步骤:步骤1:设计一种基于深度卷积神经网络模型的图片特征编码器,引用构建的训练数据集,所述训练数据集的训练方法采用度量学习方法,利用编码器提取训练数据集中的图片特征,所述图片特征编码器采用残差结构,在原始主干网络基础上,接一个全连接层,输出256维向量作为图片特征;步骤2:构建图片特征聚类模块,使用k
‑
means聚类算法进行聚类;使用余弦相似度作为图片特征的距离度量函数,初始的聚类数量值为电商三级目录产品数;同时聚类前,对步骤1输出的256维图片特征进行L2正则化使其模为1,使用聚类结果更新样本标签;步骤3:构建聚类拆分融合模块,遍历步骤2得到的聚类结果,对结果进行拆分与融合,遍历结束后,得到新的聚类结果,同时更新步骤2的聚类数量值与步骤1中的样本标签;步骤4:构建电商商品图片外观目录,待到步骤3无可拆分与融合的聚类结果时,方案迭代结束;每个聚类结果作为一个电商商品图片目录,簇心向量作为该目录的锚点向量,判断增量图片的归属,同簇样本作为该目录的图片,所述步骤1的图片特征编码器用于提取增量图片外观特征,计算提取到的特征和目录锚点向量的余弦相似度,归属到相似度最大的目录中,相似度计算公式为:其中,A,B分别为图片提取的特征向量与目录锚点向量。2.根据权利要求1所述的一种电商产品图片目录构建方法,其特征在于,所述编码器为一种图片特征编码器,步骤1具体包括:步骤1.1:图片特征编码器的选取与修改,选取ResNet101作为图片特征编码器的backbone,所述ResNet101采用5次下采样,用以将图片最终汇聚成2048*7*7的featuremap,利用avg_pooling得到2048维特征,在原始的ResNet101网络结构基础上,增加一个全连接层,输出256维图片特征向量,同时将第一个stage使用conv下采样,将stride设置为2,采用pre_padding的方式;步骤1.2:度量学习编码器的损失函数设置,所述损失函数采用Triplet loss损失:输入由三元组...
【专利技术属性】
技术研发人员:吕晨,肖万松,房鹏展,
申请(专利权)人:焦点科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。