基于多层分类识别模型的商品图片相似度匹配搜索方法和系统技术方案

技术编号:33758395 阅读:15 留言:0更新日期:2022-06-12 14:07
本发明专利技术公开一种基于多层分类识别模型的商品图片相似度匹配搜索方法和系统。主要的方法和系统包括:选取商品图片数据集,及样本处理;构建分类识别模型和特征提取模型的学习网络;根据层次分类的样本,训练网络模型;迭代训练及保存模型;选取分类识别模型,进行不同层次的系统集成;图片特征提取;进行特征向量相似度计算;由计算值判定相似度并输出;商品图片多层分类识别模块、分类商品图片数据存储模块、商品图片相似度匹配搜索模块构成系统的三部分。本发明专利技术通过深度学习网络模型进行多层分类识别和特征向量提取相结合,将商品图片数据集进行分类,让相近商品图片得到归类,使商品图片相似度匹配取得快速搜索,及提高商品图片搜索的准确率。搜索的准确率。搜索的准确率。

【技术实现步骤摘要】
基于多层分类识别模型的商品图片相似度匹配搜索方法和系统


[0001]本专利技术涉及深度学习的神经网络
、图片识别模型神经网络的设计与训练,及向量余弦相似度计算等技术的系统集成处理方法。

技术介绍

[0002]随着互联网交易平台信息的快速发展和相关技术的日新月异,网络应用及图片信息处理技术途径日益多样化、复杂化。特别是互联网的商品图片数量、种类越来越繁多,采用单一对商品图片进行识别分类处理方法已经不能满足速度、准确率的要求。目前大部分采用对图片的相似搜索处理还是基于图像哈希计算(如:Minhash、LSH、phash),或卷积神经网络等技术。这些普遍存在图片相似计算处理过程中的归类到桶的图片相似度差异较大,导致在数量庞大的图片库搜索时的特征相似计算量增大、且图片相似识别准确率不高。本专利技术采用不同层次分类模型的堆叠设计对大数量商品图片信息进行准确分类处理,及在分类后对应的商品图片数据集中进行再次的商品图片神经网络特征向量提取的相似度余弦值计算;通过两个深度学习网络技术分别处理不同任务的结合。使商品图片信息业务处理中的搜索准确率、查询速度等操作,得到很大的提高。所以提供一种基于多层分类识别模型的商品图片相似度匹配搜索方法和系统,应用人工智能的深度学习相关技术实现商品图片多层分类识别,及商品图片相似度匹配搜索方法,这就可以给大数量级别的商品图片库提供便捷有效的图片分析处理方法。

技术实现思路

[0003]本专利技术所提供的解决方案是针对基于多层分类识别模型的商品图片相似度匹配搜索方法和系统的构建,该专利技术采用以下技术方案:
[0004]一种基于多层分类识别模型的商品图片相似度匹配搜索方法,所述方法包括:
[0005]A1、选取相应数量商品图片数据集,并进行商品图片的样本处理;
[0006]A2、构建商品图片识别分类模型的深度学习神经网络和商品图片特征提取模型的深度学习神经网络;
[0007]A3、根据层次分类后的商品图片样本,训练不同层次分类识别模型和商品图片特征提取网络模型,并更新相应网络参数;
[0008]A4、重复A3步骤,迭代训练网络,并保存训练好的分类识别模型和特征提取网络模型;
[0009]A5、选取识别准确率高的商品分类识别模型,进行不同层次商品分类识别模型的系统集成;
[0010]A6、基于商品图片多层分类集成识别对应分类商品图片,进行商品图片特征提取网络模型的图片特征提取;
[0011]A7、将提取的商品图片特征向量进行相似度特征计算比较;
[0012]A8、相似度计算值在设定值域范围,判定为相似,并输出图片。
[0013]进一步地,步骤A1所述的采集选取商品图片数据集,及分析整理商品图片进行分类挑选训练样本,并进行对应层次分类标记。
[0014]进一步地,步骤A2所述的商品图片识别分类模型的深度学习神经网络,采用残差学习神经网络,网络中多个残差单元堆积结构的输出与输入之间引入快捷连接解决网络的梯度消失问题,实现更多层的残差单元堆积,网络设计中隐藏层包含多个卷积层、最大值池化、均值池化层等操作,网络使用不同大小的卷积核进行卷积操作,使得残差单元在输入特征基础上学习到新的特征,从而拥有更好的学习性能;商品图片特征提取模型的深度学习神经网络,采用多个卷积层、多个最大值池化操作构成的网络结构,网络结构中隐藏层的多个卷积层之后均进行池化层的操作。
[0015]进一步地,步骤A3所述的具体为不同层次分类网络识别模型训练利用残差神经网络的监督学习方式,通过层次分类标记的样本图片,对不同分层相应分类进行网络模型训练,并在训练过程中调试网络相关超参数。将挑选好分类标记的商品样本图片,用于对商品图片特征提取网络模型进行训练,并在训练过程中调试网络相关超参数,使训练模型趋于收敛。
[0016]进一步地,步骤A4所述的具体包括对网络训练过程的损失函数值,相关参数值进行分析,模型训练以相应指标值是否收敛为模型训练完成的参考标准,选取相关模型进行测试,并保存识别效果好的模型。
[0017]进一步地,步骤A5所述的具体包括选取通过验证测试的层次分类对应分类识别模型,进行模型集成,根据多层分类识别的设计原则,将分类识别模型从上至下结构对应上层分类识别模型的输出分类作为下层对应分类识别模型的输入,完成商品图片多层分类识别方法的模型集成。
[0018]进一步地,步骤A6所述的在指定分类的商品图片数据集内,将商品图片设置为相应尺寸的张量作为输入,通过商品图片特征提取网络模型进行商品图片特征向量的计算,计算输出为多维度的商品图片特征向量。
[0019]进一步地,步骤A7所述的是在计算指定分类商品图片数据集的多维度(如:512维)图片特征向量基础上,对搜索的商品图片的特征向量与商品图片数据集中商品图片的特征向量进行余弦相似度计算;余弦相似度用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小,余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似。
[0020]进一步地,步骤A8所述的具体根据商品图片特征向量的余弦相似度计算值在设置阀值的值域范围,则输出商品图片相似的结果。
[0021]本专利技术还公开了一种基于多层分类识别模型的商品图片相似度匹配搜索系统,由三部分组成:商品图片多层分类识别模块、分类商品图片数据存储模块、商品图片相似度匹配搜索模块;
[0022]所述商品图片多层分类识别模块包括图片预处理模块、多层分类识别模型集成模块等两个子模块;
[0023]所述图片预处理模块,用于输入商品图片的相关属性的预处理操作;
[0024]所述多层分类识别模型集成模块,通过不同层次分类识别模型堆叠集成,用于商品图片数据的多层次分类处理,完成商品图片分类;
[0025]所述分类商品图片数据存储模块,用于商品图片的分类存储及搜索查询处理,通过相关商品图片分类信息,搜索输出相应分类商品图片数据集;
[0026]所述商品图片相似度匹配搜索模块包括图片特征提取处理模块、图片特征向量计算模块、相似度阀值处理模块等三个子模块;
[0027]所述图片特征提取处理模块,用于提取图片的多维度特征向量,供图片特征向量相似度比较计算使用;该模块处理数量来自图片预处理模块或分类商品图片数据存储模块处理后的图片数据;
[0028]所述图片特征向量计算模块,用于比较图片多维度特征向量的计算,该模块与图片特征提取处理模块或分类商品图片数据存储模块连接,处理由图片特征提取处理模块和分类商品图片数据存储模块的输出数据;
[0029]所述相似度阀值处理模块,用于设置相似图片比较计算后的输出阀值的处理,该模块与图片特征向量计算模块连接,处理由图片特征向量计算模块的输出数据。
[0030]本专利技术采用不同层次分类网络模型的堆叠和深度网络特征向量提取的相似度计算集成设计,实现了能够为千万级别数量的商品图片库进行分类查询、商品图片相似度匹配搜索等处理,提高商品图片信息匹配搜索处理的查询速度和查询本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多层分类识别模型的商品图片相似度匹配搜索方法,其特征在于,所述方法包括:A1、选取相应数量商品图片数据集,并进行商品图片的样本处理;A2、构建商品图片识别分类模型的深度学习神经网络和商品图片特征提取模型的深度学习神经网络;A3、根据层次分类后的商品图片样本,训练不同层次分类识别模型和商品图片特征提取网络模型,并更新相应网络参数;A4、重复A3步骤,迭代训练网络,并保存训练好的分类识别模型和特征提取网络模型;A5、选取识别准确率高的商品分类识别模型,进行不同层次商品分类识别模型的系统集成;A6、基于商品图片多层分类集成识别对应分类商品图片,进行商品图片特征提取网络模型的图片特征提取;A7、将提取的商品图片特征向量进行相似度特征计算比较;A8、相似度计算值在设定值域范围,判定为相似,并输出图片。2.根据权利要求1所述的基于多层分类识别模型的商品图片相似度匹配搜索方法,其特征在于:所述步骤A1中,采集选取商品图片数据集,及分析整理商品图片进行分类挑选训练样本,并进行对应层次分类标记。3.根据权利要求1所述的基于多层分类识别模型的商品图片相似度匹配搜索方法,其特征在于:所述步骤A2中,商品图片识别分类模型的深度学习神经网络,采用残差学习神经网络,网络中多个残差单元堆积结构的输出与输入之间引入快捷连接解决网络的梯度消失问题,实现更多层的残差单元堆积,网络设计中隐藏层包含多个卷积层、最大值池化、均值池化层等操作,网络使用不同大小的卷积核进行卷积操作,使得残差单元在输入特征基础上学习到新的特征,从而拥有更好的学习性能;商品图片特征提取模型的深度学习神经网络,采用多个卷积层、多个最大值池化操作构成的网络结构,网络结构中隐藏层的多个卷积层之后均进行池化层的操作。4.根据权利要求1所述的基于多层分类识别模型的商品图片相似度匹配搜索方法,其特征在于:所述步骤A3中,不同层次分类网络识别模型训练利用残差神经网络的监督学习方式,通过层次分类标记的样本图片,对不同分层相应分类进行网络模型训练,并在训练过程中调试网络相关超参数;将挑选好分类标记的商品样本图片,用于对商品图片特征提取网络模型进行训练,并在训练过程中调试网络相关超参数,使训练模型趋于收敛。5.根据权利要求1所述的基于多层分类识别模型的商品图片相似度匹配搜索方法,其特征在于:所述步骤A4中,对网络训练过程的损失函数值,相关参数值进行分析,模型训练以相应指标值是否收敛为模型训练完成的参考标准,选取相关模型进行测试,并保存识别效果好的模型。6.根据权利要求1所述的基于多层分类识...

【专利技术属性】
技术研发人员:王志永郭建辉陈雅红
申请(专利权)人:中检美亚厦门科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1