一种基于深度学习的服装多模态融合搜索系统及搜索方法技术方案

技术编号：30895496 阅读：18 留言：0更新日期：2021-11-22 23:37

本公开提供了一种基于深度学习的服装多模态融合搜索系统及搜索方法，旨在解决用户上传的数据输入形式比较单一的问题。基于深度学习的服装多模态融合搜索系统，包括融合搜索识别模型，将接收的服装图像信息映射到特征空间，并生成图像特征向量；根据不同识别特性，对图像特征向量进行特征切分得到类别特征向量，根据类别特征向量输出图像特征；对图像特征向量进行解耦处理得到搜索用图像特征向量，将搜索用图像特征向量与数据库中的图像特征向量进行对比，获取相似的服装图像数据；多模态模型，将文本信息映射为图像特征向量，与数据库中的图像特征向量进行对比，获取相似的服装图像数据。用户上传的数据可以为图像数据，也可以为文本数据。以为文本数据。以为文本数据。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的服装多模态融合搜索系统及搜索方法

[0001]本公开属于服装搜索
，具体涉及一种基于深度学习的服装多模态融合搜索系统及搜索方法。

技术介绍

[0002]服装搜索是服装行业必不可少的一部分，其中，服装搜索又分为通过文字搜索服装图片和通过服装图片搜索相似服装图片。大部分业内人员将这两种搜索分别训练和部署，一个模型仅能服务一个功能，功能比较单一。文字搜索一般使用Bert等模型做语义匹配；图片搜索一般使用ResNet等深度模型利用triplet loss损失函数来搜索图片。
[0003]早期的多模态搜索系统，一般是通过文字信息搜索来对应文字搜索信息，通过搜索到的文字搜索信息对应到图片，文字和图像之间的映射关系完全通过人工设置，缺乏灵活性，并且文字和图像之间并没有特征上的映射，导致文字和图片的关系完全依赖于硬性设定。在搜索系统中，用户上传的数据输入形式比较单一，仅支持单独的文本类数据或单独的图像类数据，导致搜索功能较为单一。

技术实现思路

[0004]本公开提供了一种基于深度学习的服装多模态融合搜索系统及搜索方法，旨在解决现有的搜索系统中，用户上传的数据输入形式比较单一的问题。
[0005]为了解决上述技术问题，本公开所采用的技术方案为：
[0006]第一方面，本公开提供了一种基于深度学习的服装多模态融合搜索系统，包括：
[0007]融合搜索识别模型，用于将接收的服装图像信息映射到特征空间，并生成图像特征向量；根据不同识别特性，对图像特征向量进行特征切分得...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的服装多模态融合搜索系统，其特征在于，包括：融合搜索识别模型，用于将接收的服装图像信息映射到特征空间，并生成图像特征向量；根据不同识别特性，对图像特征向量进行特征切分得到类别特征向量，并根据类别特征向量输出图像特征；对图像特征向量进行解耦处理得到搜索用图像特征向量，将搜索用图像特征向量与数据库中的图像特征向量进行对比，获取相似的服装图像数据；多模态模型，用于将文本信息映射为图像特征向量，并与数据库中的图像特征向量进行对比，获取相似的服装图像数据。2.根据权利要求1所述的一种基于深度学习的服装多模态融合搜索系统，其特征在于，对图像特征向量进行特征切分得到外轮廓类别特征向量和内部类别特征向量；所述外轮廓类别特征向量包括品类、衣长和轮廓的特征信息；所述内部类别特征向量包括纹理和图案的特征信息。3.根据权利要求1所述的一种基于深度学习的服装多模态融合搜索系统，其特征在于，在对融合搜索识别模型训练数据获取时，融合搜索识别模型的训练数据包括识别用训练数据和搜索用训练数据；所述识别用训练数据的获取方法为：先将获取的服装图像通过检测模型获取位置信息，再将带有位置信息的服装图像通过进行类别标注得到识别用训练数据；所述搜索用训练数据的获取方法为：将服装图像数据库中的相似图像组成一组搜索用训练数据，从而获得若干组搜索用训练数据，且每组搜索用训练数据组间的服装图像数据不相似。4.根据权利要求3所述的一种基于深度学习的服装多模态融合搜索系统，其特征在于，在多模态模型训练数据获取时，所述多模态模型的同一条训练数据包括服装图像的服装图像信息以及同一服装图像的文本信息。5.根据权利要求4所述的一种基于深度学习的服装多模态融合搜索系统，其特征在于，所述多模态模型的训练包括：采用文本模型将文本信息映射到特征空间，并生成文本特征向量；采用融合搜索识别模型将...

【专利技术属性】
技术研发人员：郑泽宇，温苗苗，李鸽，何治，海滨，石磊，马锐，
申请(专利权)人：杭州知衣科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人