用于图像搜索的方法、系统以及存储指令的计算机可读介质技术方案

技术编号：41851973 阅读：24 留言：0更新日期：2024-06-27 18:28

公开的是用于图像搜索的方法、系统以及存储指令的计算机可读介质。该方法包括：经由客户端装置上的用户接口接收搜索查询，所述搜索查询包括描绘对象的输入图像；使用生成器生成标准化视角下所述对象的向量表示；基于所述标准化视角下所述对象的向量表示来识别描绘所述对象的其他图像的集合；以及响应于所述搜索查询，将描绘所述对象的所述其他图像中的至少一个返回至所述客户端装置。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术的实施方式一般性涉及搜索查询，并且更具体地，涉及用于细粒度图像搜索的对抗学习。

技术介绍

1、尽管已经对计算机执行的图像搜索进行了广泛的研究，但是其依然是具有挑战性的问题。特别地，在细粒度水平识别图像极其困难，在细粒度水平中，目标是找到与查询内容属于同一细粒度类别的对象(例如，识别汽车的型号和模型)。使用深度神经网络的许多算法已经实现了在细粒度分类上的最先进的性能，但是它们不可直接应用于细粒度图像搜索。当前的细粒度分类系统操作包含固定数量的类别的封闭的数据集，并且因此，没有正确地处理未见过的类别。尽管分类器可以被重新训练以适应新的类别，但是频繁的重新训练由于新数据积累而变得极其昂贵。相比之下，设计的细粒度图像搜索应当发现不属于训练集里的部分的未见过类别。

2、除了新出现的类别之外，对象的视角和姿态变化使得找到正确的细粒度类别更加困难。解决姿态变化的经典方法依赖于匹配局部特征点、改善单应性、以及推断明确的几何变换，但是它们在计算上是昂贵的。基于深度神经网络的最新工作引入了专用模块来学习具体的几何变换以用于语义对应，然...

【技术保护点】

1.一种用于图像搜索的方法，包括：

2.根据权利要求1所述的方法，其中，所述用户接口使所述客户端装置的用户能够输入所述输入图像以执行所述图像搜索。

3.根据权利要求2所述的方法，其中，所述输入图像包括所述对象在任何姿态或视角中的图像。

4.根据权利要求1所述的方法，其中，识别描绘所述对象的所述其他图像的集合包括：

5.根据权利要求4所述的方法，其中，所述其他图像的集合包括由所述生成器生成的图像。

6.一种系统，包括：

7.根据权利要求6所述的系统，其中，所述用户接口使所述客户端装置的用户能够输入所述输入图像以执行所述...

【技术特征摘要】

1.一种用于图像搜索的方法，包括：

2.根据权利要求1所述的方法，其中，所述用户接口使所述客户端装置的用户能够输入所述输入图像以执行所述图像搜索。

3.根据权利要求2所述的方法，其中，所述输入图像包括所述对象在任何姿态或视角中的图像。

4.根据权利要求1所述的方法，其中，识别描绘所述对象的所述其他图像的集合包括：

5.根据权利要求4所述的方法，其中，所述其他图像的集合包括由所述生成器生成的图像。

6.一种系统，包括：

7.根据权利要求6所述的系统，其中，所述用户接口使所述客户端装置的用户能够输入所述输入图像以执行所述图像搜索。

8.根据权利要求7所述的系统，其中，所述输入图像包括所述对象在任何姿态或视角中...

【专利技术属性】
技术研发人员：凯文·林，杨帆，王乔松，鲁宾逊·皮拉穆图，
申请(专利权)人：电子湾有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人