用于细粒度图像搜索的对抗学习制造技术

技术编号：26896408 阅读：22 留言：0更新日期：2020-12-29 16:24

公开的是使用用于细粒度图像搜索的对抗学习的系统、方法、和计算机可读介质。图像搜索系统接收搜索查询，搜索查询包括描绘对象的输入图像。搜索系统使用生成器生成标准化视角下对象的向量表示。基于多个视角下已知对象的参考图像的集合以及从评估器接收的反馈数据训练了生成器，反馈数据指示生成器在生成标准化视角下已知对象的向量表示方面的性能。评估器包括生成反馈数据的判别器子模块、标准化器子模块和语义嵌入子模块。图像搜索系统基于对象的向量表示来识别描绘对象的其他图像的集合，以及响应于搜索查询返回其他图像中的至少一个。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于细粒度图像搜索的对抗学习优先权声明本申请要求2018年5月22日提交的美国申请序列号15/985,818的优先权的权益，其在此通过引用被全部并入。
本专利技术的实施方式一般性涉及搜索查询，并且更具体地，涉及用于细粒度图像搜索的对抗学习。
技术介绍
尽管已经对计算机执行的图像搜索进行了广泛的研究，但是其依然是具有挑战性的问题。特别地，在细粒度水平识别图像极其困难，在细粒度水平中，目标是找到与查询内容属于同一细粒度类别的对象(例如，识别汽车的型号和模型)。使用深度神经网络的许多算法已经实现了在细粒度分类上的最先进的性能，但是它们不可直接应用于细粒度图像搜索。当前的细粒度分类系统操作包含固定数量的类别的封闭的数据集，并且因此，没有正确地处理未见过的类别。尽管分类器可以被重新训练以适应新的类别，但是频繁的重新训练由于新数据积累而变得极其昂贵。相比之下，设计的细粒度图像搜索应当发现不属于训练集里的部分的未见过类别。除了新出现的类别之外，对象的视角和姿态变化使得找到正确的细粒度类别更加困难。解决姿态变化的经典方法依赖于匹配局部特征点、改善单应性、以及推断明确的几何变换，但是它们在计算上是昂贵的。基于深度神经网络的最新工作引入了专用模块来学习具体的几何变换以用于语义对应，然而，它们需要预定义的变换类型和良好初始化的变换矩阵以确保合理的性能。这些类型的系统不能处理复杂变换，并且因此，假定包含未知变换的增长的数据库，则这些类型的系统对于细粒度的图像搜索是不现实的。附图说明在不一定按比...

【技术保护点】
1.一种方法，包括：/n从客户端装置接收搜索查询，所述搜索查询包括描绘对象的输入图像；/n使用生成器生成标准化视角下所述对象的向量表示，已经基于多个视角下已知对象的参考图像的集合以及在训练阶段期间从评估器接收的反馈数据训练了所述生成器，所述反馈数据指示所述生成器在生成标准化视角下所述已知对象的向量表示方面的性能，所述评估器包括生成所述反馈数据的判别器子模块、标准化器子模块和语义嵌入子模块；/n基于所述标准化视角下所述对象的向量表示来识别描绘所述对象的其他图像的集合；以及/n响应于所述搜索查询，将描绘所述对象的所述其他图像中的至少一个返回至所述客户端装置。/n

【技术特征摘要】
【国外来华专利技术】20180522 US 15/985,8181.一种方法，包括：
从客户端装置接收搜索查询，所述搜索查询包括描绘对象的输入图像；
使用生成器生成标准化视角下所述对象的向量表示，已经基于多个视角下已知对象的参考图像的集合以及在训练阶段期间从评估器接收的反馈数据训练了所述生成器，所述反馈数据指示所述生成器在生成标准化视角下所述已知对象的向量表示方面的性能，所述评估器包括生成所述反馈数据的判别器子模块、标准化器子模块和语义嵌入子模块；
基于所述标准化视角下所述对象的向量表示来识别描绘所述对象的其他图像的集合；以及
响应于所述搜索查询，将描绘所述对象的所述其他图像中的至少一个返回至所述客户端装置。

2.根据权利要求1所述的方法，其中，所述判别器子模块从所述生成器接收所述标准化视角下所述已知对象的生成图像，并且输出所述生成图像是所述已知对象的真实图像的概率。

3.根据权利要求2所述的方法，其中，所述标准化器子模块从所述生成器接收所述标准化视角下所述已知对象的所述生成图像，并且输出指示已知图像被转换为所述标准化视角的完成情况的值。

4.根据权利要求3所述的方法，其中，所述语义嵌入子模块从所述生成器接收所述标准化视角下所述已知对象的所述生成图像，并且输出指示基于所述生成图像确定的对象分类是否与所述已知对象的期望对象分类匹配的值。

5.根据权利要求4所述的方法，其中，所述生成器基于从所述判别器子模块、所述标准化器子模块和所述语义嵌入子模块接收的所述反馈数据来修改未来图像的生成。

6.根据权利要求1所述的方法，其中，识别描绘所述对象的所述其他图像的集合包括：
使用距离函数确定所述对象的向量表示与描绘对象的图像的向量表示的集合之间的距离；
基于所述距离识别与所述对象的向量表示最接近的向量表示的集合，与所述对象的向量表示最接近的向量表示的集合表示描绘所述对象的所述其他图像的集合。

7.根据权利要求6所述的方法，其中，所述其他图像的集合包括由所述生成器生成的图像。

8.一种系统，包括：
一个或更多个计算机处理器；以及
存储指令的一个或更多个计算机可读介质，所述指令在由所述一个或更多个计算机处理器执行时使所述系统执行操作，所述操作包括：
从客户端装置接收搜索查询，所述搜索查询包括描绘对象的输入图像；
使用生成器生成标准化视角下所述对象的向量表示，已经基于多个视角下已知对象的参考图像的集合以及在训练阶段期间从评估器接收的反馈数据训练了所述生成器，所述反馈数据指示所述生成器在生成标准化视角下所述已知对象的向量表示方面的性能，所述评估器包括生成所述反馈数据的判别器子模块、标准化器子模块和语义嵌入子模块；
基于所述标准化视角下所述对象的向量表示来识别描绘所述对象的其他图像的集合；以及
响应于所述搜索查询，将描绘所述对象的所述其他图像中的至少一个返回至所述客户端装置。

9.根据权利要求8所述的系统，其中，所述判别器子模块从所述生成器接收所述标准化视角下所述已知对象的生成图像，并且输出所述生成图像是所述已知对象的真实图像的概率。

10.根据权利要求9所述的系统，其中，所述标准化器子...

【专利技术属性】
技术研发人员：凯文·林，杨帆，王乔松，鲁宾逊·皮拉穆图，
申请(专利权)人：电子湾有限公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人