【技术实现步骤摘要】
用于图像搜索的方法和系统相关申请的交叉引用本申请要求2018年4月2日提交的名称为“METHODANDSYSTEMFORIMAGESEARCHING”的美国临时申请序列号62/651,304的权益,其通过引用整体并入本文。
本专利技术的系统大体上涉及反向图像搜索,并且具体地涉及在搜索字符串图像的代表帧中使用最小数量的对象维度来形成矢量,以及另外,在代表图像和视频的数字库或数据库中的图像和视频的矢量的聚类的子空间内执行反向图像搜索。
技术介绍
通常通过使用被称为“搜索引擎”的计算机程序在因特网上搜索图像和视频。搜索引擎需要输入描述图像的一些关键字以找到与描述有关的结果。例如,响应于所收到的关键字,诸如“苹果”,搜索引擎可以返回水果、苹果以及它可能识别为苹果的任何其他内容(诸如名称为“苹果”的公司的徽标)的图像。为了搜索图像,一些搜索引擎使用先进的技术。一种这样的技术是“反向图像搜索”。取代了关键字,反向图像搜索接受图像上传以用于搜索类似图像。例如,不是键入单词“苹果”而是上传水果“苹果”的图像,以便找到水果“苹果”的额外图像。通过图像识别技术的最新发展,这些技术已经得到了增强。增强功能识别静止图像或动态图像的形状、颜色等,确定哪些元素是主焦点,并从图像和视频或数据库的数字库中返回相关的“视觉上相似”的结果。然而,现有技术受限于关键字和图像搜索。因此,希望提供进一步增强和改善反向图像搜索的新技术。
技术实现思路
提供了对与具有一个或多个图案的代表帧类似的一个或多个图像的实时反向图像搜索,使用处理器来执行该搜索,该处理器连接到网络并且可访问至少一个数字库,该数字库存 ...
【技术保护点】
1.一种对类似于具有一个或多个图案的代表帧的一个或多个图像进行实时反向图像搜索的方法,所述方法包括以下步骤:提供连接到网络的计算设备,所述计算设备:实时捕获一个或多个图像;以及将所捕获的一个或多个图像中的至少一个确认为所述代表帧,用作反向搜索中的输入;提供处理器,所述处理器连接到所述网络并且可访问至少一个数字库,所述数字库存储多个矢量以及与所述多个矢量中的每个相关联的相应图像和视频,所述处理器:为所述代表帧中的所述一个或多个图案中的每个计算一个或多个数学表示,以形成代表矢量,所述一个或多个数学表示对应于所述矢量的维度;通过将所述维度的数量减少到约8%以及减少到所述图像的质量和所述矢量的大小之间的最大权衡中的一个来减小所述矢量的大小;在所述至少一个数字库中检测与所述代表帧的矢量最相似的所述多个矢量中的一个或多个;以及经由所述网络实时提供与所选择的多个矢量中的一个或多个相关联的图像和视频,其中预先确定所提供的图像和视频的数量。
【技术特征摘要】
2018.04.02 US 62/651,304;2018.09.18 US 16/133,7541.一种对类似于具有一个或多个图案的代表帧的一个或多个图像进行实时反向图像搜索的方法,所述方法包括以下步骤:提供连接到网络的计算设备,所述计算设备:实时捕获一个或多个图像;以及将所捕获的一个或多个图像中的至少一个确认为所述代表帧,用作反向搜索中的输入;提供处理器,所述处理器连接到所述网络并且可访问至少一个数字库,所述数字库存储多个矢量以及与所述多个矢量中的每个相关联的相应图像和视频,所述处理器:为所述代表帧中的所述一个或多个图案中的每个计算一个或多个数学表示,以形成代表矢量,所述一个或多个数学表示对应于所述矢量的维度;通过将所述维度的数量减少到约8%以及减少到所述图像的质量和所述矢量的大小之间的最大权衡中的一个来减小所述矢量的大小;在所述至少一个数字库中检测与所述代表帧的矢量最相似的所述多个矢量中的一个或多个;以及经由所述网络实时提供与所选择的多个矢量中的一个或多个相关联的图像和视频,其中预先确定所提供的图像和视频的数量。2.根据权利要求1所述的方法,其中,所述计算设备包括至少一个视频摄像机,并且所述捕获选自以下中的一个:针对所述感兴趣的对象训练所述至少一个视频摄像机,和/或上载图像和视频。3.根据权利要求2所述的方法,其中,响应于所述代表帧的背景的改变而自动更新所捕获的一个或多个图像。4.根据权利要求1所述的方法,其中,所述代表帧包括多个代表帧,并且所述多个代表帧中的至少一个是预先选择的代表帧和实时选择的代表帧中的一个。5.根据权利要求1所述的方法,其中,确认所述代表帧包括以下步骤:选择所述视频的第一多个帧;对于每帧,计算每个颜色值的像素数量,所述颜色值选自RGB、YUV和LAB中的一个,其中所述颜色值的分量被单独处理,并且基于所述分量的所述颜色值和缩放比例利用公式来计算分数,所述缩放比例基于所述帧中的像素总数,所述公式为分数=log2(1.0+缩放比例×像素数量);以及将每帧中的所有分数的总和与所有所述第一多个帧的所有分数的总和进行比较,其中选择具有所有分数的总和最高的所述第一多个帧的帧作为所述代表帧。6.根据权利要求5所述的方法,其中,确认所述代表帧的步骤还包括以下步骤:接收所捕获的一个或多个图像中的至少一个作为静止图像和/或视频,所捕获的一个或多个图像选自2-维图像和3-维图像;以及通过将所述一个或多个图案的部分从所述代表帧中移除和/或将一个或多个图案添加到所述代表帧来编辑所述代表帧。7.根据权利要求6所述的方法,还包括确认对应于所检测的所述多个矢量中的一个或多个的图像的一个或多个属性的步骤,其中所述属性选自选自大小、与所述代表帧的相似度、颜色、值和所述至少一个数字库的特定数字库的成员中的至少一个。8.根据权利要求6所述的方法,其中,将一个或多个图案添加到所述代表帧的步骤包括以下步骤:将一个或多个附加图案叠加到所述代表帧上,以及改变所叠加的一个或多个附加图案在所编辑的代表帧中的大小、角度和位置中的任一个。9.根据权利要求1所述的方法,还包括以下步骤:将所述至少一个数字库中的所述多个矢量聚类以形成第一数量的聚类;以及重新聚类所述多个矢量以形成与所述第一数量不同的第二数量的聚类,其中动态地确定聚类的数量以校正边缘问题。10.根据权利要求9所述的方法,其中,在所述反向搜索中使用重新聚类集的并集,并且由于所述代表帧的改变而自动更新所述聚类和重新聚类。11.根据权利要求1所述的方法,其中,所述数学表示是一个或多个图案中的每个出现在所述代表...
【专利技术属性】
技术研发人员:卡尔·阿斯曼,乔纳斯·佩尔松,马库斯·恩格内,
申请(专利权)人:庞德五公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。