使用多个视觉输入模态的视觉搜索制造技术

技术编号：8271532 阅读：235 留言：0更新日期：2013-01-31 03:48

提供了用于web规模的视觉搜索的、能够使用视觉输入模态的组合的系统、方法和计算机可读存储媒体。创建边缘元索引，其包括对应于多个图像中的每个图像的形状描述符，所述形状描述符包括基于边缘元的表示。每个基于边缘元的表示包括描绘图像的边缘或边界轮廓的像素，并且至少部分地通过将所述图像分段成多个图像段以及在每个段上执行多相轮廓检测而被创建。在接收到具有视觉查询输入的搜索查询后，视觉查询输入被转换成包括基于边缘元的表示的形状描述符，以及多个图像中的每个图像的、包括基于边缘元的表示的形状描述符被与所述视觉查询输入的、包括基于边缘元的表示的形状描述符进行比较，以便识别所述多个图像中的、与所述视觉查询输入匹配的至少一个图像。

全部详细技术资料下载

【技术实现步骤摘要】
使用多个视觉输入模态的视觉搜索的制作方法使用多个视觉输入模态的视觉搜索对相关串请的交叉引用本申请要求2011年10月18日提交的美国临时专利申请序列号No. 61/548，585的利益，该申请通过引用被并入，就如同其全文在这里被阐明一样。
技术介绍
因特网通过它的数十亿的Web页面提供了巨大的和快速增长的信息和资源库。为了找到想要的内容，计算机用户常常利用搜索工具。示范性的因特网搜索引擎在本领域内是熟知的，例如，普遍已知的商业引擎是由华盛顿州、雷蒙德的微软公司提供的Bing 搜索引擎。许多当前的商用图像搜索技术使用文本查询来从主要通过文本数据索引的抓取(crawled)图像的大型数据库中获取结果。这限制了什么图像可以被搜索的范围，其进而又影响搜索结果的质量和相关性。另外，可用性被交互式细化(refinement)的缺乏所影响。·
技术实现思路
本概要被提供来以简化的形式介绍概念的选择，这些概念在下面的详细说明中被进一步描述。本概要既不打算确认所要求保护的主题的关键特征或必要特征，也不打算被使用来帮助确定所要求保护的主题的范围。本专利技术的实施例涉及系统、方法和计算机可读...

【技术保护点】
一种系统（200），包括处理器（114），其与计算机可读存储媒体进行通信；索引（230），其被维持在所述计算机可读存储媒体中，所述索引包括图像数据，其描述多个图像中的每个图像的一个或多个形状描述符，所述形状描述符包括基于边缘元的表示；查询接收组件（222），其接收视觉输入作为搜索查询；查询解析器（224），其将所述视觉输入转换成包括基于边缘元的表示的至少一个形状描述符；和视觉输入匹配组件（228），其将所述多个图像的、包括基于边缘元的表示的一个或多个形状描述符与来自搜索查询的视觉输入的、包括基于边缘元的表示的至少一个形状描述符进行匹配，以便识别所述多个图像中的至少一个匹配的图像。

【技术特征摘要】
2011.10.18 US 61/548,585;2011.11.21 US 13/301,3811.一种系统(200),包括处理器(114)，其与计算机可读存储媒体进行通信；索引(230)，其被维持在所述计算机可读存储媒体中，所述索引包括图像数据，其描述多个图像中的每个图像的一个或多个形状描述符，所述形状描述符包括基于边缘元的表示；查询接收组件(222)，其接收视觉输入作为搜索查询；查询解析器(224)，其将所述视觉输入转换成包括基于边缘元的表示的至少一个形状描述符；和视觉输入匹配组件(228)，其将所述多个图像的、包括基于边缘元的表示的一个或多个形状描述符与来自搜索查询的视觉输入的、包括基于边缘元的表示的至少一个形状描述符进行匹配，以便识别所述多个图像中的至少一个匹配的图像。2.权利要求I的系统，其中所述视觉输入是图像、草图和拼贴画中的一个或多个。3.权利要求I的系统，其中所述视觉输入匹配组件识别所述多个图像中的多个匹配的图像，以及其中所述视觉输入匹配组件还为所述多个匹配的图像中的每个匹配图像指派视觉分数。4.权利要求3的系统，还包括排名引擎(236)，其至少部分地基于分别指派给每个匹配图像的视觉分数来对所述多个匹配的图像进行排名。5.权利要求I的系统，其中所述索引至少部分地通过将所述多个图像中的每个图像分段成各自的多个段以及在各个各自的多个段上执行多相轮廓检测而被构造。6.权利要求5的系统，其中各个各自的多个段中的每个段基于颜色和梯度改变中的至少一个而被识别。7.权利要求I的系统,其中由所述查询接收组件接收的搜索查询包括视觉输入和文本输入，以及其中所述查询解析器从视觉输入中提取文本输入。8.一种或多种计算机可读存储媒体，其存储计算机可用的指令，当所述指令由一个或多个计算设备使用时，使得所述一个或多个计算设备执行方法，所述方法包括接收(510)搜索查询；提供(512)多个图像结果，所述多个图像结果中的每个具有一个或多个相关联的形状描述符，所述形状描述符包括它们的第一基于边缘元的表示；接收(5...

【专利技术属性】
技术研发人员：A苏德，R普拉萨德，AMAH卡希尔，PK米什拉，S阿马，曹堪澄，
申请(专利权)人：微软公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人