Methods, systems and devices for receiving query images and user click positions, processing received query images based on user click positions, identifying one or more entities associated with the processed query images, and providing one or more information about the recognition in entities in response to receiving (i) query images and (ii) user click positions. By allowing search queries to take the form of images and user clicks, the user interface can allow text entry by typing search queries without using keyboards or other text entry mechanisms such as voice recognition.
【技术实现步骤摘要】
【国外来华专利技术】促进图像作为搜索查询的使用
本说明书涉及简化搜索引擎的使用。
技术介绍
通常,用户能够通过向搜索引擎输入查询请求信息。搜索引擎能够处理查询并且能够响应于查询提供用于输出到用户的信息。一些用户受限于其与计算机交互的能力,包括受限于其将搜索查询输入到计算机中的能力。
技术实现思路
根据本说明书中描述的主题的一些创新方面,计算设备允许到搜索设施的简化的用户界面。特别地,计算设备允许用户能够提供查询图像和用户点击位置作为搜索查询,例如来自用户周围的具有选择的兴趣区域的照片。响应于系统接收查询图像和用户点击位置,系统将视觉辨识技术应用于接收的查询图像以在接收的查询图像中识别一个或多个实体。通过使用用户点击位置改进视觉辨识结果。例如,视觉辨识结果可以用于增强对后端辨识器的输入并且可以用于排序获得的辨识结果。系统响应于接收查询图像和用户点击位置提供关于识别的实体中的一个或多个的信息。通过允许搜索查询采取图像和用户点击位置的形式,用户界面能够允许键入搜索查询而无需使用键盘或者诸如话音辨识的另一文本录入机制的文本录入。这能够允许界面由以下用户的类别使用:不可以以其它方式能够轻易地使用搜索引擎的用户(包括幼儿)、具有有限精细马达控制的用户、没有话音能力的用户等。其也能够允许界面由在基于文本的输入可能是困难或者不可能的情形中的用户使用,诸如在用户在其手上戴着手套阻止他们在其移动设备上使用诸如虚拟或者小尺寸键盘的文本录入设备的寒冷环境中。本说明书中描述的主题的创新方面可以体现在方法中,方法包括以下动作:接收(i)查询图像、和(ii)用户点击位置;基于用户点击位置处理接收的查询图像;识 ...
【技术保护点】
1.一种计算机实施的方法,包括:接收(i)查询图像、和(ii)用户点击位置;基于用户点击位置处理接收的查询图像;识别与处理的查询图像相关联的一个或多个实体;并且响应于接收(i)查询图像、和(ii)用户点击位置,提供关于实体中的识别的一个或多个的信息。
【技术特征摘要】
【国外来华专利技术】2016.06.28 US 15/195,3691.一种计算机实施的方法,包括:接收(i)查询图像、和(ii)用户点击位置;基于用户点击位置处理接收的查询图像;识别与处理的查询图像相关联的一个或多个实体;并且响应于接收(i)查询图像、和(ii)用户点击位置,提供关于实体中的识别的一个或多个的信息。2.如权利要求1所述的方法,其中基于用户点击位置处理接收的查询图像包括基于用户点击位置裁剪接收的查询图像。3.如权利要求2所述的方法,其中裁剪接收的查询图像包括以下中的一个或多个:(i)执行内容感知裁剪算法,(ii)使用对象检测神经网络处理查询图像,(iii)围绕用户点击位置应用固定大小裁剪,并且(iv)应用多个裁剪。4.如权利要求2或者3所述的方法,其中识别与处理的查询图像相关联的一个或多个实体包括:使用神经网络处理处理的查询图像以在处理的查询图像中分类一个或多个实体。5.如权利要求4所述的方法,进一步包括:使用神经网络处理接收的查询图像以在接收的查询图像中分类一个或多个实体;组合(i)在处理的查询图像中分类的一个或多个实体、和(ii)在接收的查询图像中分类的一个或多个实体。6.如权利要求5所述的方法,其中组合(i)在处理的查询图像中分类的一个或多个实体、和(ii)在接收的查询图像中分类的一个或多个实体包括使用在接收的查询图像中分类的一个或多个实体以上下文化在处理的查询图像中分类的一个或多个实体。7.如任一前述权利要求所述的方法,其中基于用户点击位置处理接收的查询图像包括使用光学字符辨识引擎处理接收的查询图像以检测文本的一个或多个区域。8.如权利要求7所述的方法,进一步包括围绕用户点击位置选择区域。9.如权利要求8所述的方法,其中识别与处理的查询图像相关联的一个或多个实体包括:使用第一光学字符辨识引擎处理选择的区域以识别第一数量的实体;使用第二光学字符辨识引擎处理处理的查询图像中的剩余文本以识别第二数量的实体,其中使用第二光学字符辨识引擎处理文本比使用第一光学字符辨识引擎处理文本在计算上更便宜。10.如任一前述权利要求所述的方法,其中基于用户点击位置处理接收的查询图像包括围绕用户点击位置定义兴趣区域。11.如权利要求10所述的方法,其中识别与处理的查询图像相关联的一个或多个实体包括使用描述符匹配引擎处理处理的查询图像以识别一个或多个实体。12.如权利要求11所述的方法,其中使用描述符匹配引擎处理处理的查询图像包括在定义的兴趣区域中提取相比于处理的查询图像中的其它区域的更高密度的描述符。13.如任一前述权利要求所述的方法,其中提供关于识别的一个或多个实体的信息包括响应于接收(...
【专利技术属性】
技术研发人员:A夏尔马,D彼得鲁,M夏里菲,
申请(专利权)人:谷歌有限责任公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。