【技术实现步骤摘要】
对本机应用的应用页面建索引分案说明本申请属于申请日为2014年1月13日的中国专利技术专利申请No.201480009918.0的分案申请。
本申请涉及对本机应用的应用页面建索引。
技术介绍
因特网提供对广泛各种信息的访问。例如,通过因特网可访问数字图像文件、视频和/或音频文件、以及针对特定对象或者特定新闻文章的网页资源。关于网页资源,这些资源中的很多资源被设计成促进特定功能的执行,该特定功能诸如银行、预定酒店预约、购物等,或者被设计成提供结构化信息,诸如在线百科全书、电影数据库等。各种搜索引擎可用于标识通过因特网可访问的特定资源。这些搜索引擎对各种网页资源爬行并且建索引。搜索引擎然后使用该索引来确定哪些资源最多地响应于搜索查询并且响应于该查询来提供链接至这些资源的搜索结果。随着平板电脑和智能电话的出现,现在提供了大量本机应用,其促进通过使用网页资源促进的相同功能的执行。然而,搜索引擎没有对来自本机应用环境内的信息爬行或者建索引。相反,对与本机应用相关的元数据建索引并且然后当处理搜索查询时访问。
技术实现思路
本说明书描述与对本机应用的应用页面建索引相关的技术。总体上,本说明书中所描述的主题的一个新颖性方面可以用如下方法来实施,该方法包括以下动作:实例化对用户设备的操作系统进行仿真的虚拟机;在所述虚拟机内实例化本机应用,所述本机应用生成应用页面以用于在用户设备上、在所述本机应用内显示,所述本机应用独立于能够在所述用户设备上操作的浏览器应用来操作;在所述虚拟机内访问所述本机应用的应用页面,并且对于所述应用页面中的每个应用页面:生成描述所述应用页面的内容的应用页面 ...
【技术保护点】
1.一种由包括数据通信中的一个或多个计算机的数据处理装置来执行的计算机实现的方法,所述方法包括:实例化对用户设备的操作系统进行仿真的虚拟机;在所述虚拟机内实例化本机应用,所述本机应用生成应用页面以用于在用户设备上、在所述本机应用内显示,所述本机应用独立于能够在所述用户设备上操作的浏览器应用来操作;在所述虚拟机内访问所述本机应用的应用页面,并且对于所述应用页面中的每个应用页面:从所述应用页面提取内容,所述内容包括多个不同内容类型的内容,每个内容类型的内容是由专用于该内容类型的对应提取器提取的;生成描述所述应用页面的内容的应用页面数据,由所述应用页面数据描述的所述内容包括在所述用户设备显示所述应用页面时所述用户设备在所述应用页面上显示的文本;以及在由搜索引擎可搜索的索引中针对所述本机应用对所述应用页面数据建索引。
【技术特征摘要】
2013.01.16 US 13/742,7711.一种由包括数据通信中的一个或多个计算机的数据处理装置来执行的计算机实现的方法,所述方法包括:实例化对用户设备的操作系统进行仿真的虚拟机;在所述虚拟机内实例化本机应用,所述本机应用生成应用页面以用于在用户设备上、在所述本机应用内显示,所述本机应用独立于能够在所述用户设备上操作的浏览器应用来操作;在所述虚拟机内访问所述本机应用的应用页面,并且对于所述应用页面中的每个应用页面:从所述应用页面提取内容,所述内容包括多个不同内容类型的内容,每个内容类型的内容是由专用于该内容类型的对应提取器提取的;生成描述所述应用页面的内容的应用页面数据,由所述应用页面数据描述的所述内容包括在所述用户设备显示所述应用页面时所述用户设备在所述应用页面上显示的文本;以及在由搜索引擎可搜索的索引中针对所述本机应用对所述应用页面数据建索引。2.根据权利要求1所述的计算机实现的方法,其中,所述建索引包括通过所述应用页面的统一资源标识符(URI)和标识所述本机应用的唯一应用标识符的组合来针对所述本机应用对所述应用页面建索引。3.根据权利要求1所述的计算机实现的方法,还包括:从所述本机应用的发布者接收指定要针对所述本机应用而被建索引的应用页面的数据;以及访问所述本机应用的应用页面包括仅访问被指定要针对所述本机应用而被建索引的所述应用页面。4.根据权利要求1所述的计算机实现的方法,其中所述提取器包括专用于文本内容类型的文本提取器和专用于图像内容类型的图像提取器。5.根据权利要求4所述的计算机实现的方法,其中通过所述应用页面数据描述的所述内容还包括描绘所述应用页面的图像的图像数据。6.根据权利要求5所述的计算机实现的方法,其中生成描述所述应用页面的内容的应用页面数据包括:对所述图像数据执行光学字符识别(OCR)以生成OCR文本;以及基于所述OCR文本生成文本数据,所述文本数据描述用户设备在所述应用页面上显示的文本。7.根据权利要求1所述的计算机实现的方法,其中通过所述应用页面数据描述的所述内容还包括应用页面链接数据,所述应用页面链接数据描述所述应用页面内的链接至另一应用页面的至少一个链接。8.根据权利要求1所述的计算机实现的方法,其中通过所述应用页面数据描述的所述内容还包括网页链接数据,所述网页链接数据描述所述应用页面内的链接至由统一资源定位符引用的资源的至少一个链接,在选择所述至少一个链接时,实例化在与所述本机应用分离的浏览器环境中渲染所述资源的浏览器应用。9.一种系统,包括:数据处理装置;以及在存储指令的非暂态计算机可读存储介质中存储的软件,所述指令能够由所述数据处理装置执行并且在这样的执行时使得所述数据处理装置执行操作,所述操作包括:实例化对用户设备的操作系统进行仿真的虚拟机;在所述虚拟机内实例化本机应用,所述本机应用生成应用页面以用于在用户设备上、在所述本机应用内显示,所述本机应用独立于能够...
【专利技术属性】
技术研发人员:L·常,丁彩相,廉宰玄,李相日,
申请(专利权)人:谷歌有限责任公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。