对本机应用的应用页面建索引制造技术

技术编号:20025735 阅读:23 留言:0更新日期:2019-01-06 04:35
本申请涉及对本机应用的应用页面建索引。一种对本机应用的应用页面建索引的方法、系统和装置,用于对独立于用户设备上的浏览器应用来操作的本机应用的应用页面建索引。一方面,该方法包括实例化对用户设备的操作系统进行仿真的虚拟机;在虚拟机内实例化本机应用,该本机应用生成应用页面以用于在用户设备上、在本机应用内显示;在虚拟机内访问本机应用的应用页面,并且对于该应用页面中的每个应用页面:生成描述应用页面的内容的应用页面数据,由应用页面数据描述的内容包括在用户设备显示应用页面时用户设备在应用页面上显示的文本;以及在由搜索引擎可搜索的索引中针对本机应用的对应用页面数据建索引。

【技术实现步骤摘要】
对本机应用的应用页面建索引分案说明本申请属于申请日为2014年1月13日的中国专利技术专利申请No.201480009918.0的分案申请。
本申请涉及对本机应用的应用页面建索引。
技术介绍
因特网提供对广泛各种信息的访问。例如,通过因特网可访问数字图像文件、视频和/或音频文件、以及针对特定对象或者特定新闻文章的网页资源。关于网页资源,这些资源中的很多资源被设计成促进特定功能的执行,该特定功能诸如银行、预定酒店预约、购物等,或者被设计成提供结构化信息,诸如在线百科全书、电影数据库等。各种搜索引擎可用于标识通过因特网可访问的特定资源。这些搜索引擎对各种网页资源爬行并且建索引。搜索引擎然后使用该索引来确定哪些资源最多地响应于搜索查询并且响应于该查询来提供链接至这些资源的搜索结果。随着平板电脑和智能电话的出现,现在提供了大量本机应用,其促进通过使用网页资源促进的相同功能的执行。然而,搜索引擎没有对来自本机应用环境内的信息爬行或者建索引。相反,对与本机应用相关的元数据建索引并且然后当处理搜索查询时访问。
技术实现思路
本说明书描述与对本机应用的应用页面建索引相关的技术。总体上,本说明书中所描述的主题的一个新颖性方面可以用如下方法来实施,该方法包括以下动作:实例化对用户设备的操作系统进行仿真的虚拟机;在所述虚拟机内实例化本机应用,所述本机应用生成应用页面以用于在用户设备上、在所述本机应用内显示,所述本机应用独立于能够在所述用户设备上操作的浏览器应用来操作;在所述虚拟机内访问所述本机应用的应用页面,并且对于所述应用页面中的每个应用页面:生成描述所述应用页面的内容的应用页面数据,由所述应用页面数据描述的内容包括在用户设备显示所述应用页面时所述用户设备在所述应用页面上显示的文本,以及在由搜索引擎可搜索的索引中针对所述本机应用对所述应用页面数据建索引。这一方面的其它实施例包括被配置成执行在计算机存储设备上编码的方法的动作的对应的系统、装置和计算机程序。本说明书中所描述的主题的另一新颖性方面可以在如下方法中实施,该方法包括以下动作:响应于搜索查询来接收第一搜索结果,所述搜索结果中的每个搜索结果引用能够在用户设备上的浏览器应用中被渲染的资源并且包括至所述资源的链接,所述第一搜索结果响应于对能够在所述浏览器应用中被渲染的资源的第一索引的搜索而生成;响应于所述查询来接收至少一个第二搜索结果,所述第二搜索结果指定独立于能够在所述用户设备上操作的浏览器应用来操作的本机应用,所述第二搜索结果响应于对能够在用户设备上、在所述本机应用内显示的应用页面的第二索引的搜索而生成;以及提供所述第一搜索结果和所述第二搜索结果以用于在用户设备上显示。这一方面的其它实施例包括被配置成执行在计算机存储设备上编码的方法的动作的对应的系统、装置和计算机程序。本说明书中所描述的主题的另一新颖性方面可以在如下方法中实施,该方法包括以下动作:在操作系统环境内实例化本机应用,所述本机应用生成应用页面以用于在用户设备上、在所述本机应用内显示,所述本机应用独立于能够在所述用户设备上操作的浏览器应用来操作;在所述操作系统环境内访问所述本机应用的应用页面,并且对于所述应用页面中的每个应用页面:提取描述所述应用页面的内容的应用页面数据,所述应用页面数据是被提供至所述本机应用的渲染过程的数据,其中所述渲染过程接收所述应用页面数据并且基于所述应用页面数据来渲染所述应用页面的所述内容,以及将所述应用页面数据与所述应用页面的应用页面标识符和所述本机应用的本机应用标识符关联。这一方面的其它实施例包括被配置成执行在计算机存储设备上编码的方法的动作的对应的系统、装置和计算机程序。本说明书中所描述的主题的特定实施例可以被实现以便实现下面的优点中的一个或多个。本机应用页面的应用页面索引中所存储的信息取自实际应用页面数据,并且因此可以提供如下应用内容的描述,其相比由在本机应用外部并且描述本机应用的元数据所提供的应用内容的描述更全面。这又可以向搜索引擎提供确定相关测量的能力,其比基于描述本机应用的元数据的相关测量更精确。特别地,本机应用页面的应用页面索引向搜索引擎提供针对本机应用出现搜索结果的能力,其考虑在本机应用的应用页面内提供的实际数据。这可能比仅依赖于描述本机应用的元数据(诸如本机应用的标题和描述)更精确,并且还解除了发布者对元数据执行搜索引擎优化以确保响应于特定查询来标识本机应用。其中以二进制形式来访问应用页面数据的实现降低了可能在使用取得这样的数据的技术的情况下产生的描述错误(诸如光学字符标识错误)的可能性。另外,以二进制形式访问数据还标识可能从视口上被隐藏的数据,诸如在其中可滚动的元件必须被致动以在应用环境内移动视口的情况下。应用页面数据的采集将本机应用用作应用页面数据的源,并且因此描述应用的数据的采集可以按照比从多个不同网站采集元数据更及时的方式来完成。同样,以这一方式采集应用页面数据比从多个不同网站采集元数据更可扩展。下面在附图和描述中阐述本说明书中所描述的主题的一个或多个实施例的细节。该主题的其它特征、方面和优点根据描述、附图和权利要求将变得显而易见。附图说明图1是在其中针对本机应用对应用页面建索引和搜索的示例环境的框图。图2是用于对本机应用的应用页面数据建索引的示例过程的流程图。图3是包括本机应用搜索结果的搜索结果页面的图示。图4是提供用于网页资源和应用页面资源的搜索结果的示例过程的流程图。图5是提取过程的系统流程图。图6A是应用页面用户界面的图示。图6B是在渲染应用页面用户界面的渲染过程中使用的种类和对象的图示。图6C是描述应用页面的内容的应用页面数据的示例。各个附图中相似的附图标记和名称表示相似的元素。具体实施方式系统对本机应用的应用页面爬行和建索引。如本文中所使用的,本机应用生成应用页面,以用于在本机应用的环境内、在用户设备上显示,并且独立于该用户设备上的浏览器应用来操作。本机应用是被特别地设计成在特定用户设备操作系统和机器固件上运行的应用。本机应用因此不同于基于浏览器的应用和浏览器渲染的资源。后者在每次将全部或者至少一些元素或者指令实例化或者渲染时需要从网页服务来下载它们。另外,基于浏览器的应用和浏览器渲染的资源可以由浏览器内的所有网页能力移动设备来处理并且因此不是操作系统特定的。为了针对本机应用对数据建索引,系统实例化对用户设备上操作的操作系统进行仿真的虚拟机。在该虚拟机内,系统实例化专用于该操作系统的本机应用。该本机应用生成应用页面,用于在该用户设备上、在该本机应用内显示,并且独立于该用户设备上的浏览器应用来操作。在该虚拟机内,该系统访问该本机应用的应用页面。该系统可以通过开发用于每个应用页面和每个随后的应用页面的各种菜单和选择选项的自动过程来访问页面。备选地,该系统可以访问由本机应用的发布者指定的页面。对于每个应用页面,该系统生成描述应用页面的内容的应用页面数据。通过应用页面描述的内容可以例如包括:在用户设备显示应用页面时该用户设备在该应用页面上显示的文本;将应用页面的图像定义为要在本机应用中渲染的图像数据;描述应用页面的各种列表和菜单的列表/菜单数据;以及描述应用页面的其它特征的其它数据。然后在由搜索引擎可搜索的索引中,针对本机应用对应用页面建索引。该搜本文档来自技高网...

【技术保护点】
1.一种由包括数据通信中的一个或多个计算机的数据处理装置来执行的计算机实现的方法,所述方法包括:实例化对用户设备的操作系统进行仿真的虚拟机;在所述虚拟机内实例化本机应用,所述本机应用生成应用页面以用于在用户设备上、在所述本机应用内显示,所述本机应用独立于能够在所述用户设备上操作的浏览器应用来操作;在所述虚拟机内访问所述本机应用的应用页面,并且对于所述应用页面中的每个应用页面:从所述应用页面提取内容,所述内容包括多个不同内容类型的内容,每个内容类型的内容是由专用于该内容类型的对应提取器提取的;生成描述所述应用页面的内容的应用页面数据,由所述应用页面数据描述的所述内容包括在所述用户设备显示所述应用页面时所述用户设备在所述应用页面上显示的文本;以及在由搜索引擎可搜索的索引中针对所述本机应用对所述应用页面数据建索引。

【技术特征摘要】
2013.01.16 US 13/742,7711.一种由包括数据通信中的一个或多个计算机的数据处理装置来执行的计算机实现的方法,所述方法包括:实例化对用户设备的操作系统进行仿真的虚拟机;在所述虚拟机内实例化本机应用,所述本机应用生成应用页面以用于在用户设备上、在所述本机应用内显示,所述本机应用独立于能够在所述用户设备上操作的浏览器应用来操作;在所述虚拟机内访问所述本机应用的应用页面,并且对于所述应用页面中的每个应用页面:从所述应用页面提取内容,所述内容包括多个不同内容类型的内容,每个内容类型的内容是由专用于该内容类型的对应提取器提取的;生成描述所述应用页面的内容的应用页面数据,由所述应用页面数据描述的所述内容包括在所述用户设备显示所述应用页面时所述用户设备在所述应用页面上显示的文本;以及在由搜索引擎可搜索的索引中针对所述本机应用对所述应用页面数据建索引。2.根据权利要求1所述的计算机实现的方法,其中,所述建索引包括通过所述应用页面的统一资源标识符(URI)和标识所述本机应用的唯一应用标识符的组合来针对所述本机应用对所述应用页面建索引。3.根据权利要求1所述的计算机实现的方法,还包括:从所述本机应用的发布者接收指定要针对所述本机应用而被建索引的应用页面的数据;以及访问所述本机应用的应用页面包括仅访问被指定要针对所述本机应用而被建索引的所述应用页面。4.根据权利要求1所述的计算机实现的方法,其中所述提取器包括专用于文本内容类型的文本提取器和专用于图像内容类型的图像提取器。5.根据权利要求4所述的计算机实现的方法,其中通过所述应用页面数据描述的所述内容还包括描绘所述应用页面的图像的图像数据。6.根据权利要求5所述的计算机实现的方法,其中生成描述所述应用页面的内容的应用页面数据包括:对所述图像数据执行光学字符识别(OCR)以生成OCR文本;以及基于所述OCR文本生成文本数据,所述文本数据描述用户设备在所述应用页面上显示的文本。7.根据权利要求1所述的计算机实现的方法,其中通过所述应用页面数据描述的所述内容还包括应用页面链接数据,所述应用页面链接数据描述所述应用页面内的链接至另一应用页面的至少一个链接。8.根据权利要求1所述的计算机实现的方法,其中通过所述应用页面数据描述的所述内容还包括网页链接数据,所述网页链接数据描述所述应用页面内的链接至由统一资源定位符引用的资源的至少一个链接,在选择所述至少一个链接时,实例化在与所述本机应用分离的浏览器环境中渲染所述资源的浏览器应用。9.一种系统,包括:数据处理装置;以及在存储指令的非暂态计算机可读存储介质中存储的软件,所述指令能够由所述数据处理装置执行并且在这样的执行时使得所述数据处理装置执行操作,所述操作包括:实例化对用户设备的操作系统进行仿真的虚拟机;在所述虚拟机内实例化本机应用,所述本机应用生成应用页面以用于在用户设备上、在所述本机应用内显示,所述本机应用独立于能够...

【专利技术属性】
技术研发人员:L·常丁彩相廉宰玄李相日
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1