识别网络浏览器中的并行布局的独立任务的机器学习方法技术

技术编号:9438131 阅读:178 留言:0更新日期:2013-12-12 17:49
用于加速网页再现的方法和装置包含:处理网页并搜集网页元素信息;对所述所搜集网页元素信息执行机器学习分析以识别与网页元素信息相关的布局独立性中的模式;以及训练分类器以基于网页脚本中的元素信息预测子树独立性。所述所预测子树独立性可用以并行地处理待再现的网页的多个部分以减少再现所述页所需的时间。子树可为有条件地独立的,在所述情况下,可通过推测数据以使得所述子树独立或通过执行任务以获得特定信息以使得所述子树独立来使所述有条件地独立的子树独立。

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】用于加速网页再现的方法和装置包含:处理网页并搜集网页元素信息;对所述所搜集网页元素信息执行机器学习分析以识别与网页元素信息相关的布局独立性中的模式;以及训练分类器以基于网页脚本中的元素信息预测子树独立性。所述所预测子树独立性可用以并行地处理待再现的网页的多个部分以减少再现所述页所需的时间。子树可为有条件地独立的,在所述情况下,可通过推测数据以使得所述子树独立或通过执行任务以获得特定信息以使得所述子树独立来使所述有条件地独立的子树独立。【专利说明】相关_请案本申请案主张2011年3月15日申请的题为“(Machine Learning Method to Identify Independent Tasks forParallel Layout in Web Browsers) ”的第61/452,694号美国临时专利申请案的优先权的权利,所述申请案的全部内容特此以引用的方式并入。
以下描述一般来说涉及计算装置通信,且更明确地说,涉及用于再现网页的设备和方法。
技术介绍
例如网页等页在计算装置上的再现按照法律产生页的文档对象模型(DOM)树。DOM树定义呈子级-父级关系的ー个或ー个以上节点,包含相应DOM节点的性质和/或属性以及网页的样式属性。当启动页时,从网络或从本地磁盘高速缓存读取页的.html文件,剖析所述.html文件,且建构DOM树。接着可应用嵌入的/或外部层叠样式表(CSS)来计算DOM树中的每ー节点的样式。一旦树“经样式化”,布局算法便运行以计算屏幕上的所有DOM元素的位置和大小。通过此信息,浏览器能够显示页。每当载入页时可执行这些操作,载入页花费大量时间,由此导致不太令人满意的用户体验。此外,在资源受约束环境中加剧了此时间量,资源受约束环境例如移动计算装置,例如移动电话,个人数字助理(PDA)或与非移动计算装置相比较具有相对有限的处理能力、存储器和/或通信输送量的其它相对较小的便携式装置。因此,在移动计算装置的情况下,用户体验受损更多。
技术实现思路
下文呈现对ー个或ー个以上方面的简化概述以便提供对这些方面的基本理解。此概述并非所有预期方面的广泛综述,且既定既不识别所有方面的关键或重要元素,也不描绘任何或所有方面的范围。其唯一目的是以简化形式呈现ー个或ー个以上方面的ー些概念作为稍后呈现的更详细描述的序言。—个方面涉及ー种加速网页再现的方法,所述方法包含处理网页并搜集网页元素信息。所述方法对所述所搜集网页元素信息执行机器学习分析以识别与网页元素信息相关的布局独立性中的模式。所述方法训练分类器以基于网页脚本中的元素信息预测子树独立性,且所述方法使用所述所预测子树独立性并行地处理待再现的网页的多个部分并再现所述网页。在另一方面,所述子树可为有条件地独立的。在所述情况下,可通过推测数据以使得所述子树独立或通过执行任务以获得特定信息以使得所述子树独立来使得所述有条件地独立的子树独立。在另一方面,ー种方法(其可在ー个或ー个以上计算装置中或在存储在非暂时性存储媒体上的可执行指令中实施)包含以下操作:处理多个网页并搜集网页元素信息;对所述所搜集网页元素信息执行机器学习分析以识别与网页元素信息相关的布局独立性中的模式;训练分类器以基于网页脚本中的元素信息预测子树独立性;以及使用所述所预测子树独立性并行地处理待再现的网页的多个部分。在一方面中,所述使用所述所预测子树独立性并行地处理待再现的网页的多个部分的操作可包含基于所述网页脚本中的所述网页元素信息预测子树为先验独立的,以及由DOM树的先验独立部分形成任务。所述方面方法可进ー步包含:基于所述网页脚本中的所述元素信息预测在确定特定信息的情况下子树将为有条件地独立的;执行任务以获得所述特定信息;以及使用所述所获得的特定信息由DOM树的所述有条件地独立的部分形成任务。在一方面中,执行任务以获得所述特定信息可包含即时地计算所述特定信息和/或基于推测确定所述特定信息。所述方面方法可进ー步包含使用配备工具的浏览器搜集网页元素信息,以及搜集包括以下各者中的至少ー者的网页元素信息:网页元素布局大小、位置、CSS样式属性、子树大小、HTML标记、父级HTML标记,和网页特征信息。所述方面方法可进ー步包含使用所述所预测子树独立性确定所述网页的DOM树的子树并非独立的且所述子树无法进行并行处理和/或使用单个网络浏览器执行所述机器学习分析且预测子树独立性以并行地处理所述网页的多个部分。所述方面方法可进ー步包含在第一计算装置中使用第一处理器执行机器学习分析,以及在第二不同计算装置中使用第二处理器预测子树独立性以并行地处理所述网页的多个部分。所述方面方法可进ー步包含:通过处理多个经更新的网页来更新所述分类器,并搜集经更新的网页元素信息,以及对所述所搜集网页元素信息执行机器学习分析以识别与网页元素信息相关的布局独立性中的额外模式。所述方面方法可进ー步包含训练所述分类器以按第一时间间隔和第二不同时间间隔基于所述网页脚本中的元素信息预测子树独立性,使用所述所预测子树独立性并行地处理待再现的所述网页的多个部分。在另一方面中,所述前述方法可在单个计算装置内实施,其中处理多个网页并搜集网页元素信息是在于所述单个计算装置上操作的配备工具的浏览器中完成,且对所述所搜集网页元素信息执行机器学习分析以识别与网页元素信息相关的布局独立性中的模式是在所述同一计算装置中完成。在另一方面中,所述前述方法可在计算装置和服务器的网络中实施,其中处理多个网页并搜集网页元素信息包含:在多个计算装置中处理多个网页并搜集网页元素信息;将所述所搜集网页信息从所述多个计算装置中的每ー者发射到所述服务器;在所述服务器中接收并聚集由所述多个计算装置发射的所述网页信息以产生经聚集网页元素信息;将经聚集网页元素信息发射到所述多个计算装置中的至少ー者;以及在所述多个计算装置中的所述至少一者中接收所述发射的经聚集网页元素信息。此外,在此方面中,对所述所搜集网页元素信息执行机器学习分析以识别与网页元素信息相关的布局独立性中的模式是在所述多个计算装置中的所述至少一者中对所述所接收的经聚集网页元素信息完成,且训练分类器以基于网页脚本中的元素信息预测子树独立性包括训练在所述多个计算装置中的所述至少一者中操作的分类器以基于对所述所接收的经聚集网页元素信息执行的机器学习分析预测子树独立性。在另一方面中,所述前述方法可在计算装置和服务器的网络中实施,其中处理多个网页并搜集网页元素信息可包含在多个计算装置中处理多个网页并搜集网页元素信息,将所述所搜集网页信息从所述多个计算装置中的每ー者发射到服务器(例如,经由因特网),以及在所述服务器中接收由所述多个计算装置发射的所述网页信息以产生经聚集网页元素信息。在此方面中,对所述所搜集网页元素信息执行机器学习分析以识别与网页元素信息相关的布局独立性中的模式可在所述服务器中对由所述多个计算装置发射的所述所接收网页信息完成以识别布局独立性中的模式,且所述方法可进ー步包含将布局独立性中的所述所识别模式从所述服务器发射到所述多个计算装置中的至少ー者(例如,经由因特网),以及在所述多个计算装置中的所述至少一者中接收布局独立性中的所述所识别模式。此外,在此方面中,训练分类器以基于网页脚本中的元本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:格奥尔基·C·卡斯卡沃阿德里安·L·D·桑普森王斌
申请(专利权)人:高通股份有限公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1