一种快速加载HTML DOM的方法技术

技术编号:4179672 阅读:683 留言:0更新日期:2012-04-11 18:40
一种快速加载HTML DOM的方法,首先建立HTML DOM加载器;应用程序将HTML字符串传递给HTML DOM加载器;加载器调用前向遍历器,并将HTML字符串传递给它;前向遍历器逐步分析HTML字符串并逐步返回各个节点的HTML;然后HTML DOM加载器根据前向遍历器分析出来的各个节点名称加载该节点的分析器;HTML DOM加载器调用节点分析器来分析该节点的HTML;节点分析器调用该节点的语法分析器来验证是否有错误;语法分析器检查该节点HTML并修正错误;节点分析器生成DOM节点并记录在DOM树中;最后节点分析器根据节点的特点指定前向遍历器如何进行下一步的操作;HTML DOM加载器将生成的DOM树返回给应用程序。本发明专利技术使得加载HTML时速度快捷并且可以方便地扩展纠错机制。

【技术实现步骤摘要】

本专利技术涉及一种快速加载HTML DOM的方法,特别涉及一种在分析HTML的时 候,预先快速地将其加载为DOM的方法。
技术介绍
由于HTML的不规范性,对HTML的分析会比较复杂,通常的办法是将其先加 载为DOM。加载HTML的最大的技术难点在于纠正一些错误的语法,例如缺少结束 标记,节点出现在错误的位置上(例如〈td〉出现在〈table〉之外)等这些错误。本发 明将使用一种灵活快速的方式来加载HTML,它最大的好处是速度快捷并且可以 方便地扩展纠错机制。
技术实现思路
本专利技术所要解决的技术问题是提供一种在分析HTML的时候,预先快速地将其加载为DOM的方法。本专利技术所述的一种快速加载HTML DOM的方法,该方法至少包括如下的步骤步骤l:建立HTML DOM加载器,它包含以下部件。步骤2:应用程序将HTML字符串传递给HTML DOM加载器。步骤3: HTML DOM加载器调用前向遍历器,并将HTML字符串传递给它。步骤4:前向遍历器逐步分析HTML字符串并逐步返回各个节点的HTML,并纠正一些基本的语法错误,例如缺失结束标记。步骤5: HTML DOM加载器根据前向遍本文档来自技高网...

【技术保护点】
一种快速加载HTML DOM的方法,其特征在于:该方法至少包括如下的步骤: 步骤1:建立HTML DOM加载器。 步骤2:应用程序将HTML字符串传递给HTML DOM加载器。 步骤3:HTML DOM加载器调用前向遍历器 ,并将HTML字符串传递给它。 步骤4:前向遍历器逐步分析HTML字符串并逐步返回各个节点的HTML,并纠正一些基本的语法错误。 步骤5:HTML DOM加载器根据前向遍历器分析出来的各个节点名称加载该节点的分析器。 步骤 6:HTML DOM加载器调用节点分析器来分析该节点的HTML。 步骤7:节点分析器...

【技术特征摘要】

【专利技术属性】
技术研发人员:汤海京徐友春朱红军蒋海涛
申请(专利权)人:北京闻言科技有限公司
类型:发明
国别省市:11[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1