【技术实现步骤摘要】
本专利技术涉及一种快速加载HTML DOM的方法,特别涉及一种在分析HTML的时 候,预先快速地将其加载为DOM的方法。
技术介绍
由于HTML的不规范性,对HTML的分析会比较复杂,通常的办法是将其先加 载为DOM。加载HTML的最大的技术难点在于纠正一些错误的语法,例如缺少结束 标记,节点出现在错误的位置上(例如〈td〉出现在〈table〉之外)等这些错误。本发 明将使用一种灵活快速的方式来加载HTML,它最大的好处是速度快捷并且可以 方便地扩展纠错机制。
技术实现思路
本专利技术所要解决的技术问题是提供一种在分析HTML的时候,预先快速地将其加载为DOM的方法。本专利技术所述的一种快速加载HTML DOM的方法,该方法至少包括如下的步骤步骤l:建立HTML DOM加载器,它包含以下部件。步骤2:应用程序将HTML字符串传递给HTML DOM加载器。步骤3: HTML DOM加载器调用前向遍历器,并将HTML字符串传递给它。步骤4:前向遍历器逐步分析HTML字符串并逐步返回各个节点的HTML,并纠正一些基本的语法错误,例如缺失结束标记。步骤5: HTML D ...
【技术保护点】
一种快速加载HTML DOM的方法,其特征在于:该方法至少包括如下的步骤: 步骤1:建立HTML DOM加载器。 步骤2:应用程序将HTML字符串传递给HTML DOM加载器。 步骤3:HTML DOM加载器调用前向遍历器 ,并将HTML字符串传递给它。 步骤4:前向遍历器逐步分析HTML字符串并逐步返回各个节点的HTML,并纠正一些基本的语法错误。 步骤5:HTML DOM加载器根据前向遍历器分析出来的各个节点名称加载该节点的分析器。 步骤 6:HTML DOM加载器调用节点分析器来分析该节点的HTML。 ...
【技术特征摘要】
【专利技术属性】
技术研发人员:汤海京,徐友春,朱红军,蒋海涛,
申请(专利权)人:北京闻言科技有限公司,
类型:发明
国别省市:11[]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。