专利查询
首页
专利评估
登录
注册
当前位置:
首页
>
专利查询
>
广州特道信息科技有限公司
>
网页正文抽取方法及装置制造方法及图纸
>技术资料下载
下载网页正文抽取方法及装置的技术资料
文档序号:16779476
温馨提示:您尚未登录,请点
登陆
后下载,如果您还没有账户请点
注册
,登陆完成后,请刷新本页查看技术详细信息。
本发明公开了一种网页正文抽取方法,通过下载网页页面,根据所述网页页面获取网页源代码,然后根据所述网页源代码创建DOM树,基于所述DOM树和所述网页页面的页面样式生成视觉树,再基于所述视觉树定位分支结点,采用优选策略在已定位的分支节点中选取正...
该专利属于广州特道信息科技有限公司所有,仅供学习研究参考,未经过广州特道信息科技有限公司授权不得商用。
详细技术文档下载地址
温馨提示:您尚未登录,请点
登陆
后下载,如果您还没有账户请点
注册
,登陆完成后,请刷新本页查看技术详细信息。