下载基于视觉的web页面萃取方法的技术资料

文档序号:6869930

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明公开了一种基于视觉分析的web页面萃取方法,包括如下步骤:(1)确认web页面中给定的网页地址已经下载完成,并且经完整展示后生成文档对象模型树;(2)基于文档对象模型树将web页面拆分成在视觉上无法进一步拆分的块元素;(3)从主体块在...
该专利属于天津海量信息技术有限公司所有,仅供学习研究参考,未经过天津海量信息技术有限公司授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。