下载对尚未访问的网页进行基于路径的排队的方法和系统的技术资料

文档序号:2876466

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明提供一种在万维网爬行处理过程中对尚未访问的网页进行基于路径的排队的方法和系统。本发明将所有从“种子”URL开始通向已访问的相关网页的路径标识为“优选路径集:并且将从“种子”URL开始通向尚未访问网页的路径标识为“部分路径集:对所有已访...
该专利属于国际商业机器公司所有,仅供学习研究参考,未经过国际商业机器公司授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。