温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明提供一种网页结构相似性确定方法及装置。该方法包括:根据网页的DOM树确定网页的模板特征向量;对模板特征向量计算网页结构相似性,并进行查找或类聚。通过上述处理,克服了现有技术中不能够计算网页结构相似性的缺陷,当人工发现其中某个作弊网站时...该专利属于百度在线网络技术(北京)有限公司所有,仅供学习研究参考,未经过百度在线网络技术(北京)有限公司授权不得商用。
温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明提供一种网页结构相似性确定方法及装置。该方法包括:根据网页的DOM树确定网页的模板特征向量;对模板特征向量计算网页结构相似性,并进行查找或类聚。通过上述处理,克服了现有技术中不能够计算网页结构相似性的缺陷,当人工发现其中某个作弊网站时...