下载一种网站相似度检测方法的技术资料

文档序号:19857648

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明提供了一种网站相似度检测方法,通过服务器提取待检测网站中各个页面的文本信息,并将各个页面的文本信息整合为第一文本;所述服务器根据爬取任务配置文件开启网络URL信息爬取,获取各个网站所含文本信息,并将爬取的文本信息整合为第二文本;所述服...
该专利属于东莞市华睿电子科技有限公司所有,仅供学习研究参考,未经过东莞市华睿电子科技有限公司授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。