下载一种基于机器学习的网页有害信息识别方法的技术资料

文档序号:21034572

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明公开了一种基于机器学习的网页有害信息识别方法,包括以下步骤:S1:使用网络爬虫爬取已知分类网站机器学习训练所用的语料库;S2:预处理爬取的语料库,生成训练集和测试集;S3:进行机器学习算法的模型训练和模型验证;S4:输入待甄别网页,通...
该专利属于成都三零凯天通信实业有限公司所有,仅供学习研究参考,未经过成都三零凯天通信实业有限公司授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。