【技术实现步骤摘要】
本专利技术涉及敏感词分类,具体为一种基于fp-tree和随机森林算法的网站敏感词自动分类方法。
技术介绍
1、传统的敏感词分类方法可以分为自动分类和人工分类。自动分类主要基于分词、关键词匹配等技术实现,这种分类方法误报率较高,且不适合新敏感词的分类。而人工分类方法的成本较大,分类速度慢,且分类带有主观因素。一种基于fp-tree和随机森林算法的网站敏感词自动分类方法。
技术实现思路
1、本部分的目的在于概述本专利技术的实施方式的一些方面以及简要介绍一些较佳实施方式。在本部分以及本申请的说明书摘要和专利技术名称中可能会做些简化或省略以避免使本部分、说明书摘要和专利技术名称的目的模糊,而这种简化或省略不能用于限制本专利技术的范围。
2、为解决上述技术问题,根据本专利技术的一个方面,本专利技术提供了如下技术方案:
3、一种基于fp-tree和随机森林算法的网站敏感词自动分类方法,其包括以下步骤:
4、s1:数据采集,使用python爬虫技术对网络上各个词库数据
...【技术保护点】
1.一种基于FP-Tree和随机森林算法的网站敏感词自动分类方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于FP-Tree和随机森林算法的网站敏感词自动分类方法,其特征在于,所述S3还包括:
3.根据权利要求2所述的一种基于FP-Tree和随机森林算法的网站敏感词自动分类方法,其特征在于,所述S4还包括:
【技术特征摘要】
1.一种基于fp-tree和随机森林算法的网站敏感词自动分类方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于fp-tree和随机森林算法的网站敏...
【专利技术属性】
技术研发人员:叶翔,虞雁群,曾培,刘彦伸,郭银锋,谢波,
申请(专利权)人:浙江御安信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。