一种信息过滤方法及装置制造方法及图纸

技术编号:9239988 阅读:110 留言:0更新日期:2013-10-10 03:42
本发明专利技术公开了一种信息过滤方法及装置,用以解决现有技术中维护黑名单的效率较低,信息发布的时效性较低的问题。该方法通过规则过滤方法判断待过滤信息中是否包含敏感分词,若包含则直接将其过滤,否则,通过机器学习过滤方法判断其是否为非法信息,若是,则删除发布的该待过滤信息,否则保持该待过滤信息的发布状态。通过上述方法,需维护的黑名单中仅包括敏感分词,有效减少了需要维护的黑名单中的分词的数量,提高了维护黑名单的效率,而且,在通过规则过滤方法确定待过滤信息中不包含敏感分词时,可直接将其发布,即使该信息是除敏感信息以外的其他非法信息,后续也可通过机器学习过滤方法将发布的该信息删除,因此提高了信息发布的时效性。

【技术实现步骤摘要】

【技术保护点】
一种信息过滤方法,其特征在于,包括:获取待过滤信息;判断所述待过滤信息中是否包含第一黑名单中预设的敏感分词;若是,则过滤所述待过滤信息;否则,发布所述待过滤信息,并根据所述待过滤信息中包含的分词以及预先训练的过滤模型,判断所述待过滤信息是否为非法信息,若是,则删除发布的所述待过滤信息,否则保持所述待过滤信息的发布状态不变。

【技术特征摘要】

【专利技术属性】
技术研发人员:戴明洋
申请(专利权)人:新浪网技术中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1