【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种垃圾邮件关键词的查找方法及系统,该方法包括,采用邮件拆分子系统将邮件按邮件标题、邮件正文、邮件附件等进行拆分,采用Map/Reduce子系统将拆分后的内容按照预装的中文分词库进行分词,并进行排序。本专利技术采用hadoop中的map/reduce以及分词对收集到的邮件进行关键词分析,可找出当前最流行的垃圾邮件关键词。【专利说明】一种垃圾邮件关键词的查找方法及系统
本专利技术涉及一种垃圾邮件处理方法,特别是涉及垃圾邮件关键词的查找方法以及 系统。
技术介绍
随着互联网的普及,电子邮件日渐成为人们工作、生活交流必不可少的工具,但众 多的垃圾邮件严重影响邮件用户的使用,甚至可能使得用户错过夹杂在垃圾邮件中的有用 邮件。现有的对于垃圾邮件的过滤可通过IP过滤、黑白名单、关键词匹配等进行。 例如,申请号为200310116951的专利技术专利中,采用建立垃圾邮件IP地址库,将发 件人的邮件地址和垃圾邮件IP地址库进行匹配的方式查找垃圾邮件。 再如,申请号为200410027521的专利技术专利中,采用建立黑 ...
【技术保护点】
一种垃圾邮件关键词的查找方法,其特征在于,采用hadoop分布式系统进行垃圾邮件关键词的查找。
【技术特征摘要】
【专利技术属性】
技术研发人员:李清森,
申请(专利权)人:北京无限立通通讯技术有限责任公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。