基于模板的在线社交网络垃圾信息实时检测方法技术

技术编号：12436583 阅读：125 留言：0更新日期：2015-12-04 00:37

本发明专利技术公开了一种基于模板的在线社交网络垃圾信息实时检测方法，进行检测前先初始化一个空的垃圾模板库，检测时利用垃圾模板库对待检测信息进行模板匹配以进行垃圾信息过滤：匹配成功，则认为该信息为垃圾信息，并利用垃圾模板库对后续待检测信息进行垃圾信息过滤；否则，对该待检测信息进行辅助过滤以确定其是否为垃圾信息，以及为垃圾信息时的所属类别并按类别对垃圾信息进行缓存；在根据缓存结果更新垃圾模板库，并利用更新后的垃圾模板库对后续待检测信息进行模板匹配。本发明专利技术的检测方法可识别的信息的范围，检测准确率高，速度快，能够实现在线实时检测。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及互联网安全
，具体涉及一种基于模板的在线社交网络垃圾信息实时检测方法。
技术介绍
在之前对Twitter数据的研究中，有至少4%的信息是垃圾信息。而到了 2014年， 5%的Twitter用户是垃圾信息机器人。垃圾信息的传播不仅会耗费大量的网络资源，还会影响用户的上网体验，更有可能骗取用户点击相关的恶意链接从而造成经济损失。文南犬 "Beyond blacklists: learning to detect malicious web sites from suspicious ur I s'，（ J. Ma, L. K. Sau I，S. Savage, and G. M. Voe lker, in KDD，2009, pp. 1245 - 1254)公开了一种基于信息URL重定向链接以及恶意URL的进行垃圾信息检测的方法，即通过对社交网络中信息最后附带的URL进行分析，用重定向以及黑名单检测等方法找出恶意的URL，它们所对应的信息即为垃圾信息，等等。尽管这些方法都能够从一定程度上减轻在线社交网络垃圾信息对人们造成的负面影响，但是对于垃圾信息制造者如何批量生产垃圾信息，使用了何种技术都很少有涉及。 A.Pitsillidis，等人提出了一种基于模板的垃圾信息检测方法，详见参考文献 "Botnet Judo:Fighting Spam with Itself，" in NDSS，2010〇但是该方法也存在如下局限性：第一，在进行检测时，假设所有模板都存在固定词汇，而在现实的在线社交网络中往往会使用两个等...

【技术保护点】
一种基于模板的在线社交网络垃圾信息实时检测方法，其特征在于，进行检测前先初始化一个空的垃圾模板库，检测时利用所述的垃圾模板库对待检测信息进行模板匹配以进行垃圾信息过滤：若匹配成功，则认为该信息为垃圾信息，并利用所述的垃圾模板库对后续待检测信息进行模板匹配；否则，进行如下步骤：（a）对该待检测信息进行辅助过滤以确定其是否为垃圾信息，以及为垃圾信息时的所属类别并按类别对垃圾信息进行缓存；（b）根据缓存结果更新所述的垃圾模板库，并利用更新后的垃圾模板库对后续待检测信息进行模板匹配。

【技术特征摘要】

【专利技术属性】
技术研发人员：陈焰，高泓彧，卜凯，朱添田，
申请(专利权)人：浙江大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人