【技术实现步骤摘要】
基于聚类算法的二维码恶意网站检测方法及装置
[0001]本专利技术实施例涉及网络安全
,特别涉及一种基于聚类算法的二维码恶意网站检测方法及装置。
技术介绍
[0002]随着互联网应用的发展,越来越多用户通过手机扫描二维码的方式来浏览网页信息。同时,二维码逐渐成为攻击者传播恶意软件的新方式,针对移动用户的恶意网站也越来越多。当移动用户扫描带有恶意网站的二维码时,可能会被定向到钓鱼网站,还可能被诱导下载安装恶意软件,这些操作都可能导致用户信息泄露、账户密码被盗,甚至造成财产损失等问题。
[0003]现有技术中,通过搜集恶意网站的URL链接以生成黑名单,利用黑名单对二维码所对应网站的URL进行匹配,若匹配到,则确定该二维码对应网站为恶意网站。但是,黑名单所涵盖恶意网站的URL有限,检测准确性较低。
技术实现思路
[0004]本专利技术实施例提供了一种基于聚类算法的二维码恶意网站检测方法及装置,能够快速且准确的检测出二维码所对应网站是否为恶意网站。
[0005]第一方面,本专利技术实施例提供了一 ...
【技术保护点】
【技术特征摘要】
1.一种基于聚类算法的二维码恶意网站检测方法,其特征在于,包括:当检测到二维码的扫描事件时,获取该二维码所对应目标网站的目标特征信息;基于属于合法网站分类的样本点和属于恶意网站分类的样本点,利用聚类算法计算所述目标特征信息与每一个分类所对应中心点的距离;将最小距离对应的分类确定为所述目标网站的分类。2.根据权利要求1所述的方法,其特征在于,所述获取该二维码所对应目标网站的目标特征信息,包括:从该二维码中解析出所述目标网站的网站信息;根据解析出的网站信息确定所述目标网站的目标特征信息。3.根据权利要求2所述的方法,其特征在于,所述根据解析出的网站信息确定所述目标网站的目标特征信息,包括:构建沙箱;根据解析出的网站信息在所述沙箱中访问所述目标网站,以获取所述目标网站的目标特征信息。4.根据权利要求1
‑
3中任一所述的方法,其特征在于,所述目标特征信息包括:源代码、域名、URL长度、域名长度、关键字、特殊字符的数量、是否包括敏感词语、传输协议类型、网页状态码、IP地址地区和网页类型。5.根据权利要求1所述的方法,其特征在于,在所述基于属于合法网站分类的样本点和属于恶意网站分类的样本点,利用聚类算法计算所述目标特征信息与每一个分类所对应中心点的距离之前,还包括:将获取的多个合法网站和多个恶意网站作为样本点,定义合法网站分类和恶意网站分类;在样本点中随机选择k个中心点,k为不小于2的整数;针对每一个样本点,计算该样本点与k个初始中心点的距离,并将该样本点划分至最小距离的初始中心点所对应的分类中;基于重新划分的分类,重新确定每一个分类的...
【专利技术属性】
技术研发人员:姚若楠,刘佳男,肖新光,
申请(专利权)人:安天科技集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。