钓鱼网站使用者信息的追溯方法、控制器和介质技术

技术编号:19866205 阅读:123 留言:0更新日期:2018-12-22 13:52
本发明专利技术涉及一种钓鱼网站使用者信息的追溯方法、控制器和介质,所述方法包括:获取预设数量的钓鱼网站访问数据并进行分组;以所述访问数据所划分的每个组作为节点,访问数据之间的访问关系作为边构造网络图;对所构造的网络图进行处理,去除干扰项,获取待分析的访问数据信息;根据所述待分析的访问数据信息追溯钓鱼网站使用者信息。本发明专利技术所述方法能够准确高效地追溯钓鱼网站使用者信息,具有通用性。

【技术实现步骤摘要】
钓鱼网站使用者信息的追溯方法、控制器和介质
本专利技术涉及计算机信息安全处理
,尤其涉及一种钓鱼网站使用者信息的追溯方法、控制器和介质。
技术介绍
钓鱼网站是指伪装成银行及电子商务,窃取用户提交的银行帐号、密码等私密信息的网站,危害计算机信息安全,现有技术中通常采用以下几种方式来追溯钓鱼网站使用者信息:(1)通过获取钓鱼网站域名的注册信息来追溯钓鱼网站使用者信息:该方法通过钓鱼网站的域名注册信息,尝试获取域名的注册人名、注册电话、注册邮箱等相关信息。但是,钓鱼网站的使用者通常并不使用自己的个人信息进行域名注册,而是通过向第三方购买大量域名架设钓鱼服务用于钓鱼行骗;且目前大量的域名注册机构提供隐私保护服务,很难通过公开渠道获取到真实有效的钓鱼域名注册人信息。(2)通过获取钓鱼网站服务器ip来追溯钓鱼网站使用者信息:该方法通过钓鱼网站获取到网站的服务器ip地址,并尝试获取拥有服务器权限的人员信息。但是,钓鱼网站架设在短时间租赁的服务器上,无法通过公开渠道获取服务器的租赁人信息;此外,租赁服务器在很多情况下也是第三方中间人进行,并不是使用钓鱼网站进行行骗的人员,该方法成功率不高。(3)通过钓鱼网站后台的访问行为来追溯钓鱼网站使用者信息:该方法通过获取钓鱼网站的后台登录行为,来发现钓鱼网站使用者的行为信息。该方法相对前两种更为直接,但需要掌握钓鱼网站的后台路径;此外,对于并不存在后台页面的钓鱼网站,该方法并不适用,存在一定的局限性。由此可知,现有的钓鱼网站使用者信息的追溯方法效率低、准确性差且通用性差,因此,如何提高钓鱼网站使用者信息的追溯方法的效率、准确性和通用性成为亟待解决的技术问题。
技术实现思路
本专利技术所要解决的技术问题在于,提供一种钓鱼网站使用者信息的追溯方法、控制器和介质,能够准确高效地追溯钓鱼网站使用者信息,具有通用性。为了解决上述技术问题,本专利技术提供了一种钓鱼网站使用者信息的追溯方法,包括以下步骤:获取预设数量的钓鱼网站访问数据并进行分组;以所述访问数据所划分的每个组作为节点,访问数据之间的访问关系作为边构造网络图;对所构造的网络图进行处理,去除干扰项,获取待分析的访问数据信息;根据所述待分析的访问数据信息追溯钓鱼网站使用者信息。进一步的,所述获取预设数量的钓鱼网站访问数据并进行分组包括以下步骤:获取预设数量的钓鱼域名和访问源ip,分别对所获取的钓鱼域名和访问源ip进行分组。进一步的,所述对所获取的钓鱼域名信息进行分组包括以下步骤:对所有钓鱼域名每两个为一组进行相似度计算;将相似度大于相似度阈值的钓鱼域名划分为一组。进一步的,所述对访问源ip进行分组包括以下步骤;按照访问源ip的类型,以最小单位为ipC类段对访问源ip进行聚合分组,其中,访问源ip的类型包括普通宽带宽带ip、IDC机房ip和基站ip。进一步的,所述对所构造的网络图进行处理,去除干扰项,获取待分析的访问数据信息,包括以下步骤:去除访问源ip为IDC机房ip对应的节点,以及该节点所连的边;去除访问k个以下钓鱼域名的访问源ip对应的边;去除被m个以上访问源ip访问钓鱼域名对应的节点,以及该节点所连的边;去除访问了n个以上的钓鱼域名访问源ip对应的节点,以及该节点所连的边,其中,k、m、n均为正整数,k表示第一判断阈值,m表示第二判断阈值,n表示第三判断阈值。进一步的,所述对所构造的网络图进行处理,去除干扰项之后,所述方法还包括:设定访问阈值,获取去除干扰项后,访问钓鱼域名超过所述访问阈值的访问源ip集合。进一步的,所述获取待分析的访问数据信息包括以下步骤:判断访问源ip的类型,选取类型为基站ip的访问源ip以及其关联的钓鱼域名。进一步的,所述根据所述待分析的访问数据信息追溯钓鱼网站使用者信息,包括以下步骤:根据所选取的类型为基站ip的访问源ip和其关联的钓鱼域名,关联出该钓鱼域名的访问记录信息,所述访问记录信息包括时间信息、访问源ip和访问域名信息;结合该钓鱼域名的访问记录相关的运营商数据,获取疑似钓鱼网站的使用者所使用的上网卡或物联网卡号码,以及上网设备所连接的基站位置信息;根据疑似使用者所使用的上网卡或物联网卡号码,或者所述基站位置信息追溯钓鱼网站使用者信息;其中,所述运营商数据包括上网日志留存数据和基站位置数据。根据本专利技术又一方面,提供一种控制器,其包括存储器与处理器,所述存储器存储有计算机程序,所述程序在被所述处理器执行时能够实现所述方法的步骤。根据本专利技术又一方面,提供一种计算机可读存储介质,用于存储计算机程序,所述程序在由一计算机或处理器执行时实现所述方法的步骤。本专利技术与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本专利技术一种钓鱼网站使用者信息的追溯方法、控制器和介质可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有下列优点:本专利技术通过抽样或者全量的钓鱼网站域名访问数据,以及访问源ip的类型属性,即可分析得到高度疑似钓鱼网站使用者的网络行为,进而结合运营商的相关信息,得到钓鱼网站使用者所使用的上网卡号码或者物联网卡号码,甚至可以通过相关信息得到上网设备所连接的基站位置信息,从而支撑对钓鱼网站使用者的溯源分析。本专利技术直接针对是钓鱼网站的使用者,而不是钓鱼网站域名和服务器的注册和租赁者,可直接有效的发现利用钓鱼网站进行行骗的人员的行为,从而准确、高效地追溯钓鱼网站使用者信息。此外,本专利技术无需钓鱼网站域名的注册信息以及网站服务器的租赁信息,也不需要预先知掌握各类钓鱼网站的后台路径,对于无后台页面的钓鱼网站的使用者发现也适用,具有通用性。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。附图说明图1为本专利技术一实施例提供钓鱼网站使用者信息的追溯方法示意图;图2为本专利技术一实施例对网络图进行处理,去除干扰项示意图。具体实施方式为更进一步阐述本专利技术为达成预定专利技术目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本专利技术提出的一种钓鱼网站使用者信息的追溯方法、控制器和介质的具体实施方式及其功效,详细说明如后。钓鱼网站域名的访问者通常分为三类,钓鱼网站的使用者,普通受害用户以及安全厂商的反钓鱼平台,三者访问者访问钓鱼网站域名的规律具有明显的差异性。钓鱼网站的使用者(即使用钓鱼网站来进行违法活动的人或单位)在钓鱼网站的架设初期以及钓鱼网站使用的过程中,通常需要获取自己掌握的钓鱼网站(往往是非常相似的多个钓鱼域名)上骗取的受害用户信息,并随时判断其掌握的网站、域名的可用性,因此会间歇性地对钓鱼网站的域名发起访问行为。此外,钓鱼网站的使用者通常采用上网卡、物联网卡等移动上网方式来访问钓鱼网站,进而期望通过NAT后的动态ip尝试隐藏自身。普通受害用户通常只有少量的机会接触和访问到少量的钓鱼域名。安全厂商的反钓鱼平台通常使用相对固定的ip地址段,如部分IDC机房ip访问大量的钓鱼域名,且安全厂商的反钓鱼平台所访问的钓鱼域名是多个钓鱼网站使用者所持有的钓鱼网站的总和。基于上述分析,本专利技术实施例提供一种钓鱼网站使用者信息的追溯方法,如图1所示,包括以下步本文档来自技高网
...

【技术保护点】
1.一种钓鱼网站使用者信息的追溯方法,其特征在于:包括以下步骤:获取预设数量的钓鱼网站访问数据并进行分组;以所述访问数据所划分的每个组作为节点,访问数据之间的访问关系作为边构造网络图;对所构造的网络图进行处理,去除干扰项,获取待分析的访问数据信息;根据所述待分析的访问数据信息追溯钓鱼网站使用者信息。

【技术特征摘要】
1.一种钓鱼网站使用者信息的追溯方法,其特征在于:包括以下步骤:获取预设数量的钓鱼网站访问数据并进行分组;以所述访问数据所划分的每个组作为节点,访问数据之间的访问关系作为边构造网络图;对所构造的网络图进行处理,去除干扰项,获取待分析的访问数据信息;根据所述待分析的访问数据信息追溯钓鱼网站使用者信息。2.根据权利要求1所述的钓鱼网站使用者信息的追溯方法,其特征在于:所述获取预设数量的钓鱼网站访问数据并进行分组包括以下步骤:获取预设数量的钓鱼域名和访问源ip,分别对所获取的钓鱼域名和访问源ip进行分组。3.根据权利要求2所述的钓鱼网站使用者信息的追溯方法,其特征在于:所述对所获取的钓鱼域名信息进行分组包括以下步骤:对所有钓鱼域名每两个为一组进行相似度计算;将相似度大于相似度阈值的钓鱼域名划分为一组。4.根据权利要求2所述的钓鱼网站使用者信息的追溯方法,其特征在于:所述对访问源ip进行分组包括以下步骤;按照访问源ip的类型,以最小单位为ipC类段对访问源ip进行聚合分组,其中,访问源ip的类型包括普通宽带宽带ip、IDC机房ip和基站ip。5.根据权利要求4所述的钓鱼网站使用者信息的追溯方法,其特征在于:所述对所构造的网络图进行处理,去除干扰项,获取待分析的访问数据信息,包括以下步骤:去除访问源ip为IDC机房ip对应的节点,以及该节点所连的边;去除访问k个以下钓鱼域名的访问源ip对应的边;去除被m个以上访问源ip访问钓鱼域名对应的节点,以及该节点所连的边;去除访问了n个以上的钓鱼域名访问源ip对应的节点,以及该节点所连的边,其...

【专利技术属性】
技术研发人员:饶毓严寒冰陈曦辜乘风陈阳雷君周昊李志辉徐剑张帅吕志泉韩志辉马莉雅高川李世淙贾子骁温森浩姚力朱芸茜王小群张腾王适文肖崇蕙
申请(专利权)人:国家计算机网络与信息安全管理中心上海观安信息技术股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1