【技术实现步骤摘要】
本专利技术实施例涉及网络
,尤其涉及一种筛选网页的方法及装置。
技术介绍
随着互联网技术的不断发展,网上银行、网上缴费、网上支付等日益普遍,随之也出现了钓鱼网页,钓鱼网页是指不法分子模拟正规网页,骗取用户的个人隐私信息,或者银行的账号、密码等,从而盗取用户的资料或财产。目前,现有的筛选网页的方法通常为搜集大量用户所访问的网址,然后将这些网址按照访问次数进行排序,并最终筛选出访问量最大的作为可疑网页。但是,不法分子可以模拟出多个网址不同但内容相同的钓鱼网页,这样,仅从网页的访问量来筛选网址,可能会漏掉该钓鱼网页,无法准确的得到筛选结果。
技术实现思路
本专利技术实施例的目的是提供一种筛选网页的方法及装置,其提高筛选网页的准确度。本专利技术实施例的目的是通过以下技术方案实现的一种筛选网页的方法,包括获取用户在检测时间段内所访问的网页以及所述网页的访问量;将当前检测时间段内网页的访问量与上一检测时间段内所述网页的访问量进行比较,得到所述网页的访问量的变化率;按照网页的访问量的变化率进行排列,得到一个以上访问量的变化率高的网页。一种筛选网页的装置,包括获取单元,用于获 ...
【技术保护点】
一种筛选网页的方法,其特征在于,包括:获取用户在检测时间段内所访问的网页以及所述网页的访问量;将当前检测时间段内网页的访问量与上一检测时间段内所述网页的访问量进行比较,得到所述网页的访问量的变化率;按照网页的访问量的变化率进行排列,得到一个以上访问量的变化率高的网页。
【技术特征摘要】
1.一种筛选网页的方法,其特征在于,包括 获取用户在检测时间段内所访问的网页以及所述网页的访问量; 将当前检测时间段内网页的访问量与上ー检测时间段内所述网页的访问量进行比较,得到所述网页的访问量的变化率; 按照网页的访问量的变化率进行排列,得到ー个以上访问量的变化率高的网页。2.根据权利要求1所述的方法,其特征在于,按照网页的访问量的变化率进行排列,得到ー个以上访问量的变化率高的网页之后,所述方法还包括 获取所述网页的特征; 将所述网页的特征与特征库内包含的特征进行匹配,如果匹配,则将所述网页标识为可疑网页,如果不匹配,则在检测时间段内,不获取所述网页的访问量。3.根据权利要求1所述的方法,其特征在于,变化率公式为ArTC -—— 其中,rc表示变化率,Ar表示当前检测时间段内网页的访问量与上一检测时间段内所述网页的访问量的变化量,At表示检测时间段的时长。4.根据权利要求1所述的方法,其特征在于,所述获取用户在检测时间段内所访问的网页以及所述网页的访问量,包括 获取多个用户在检测时间段内所访问的网页以及所述网页的访问量。...
【专利技术属性】
技术研发人员:苏国立,刘松,陶思南,邵付东,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。