恶意网页发现方法及装置制造方法及图纸

技术编号:16365725 阅读:62 留言:0更新日期:2017-10-10 21:49
本发明专利技术公开了一种恶意网页发现方法及装置,所述方法包括:确定每个预先选取的低可信度用户的网页资源访问集合;从确定的访问集合中确定出所有低可信度用户的网页资源访问交集;对所述访问交集中网页资源进行恶意网页检测,根据检测结果,确定恶意网页。本发明专利技术有效地解决现有恶意网页分类技术易漏判、准确率低和效率低的问题。

Malicious web page discovery method and device

The invention discloses a malicious web page discovery method and device, the method includes determining each user access the collection of low credibility pre selected web resources; to determine all the low credibility \user resources from the determined access set access to the intersection; access intersection\ resources for malicious web detection, according to the the detection results, determine the malicious web page. The invention can effectively solve the existing malicious web page classification technology missing, low accuracy and low efficiency problems.

【技术实现步骤摘要】
恶意网页发现方法及装置
本专利技术涉及网络安全
,特别是涉及一种恶意网页发现方法及装置。
技术介绍
为了保护用户的计算机免受恶意网站攻击,现有技术中浏览器往往采用内置恶意网址列表的方法为用户提供安全服务。这类安全服务的原理简单且易于实现,因此在工业界被广泛应用。然而,随着互联网的发展和网络攻击方式的层出不穷,这种方法逐渐面临一些新的挑战,包括:在大规模的网络数据环境下,由于恶意网址列表的更新速度远远跟不上恶意网页的更新速度,容易出现漏判的情况;随着恶意网页隐匿技术的逐步应用,恶意网页的发现难度也越来越大;由于不均衡数据集特点,少量恶意网页往往淹没在海量的正常网页中,如果对每个网页都进行分析,资源利用率将十分低下。因此,如何快速准确地从大量正常网页中筛选出新出现的恶意网页成为一个迫切需要解决的问题。而针对恶意网页分类问题,随着存储技术的不断提升,恶意网页的检测方法也不断发展。按照检测思路可以大致分为:基于黑名单的方法、基于深度包检测的方法和基于机器学习的方法等三种思路。基于黑名单的方法相对比较简单,易于实现。它首先对恶意网页URL进行标注,然后利用字符串匹配等技术恶意网页URL的本文档来自技高网...
恶意网页发现方法及装置

【技术保护点】
一种恶意网页发现方法,其特征在于,所述方法包括:确定每个预先选取的低可信度用户的网页资源访问集合;从确定的访问集合中确定出所有低可信度用户的网页资源访问交集;对所述访问交集中网页资源进行恶意网页检测,根据检测结果,确定恶意网页。

【技术特征摘要】
1.一种恶意网页发现方法,其特征在于,所述方法包括:确定每个预先选取的低可信度用户的网页资源访问集合;从确定的访问集合中确定出所有低可信度用户的网页资源访问交集;对所述访问交集中网页资源进行恶意网页检测,根据检测结果,确定恶意网页。2.如权利要求1所述的方法,其特征在于,所述确定每个预先选取的低可信度用户的网页资源访问集合,包括:从访问日志中提取用户与网页资源之间访问关系;根据所述访问关系,确定每个预先选取的低可信度用户的网页资源访问集合。3.如权利要求1所述的方法,其特征在于,所述对所述访问交集中网页资源进行恶意网页检测,包括:根据预先获取的非恶意网页资源,对所述访问交集中网页资源进行过滤;对过滤后的网页资源进行恶意网页检测。4.如权利要求1-3中任意一项所述的方法,其特征在于,所述确定每个预先选取的低可信度用户的网页资源访问集合之前,还包括:对访问种子的各用户进行用户行为可信度计算;所述种子为预先获得的恶意网页集合;根据计算结果,按照从小到大的顺序,从最低用户行为可信度开始,选取预设数量的低可信度用户。5.如权利要求4所述的方法,其特征在于,所述用户行为可信度的计算方式包括:在预设的计算时间区间确定用户访问网页资源的访问次数;根据每次访问的网页资源对应的网页类型,确定每次访问评价值;根据各访问评价值和访问次数,确定用户行为可信度。...

【专利技术属性】
技术研发人员:李鹏霄杜翠兰任彦刘晓辉易立钮艳佟玲玲张鹏陈志鹏
申请(专利权)人:国家计算机网络与信息安全管理中心中国科学院信息工程研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1