一种网页检测的方法及系统技术方案

技术编号:8271411 阅读:207 留言:0更新日期:2013-01-31 03:37
本发明专利技术适用于网络安全技术领域,提供了一种网页检测的方法及系统,所述方法包括:获取与网页相关的动态数据,通过相应的引擎执行所述动态数据,生成执行文本文件,提取所述执行文本文件中的关键字,将所述提取的关键字与预设的钓鱼规则库进行匹配,并根据匹配结果确定网页的安全性能。本发明专利技术实现对网页动态数据中的钓鱼信息进行有效检测,大大提高了网页检测的可靠性。

【技术实现步骤摘要】
本专利技术属于网络安全
,尤其涉及一种网页检测的方法及系统
技术介绍
随着互联网的不断发展,越来越多的人们开始在网上进行各种信息分享、娱乐、交友,使用互联网提供的各种生活便利设施如网上银行、网上缴费、网上支付等。由于用户会在网页上进行一些财产的交易或者个人的隐私信息的录入,不法分子就模拟正规的网页来骗取用户的资料或者用户的财产,一般称之为钓鱼网页。为了检测一个网页是不是钓鱼的网页,目前的检测方法简述如下提取网页里面的文本特征,然后根据预先制定好的钓鱼网页匹配规则,查看当前的页面的文本特征是否符合所在规则,如果匹配中其中的某些规则的话,就认为这个网页存在钓鱼的行为。网页的 文本特征一般是网页HTML内容里面的一些重要的标签,例如,标题部分TITLE的内容,版权部分COPYRIGHT的内容,还有就是一些HTML里面的P标签,SPAN标签等一些内容标签里面的内容。根据一定的算法提取出这些标签内容里面的关键字,将提取的关键字送到钓鱼库中去寻找匹配的规则,例如,如果当前页面中出现大量的QQ登陆的字样,但是网页的URL却不是腾讯公司的域名如qq. com、tencent. com等;如果网页的版权声明写着腾讯公司版权所有,但是网页的url也不是腾讯公司的域名;如网页内容有大量的网上支付时需要填写的用户的帐号、密码、银行名称信息,但是网页却不是该银行下所属的网页,根据上述的规则综合一个评分就判定一个网页是否是钓鱼的。现在随着网络技术的不断提高,很多的钓鱼网页不再单纯的将模拟正规网站的文字等钓鱼部分的内容放到HTML标签里面,而是通过Javascript等技术在网页的动态数据里出现,因此,现有技术的网页检测方法无法对网页动态数据中的钓鱼信息进行有效检测。
技术实现思路
本专利技术实施例的目的在于提供一种网页检测的方法及系统,旨在解决现有技术的网页检测方法无法对网页动态数据中的钓鱼信息进行有效检测的问题。本专利技术实施例是这样实现的,一种网页检测的方法,所述方法包括获取与网页相关的动态数据;通过相应的引擎执行所述动态数据,生成执行文本文件;提取所述执行文本文件中的关键字;将所述提取的关键字与预设的钓鱼规则库进行匹配,并根据匹配结果确定网页的安全性能。本专利技术实施例还提供了一种网页检测的系统,所述系统包括数据获取单元,用于获取与网页相关的动态数据;文件生成单元,用于通过相应的引擎执行所述数据获取单元获取的动态数据,生成执行文本文件;提取单元,用于提取所述文件生成单元生成的执行文本文件中的关键字;匹配单元,用于将所述提取单元提取的关键字与预设的钓鱼规则库进行匹配,并根据匹配结果确定网页的安全性能。本专利技术实施例获取与网页相关的动态数据,并通过相应的引擎执行所述动态数据,生成执行文本文件,提取所述执行文本文件中的关键字,并将所述提取的关键字与预设的钓鱼规则库进行匹配,并根据匹配结果确定网页的安全性能,实现对网页动态数据中的钓鱼信息进行有效检测,大大提高了网页检测的可靠性。附图说明图I是本专利技术实施例一提供的网页检测的方法的实现的流程图;图2是本专利技术实施例二提供的网页检测的方法的实现的流程图; 图3是本专利技术实施例三提供的网页检测的系统的结构图;图4是本专利技术实施例四提供的网页检测的系统的结构图。具体实施例方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本专利技术实施例通过获取与网页相关的动态数据,并将提取的动态数据中的关键字与预设的钓鱼规则库进行匹配,根据匹配结果确定网页的安全性能。本专利技术实施例提供了一种网页检测的方法,所述方法包括获取与网页相关的动态数据;通过相应的引擎执行所述动态数据,生成执行文本文件;提取所述执行文本文件中的关键字;将所述提取的关键字与预设的钓鱼规则库进行匹配,并根据匹配结果确定网页的安全性能。本专利技术实施例还提供了一种网页检测的系统,所述系统包括数据获取单元,用于获取与网页相关的动态数据;文件生成单元,用于通过相应的引擎执行所述数据获取单元获取的动态数据,生成执行文本文件;提取单元,用于提取所述文件生成单元生成的执行文本文件中的关键字;匹配单元,用于将所述提取单元提取的关键字与预设的钓鱼规则库进行匹配,并根据匹配结果确定网页的安全性能。本专利技术实施例获取与网页相关的动态数据,并通过相应的引擎执行所述动态数据,生成执行文本文件,提取所述执行文本文件中的关键字,并将所述提取的关键字与预设的钓鱼规则库进行匹配,并根据匹配结果确定网页的安全性能,实现对网页动态数据中的钓鱼信息进行有效检测,大大提高了网页检测的可靠性。以下结合具体实施例对本专利技术的实现进行详细描述实施例一本专利技术实施例的应用场景可以是用户上网时,可能会遇到一些比较可疑的网站,对其可靠性无法辨识,尤其,当钓鱼信息在网页中的动态部分出现时,用户更是无法对其进行辨识,而传统的检测方法只能对网页中的静态内容进行检测,因此通过对网页相关的动态数据进行检测,可以有效的对网页中动态出现的钓鱼信息进行检测,图I示出了本专利技术实施例一提供的网页检测的方法的实现的流程图,详述如下在步骤SlOl中,获取与网页相关的动态数据。在本专利技术实施例中,动态数据可以为由Javascript实现的动态数据、也可以为CSS实现的动态数据以及flash等实现的动态数据。在步骤S102中,通过相应的引擎执行上述动态数据,生成执行文本文件。在本专利技术实施例中,当获取动态数据为Javascript代码和/或外部引用的Javascript文件时,步骤S102可以通过Javascript引擎执行上述Javascript代码和/或 外部引用的Javascript文件,生成执行文本文件。在步骤S103中,提取上述执行文本文件中的关键字。在步骤S104中,将上述提取的关键字与预设的钓鱼规则库进行匹配,并根据匹配结果确定网页的安全性能。在本专利技术实施例中,上述钓鱼规则库可以预先存储多个恶意关键字,且每个关键字有不同的权重和优先级别,当在钓鱼规则库中匹配到上述提取的关键字,则根据上述关键字对应的权重和优先级别,确定提取的关键字的恶意程度,从而确定网页的安全性能,安全性能对网页安全性进行描述,根据确定提取的关键字的恶意程度不同,网页的安全性能也可以相应的包括多个级别。本专利技术实施例获取与网页相关的动态数据,并通过相应的引擎执行上述动态数据,生成执行文本文件,提取上述执行文本文件中的关键字,并将上述提取的关键字与预设的钓鱼规则库进行匹配,并根据匹配结果确定网页的安全性能,实现对网页动态数据中的钓鱼信息进行有效检测,大大提高了网页检测的可靠性。实施例二本专利技术实施例的可以是与实施例一相同的应用场景,图2示出了本专利技术实施例二提供的网页检测的方法的实现的流程图,详述如下在步骤S201中,接收用户输入的URL及URL的校验信息,校验信息包括需要校验URL的次数信息、校验URL的类型信息、校验请求的来源信息及上次校验时间信息。在本专利技术实施例中,接收用户输入的URL及URL的校验信息,可以由用户通过客户端根据用户需求推送URL到服务器进行检测验证,以满足用户的个性化需求,也可以由服务器主动对用户输入到客户端的URL进行检测,本文档来自技高网
...

【技术保护点】
一种网页检测的方法,其特征在于,所述方法包括下述步骤:获取与网页相关的动态数据;通过相应的引擎执行所述动态数据,生成执行文本文件;提取所述执行文本文件中的关键字;将所述提取的关键字与预设的钓鱼规则库进行匹配,并根据匹配结果确定网页的安全性能。

【技术特征摘要】
1.一种网页检测的方法,其特征在于,所述方法包括下述步骤 获取与网页相关的动态数据; 通过相应的引擎执行所述动态数据,生成执行文本文件; 提取所述执行文本文件中的关键字; 将所述提取的关键字与预设的钓鱼规则库进行匹配,并根据匹配结果确定网页的安全性能。2.如权利要求I所述的方法,其特征在于,所述获动态数据为Javascript代码和/或外部引用的Javascript文件; 所述通过相应的引擎执行所述动态数据,生成执行文本文件的步骤具体为 通过Javascript引擎执行所述Javascript代码和/或外部引用的Javascript文件,生成执行文本文件。3.如权利要求2所述的方法,其特征在于,所述获取与网页相关的Javascript代码和/或外部引用的Javascript文件的步骤具体为 接收用户输入的URL; 下载与所述URL对应的HTLM文件; 提取内嵌在HTML文件中的Javascript代码和/或外部引用的Javascript文件,并且当提取了外部引用的Javascript文件时,并发下载外部引用的Javascript文件。4.如权利要求3所述的方法,其特征在于,所述将所述提取的关键字与预设的钓鱼规则库进行匹配,并根据匹配结果确定网页的安全性能的步骤之后,所述方法还包括下述步骤 存储所述URL及与所述URL对应的网页的安全性能; 所述接收用户输入的URL的步骤之后,所述方法还包括下述步骤 判断所述接收到的URL是否已在本地存储; 当判断本地已存储所述接收的URL时,则输出所述URL对应的网页的安全性能的提示信息。5.如权利要求3所述的方法,其特征在于,所述接收用户输入的URL的同时,还接收URL的校验信息,所述校验信息包括需要校验URL的次数信息、校验URL的类型信息、校验请求的来源信息及上次校验时间信息; 所述接收用户输入的URL的步骤之后,所述方法还包括下述步骤 根据所述校验信息中的各个信息的权重,计算所述URL的优先级; 所述下载与所述URL对应的HTLM文件的步骤具体为 按URL的优先级由高到低,下载与所述URL对应的HTLM文件。6.如权利要求3所述的方法,其特征在于,所述接收用户输入的URL的步骤之后,所述方法还包括 缓存所述接收的URL。7.如权利要求3所述的方法,其特征在于,所述通过Javascript引擎执行所述Javascript代码和/或外部引用的Javascript文件,生成执行文本文件的步骤具体为 按照在HTML文件中出现的顺序,对所述Javascript代码和/或外部引用的Javascript文件进行排序;解析所述HTML文件中的文档对象模型DOM信息; 根据所述解析的DOM信息,通过Javascript引擎执行所述Javascript代码和/或外部引用的Javascript文件,生成执行文本文件。8.如权利要求3所述的方法,...

【专利技术属性】
技术研发人员:邵付东
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1