网站识别方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:32358831 阅读:17 留言:0更新日期:2022-02-20 03:23
本申请涉及一种网站识别方法、装置、计算机设备和存储介质。所述方法包括:加载待检测网页,获得所述待检测网页的请求发起程序链;将所述待检测网页的请求发起程序链与预设恶意资源数据库所包含的恶意子资源的资源链接进行比对,得到比对结果;在所述比对结果满足恶意网址判断条件的情况下,确定所述待检测网页为恶意网页。本实施例通过加载待检测网页的请求发起程序链,可以对各网页的请求发起程序链之间进行比对,确定该检测网页是否为恶意网页,可以有效提高恶意网站识别的效率与准确度,不依赖于人工识别,并可以有效解决相关技术中由于人工识别产生的误报或漏报问题。术中由于人工识别产生的误报或漏报问题。术中由于人工识别产生的误报或漏报问题。

【技术实现步骤摘要】
网站识别方法、装置、计算机设备和存储介质


[0001]本申请涉及网络安全
,特别是涉及一种网站识别方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着互联网技术的快速发展,互联网已经深入到社会生活的方方面面,比如,人们可以通过互联网下载各类资料、进行网络购物等。网址是用户访问网络资源的入口,近年来,出现了将各类钓鱼网站模仿正常网站盗取用户账号和密码、传播恶意信息等恶意行为,因此,识别恶意网站的方法受到了广泛关注。
[0003]相关技术中,一般是对待检测的网页内容进行特征提取,将提取出的特征与恶意特征模型进行匹配,在特征能够匹配成功的情况下,确定待检测的网页为恶意网页。这样,可以实现对恶意网站的识别,其中,待检测的网页内容可以包括该网页的标题、META标签以及网页的正文等。恶意特征模型可以包括人工编写的恶意特征模型或者是通过机器学习算法生成的恶意特征模型。
[0004]但是,合法网站中也可以能会包括上述恶意特征模型中的某些特征,此时,会存在恶意网站误报或者漏报的问题,导致识别恶意网站准确率变低。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种能够解决误报或漏报问题的网站识别方法、装置、计算机设备和存储介质。
[0006]第一方面,本专利技术实施例提供了一种网站识别方法,所述方法包括:
[0007]通过加载待检测网页,获得所述待检测网页的请求发起程序链,所述请求发起程序链包括树状结构的资源链接,每个资源链接用于表示所述待检测网页中一个子资源的访问链接;
[0008]将所述待检测网页的请求发起程序链与预设恶意资源数据库所包含的恶意子资源的资源链接进行比对,得到比对结果;
[0009]在所述比对结果满足恶意网址判断条件的情况下,确定所述待检测网页为恶意网页。
[0010]在其中一个实施例中,所述在所述比对结果满足恶意网址判断条件的情况下,确定所述待检测网页为恶意网页,包括:
[0011]如果在所述待检测网页的请求发起程序链包含的各资源链接中,存在与恶意子资源的资源链接相同的资源链接,则确定所述待检测网页为恶意网页。
[0012]在其中一个实施例中,通过如下方法预先构建恶意资源数据库,具体包括:
[0013]通过加载样本网页,得到所述样本网页的请求发起程序链以及所述样本网页中包含的多个子资源的资源信息;
[0014]根据所述多个子资源的资源信息,在所述样本网页包含的多个子资源中,确定恶
意子资源;
[0015]将所述恶意子资源的资源链接,以及所述恶意子资源的资源链接的关联资源链接均标记为恶意资源链接,并将所述恶意资源链接以及所述恶意资源链接的资源信息添加至预设恶意资源数据库。
[0016]在其中一个实施例中,所述在所述样本网页包含的多个子资源中,确定恶意子资源,包括:
[0017]响应于对所述子资源的选中操作,从所述多个子资源中确定恶意子资源,所述选中操作是根据所述多个子资源的资源信息确定的;和/或,
[0018]通过预设恶意资源判断规则,根据所述多个子资源的资源信息,从所述多个子资源中确定恶意子资源;和/或,
[0019]将所述多个子资源的资源信息输入至预设恶意资源判断模型,得到所述预设恶意资源判断模型的输出结果,根据所述输出结果,从所述多个子资源中确定恶意子资源。
[0020]在其中一个实施例中,在所述将所述恶意子资源的资源链接,以及所述恶意子资源的资源链接的关联资源链接均标记为恶意资源链接的步骤之前,所述方法还包括:
[0021]以所述恶意子资源的资源链接对应的节点为第一顶点,以所述树状结构的请求发起程序链的根节点为第二顶点,根据所述第二顶点在所述树状结构中访问所述第一顶点的访问路径,确定所述第一顶点与所述第二顶点之间的关联链路,所述树状结构的请求发起程序链是根据所述请求发起程序链中包含的各个资源链接之间的访问路径生成的;
[0022]将所述关联链路上所包含的每一节点对应的资源链接,均标记为所述恶意子资源的资源链接的关联资源链接。
[0023]在其中一个实施例中,所述方法还包括:
[0024]显示任务列表界面,所述任务列表界面包括多条任务记录的标识;
[0025]响应于对所述任务记录的标识的选中操作,获取所述任务记录的标识对应待检测网页的链接;
[0026]所述通过加载待检测网页,获得所述待检测网页的请求发起程序链,包括:
[0027]根据所述待检测网页的链接,通过预设浏览器加载所述待检测网页,获得所述待检测网页的请求发起程序链。
[0028]在其中一个实施例中,所述方法还包括:
[0029]根据所述任务记录的类型,确定所述预设浏览器的访问环境;
[0030]基于所述预设浏览器的访问环境,执行所述通过预设浏览器加载待检测网页,得到所述待检测网页的请求发起程序链的步骤。
[0031]在其中一个实施例中,所述根据所述任务记录的类型,确定所述预设浏览器的访问环境,包括:
[0032]根据预先配置的任务类型与代理配置的对应关系,确定所述任务记录的类型对应的目标代理配置类型;
[0033]根据预先配置的任务类型与请求头配置的对应关系,确定所述目标类型对应的目标请求头配置类型;
[0034]根据所述目标代理配置类型以及目标请求头配置类型,构建所述任务记录对应的预设浏览器的访问环境。
[0035]第二方面,本专利技术实施例提供了一种网站识别装置,所述装置包括:
[0036]加载模块,用于通过加载待检测网页,获得所述待检测网页的请求发起程序链,所述请求发起程序链包括树状结构的资源链接,每个资源链接用于表示所述待检测网页中一个子资源的访问链接;
[0037]比对模块,用于将所述待检测网页的请求发起程序链与预设恶意资源数据库所包含的恶意子资源的资源链接进行比对,得到比对结果;
[0038]确定模块,用于在所述比对结果满足恶意网址判断条件的情况下,确定所述待检测网页为恶意网页。
[0039]在其中一个实施例中,所述确定模块,具体用于:如果在所述待检测网页的请求发起程序链包含的各资源链接中,存在与恶意子资源的资源链接相同的资源链接,则确定所述待检测网页为恶意网页。
[0040]在其中一个实施例中,所述装置还包括:
[0041]样本网页加载模块,用于通过加载样本网页,得到所述样本网页的请求发起程序链以及所述样本网页中包含的多个子资源的资源信息;
[0042]恶意子资源确定模块,用于根据所述多个子资源的资源信息,在所述样本网页包含的多个子资源中,确定恶意子资源;
[0043]添加模块,用于将所述恶意子资源的资源链接,以及所述恶意子资源的资源链接的关联资源链接均标记为恶意资源链接,并将所述恶意资源链接以及所述恶意资源链接的资源信息添加至预设恶意资源数据库。
[0044]在其中一个实施例中,所述恶意子资源确定模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种网站识别方法,其特征在于,所述方法包括:通过加载待检测网页,获得所述待检测网页的请求发起程序链,所述请求发起程序链包括树状结构的资源链接,每个资源链接用于表示所述待检测网页中一个子资源的访问链接;将所述待检测网页的请求发起程序链与预设恶意资源数据库所包含的恶意子资源的资源链接进行比对,得到比对结果;在所述比对结果满足恶意网址判断条件的情况下,确定所述待检测网页为恶意网页。2.根据权利要求1所述的方法,其特征在于,所述在所述比对结果满足恶意网址判断条件的情况下,确定所述待检测网页为恶意网页,包括:如果在所述待检测网页的请求发起程序链包含的各资源链接中,存在与恶意子资源的资源链接相同的资源链接,则确定所述待检测网页为恶意网页。3.根据权利要求1所述的方法,其特征在于,通过如下方法预先构建恶意资源数据库,具体包括:通过加载样本网页,得到所述样本网页的请求发起程序链以及所述样本网页中包含的多个子资源的资源信息;根据所述多个子资源的资源信息,在所述样本网页包含的多个子资源中,确定恶意子资源;将所述恶意子资源的资源链接,以及所述恶意子资源的资源链接的关联资源链接均标记为恶意资源链接,并将所述恶意资源链接以及所述恶意资源链接的资源信息添加至预设恶意资源数据库。4.根据权利要求3所述的方法,其特征在于,所述在所述样本网页包含的多个子资源中,确定恶意子资源,包括:响应于对所述子资源的选中操作,从所述多个子资源中确定恶意子资源,所述选中操作是根据所述多个子资源的资源信息确定的;和/或,通过预设恶意资源判断规则,根据所述多个子资源的资源信息,从所述多个子资源中确定恶意子资源;和/或,将所述多个子资源的资源信息输入至预设恶意资源判断模型,得到所述预设恶意资源判断模型的输出结果,根据所述输出结果,从所述多个子资源中确定恶意子资源。5.根据权利要求3所述的方法,其特征在于,在所述将所述恶意子资源的资源链接,以及所述恶意子资源的资源链接的关联资源链接均标记为恶意资源链接的步骤之前,所述方法还包括:以所述恶意子资源的资源链接对应的节点为第一顶点,以所述树状结构的请求发起程序链的根节点为第二顶点,根据所述第二顶点在所述树状结构中访问所述第一顶点的访问路径,确定所述第一顶点与所述第二顶点之间的关...

【专利技术属性】
技术研发人员:万仁国
申请(专利权)人:网神信息技术北京股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1