异常网页文件的识别方法及装置制造方法及图纸

技术编号：36541421 阅读：29 留言：0更新日期：2023-02-01 16:41

本公开涉及一种异常网页文件的识别方法、装置、电子设备及计算机可读介质。该方法包括：通过多个网页文件对应的访问行为建立跳转关系图和访问关系图；基于所述跳转关系图和所述访问关系图生成所述多个网页文件中每个网页文件的特征数据；将网页文件对应的特征数据输入异常网页识别模型中，生成异常概率；将异常概率大于阈值的网页文件确定为异常网页文件。本申请涉及的异常网页文件的识别方法、装置、电子设备及计算机可读介质，能够通过正常页面和异常页面访问行为上的差异来实现异常页面的检测，提高异常页面检测效率和准确度。提高异常页面检测效率和准确度。提高异常页面检测效率和准确度。

全部详细技术资料下载

【技术实现步骤摘要】
异常网页文件的识别方法及装置

[0001]本公开涉及计算机信息处理领域，具体而言，涉及一种异常网页文件的识别方法、装置、电子设备及计算机可读介质。

技术介绍

[0002]Webshell作为一种网页后门，通常是以asp、php、jsp或者cgi等网页文件形式存在的。这些异常网页文件隐藏于正常的网页文件中，攻击者可以通过浏览器或者其它客户端来访问这些后门网页文件，并且通过访问请求中所携带的参数来执行一些命令，从而可以获取web服务器的一些信息，甚至可以完全控制web服务器。
[0003]现在有两种异常网页文件的识别方法：1.主动爬取web站点内的网页，并根据网页间的链接关系建立链接关联树，如果用户请求的某个URL不存在于链接关联树中则将其判定为webshell。2.遍历web站点内的所有页面，提取出每个页面的关联信息，并用关联信息识别出无关联页面，并将其认定为 webshell页面。
[0004]但是，仅依靠爬虫难以获取一个站点内所有的页面，据此建立的链接关联树及关联关系是不完整的，容易将一些正常的页面误报为w...

【技术保护点】

【技术特征摘要】
1.一种异常网页文件的识别方法，其特征在于，包括：通过多个网页文件对应的访问行为建立跳转关系图和访问关系图；基于所述跳转关系图和所述访问关系图生成所述多个网页文件中每个网页文件的特征数据；将网页文件对应的特征数据输入异常网页识别模型中，生成异常概率；将异常概率大于阈值的网页文件确定为异常网页文件。2.如权利要求1所述的方法，其特征在于，通过多个网页文件对应的访问行为建立跳转关系图和访问关系图，包括：提取所述多个网页文件的访问行为；根据所述访问行为中原始页面、访问页面和其对应的跳转关系生成所述跳转关系图；根据所述访问行为中源IP、访问页面和其对应的访问关系生成所述访问关系图。3.如权利要求2所述的方法，其特征在于，根据所述访问行为中原始页面、跳转页面和其对应的跳转关系生成所述跳转关系图，包括：在访问行为对应的请求报文中提取referer字段；根据所述referer字段提取原始页面；将所述原始页面和所述访问页面作为顶点，将访问行为作为边；通过顶点和边的集合生成所述跳转关系图。4.如权利要求2所述的方法，其特征在于，根据所述访问行为中源IP、跳转页面和其对应的访问关系生成所述访问关系图，包括：在访问行为对应的tcp连接关系中提取所述源IP；将所述源IP和所述访问页面作为顶点，将访问行为作为边；通过顶点和边的集合生成所述访问关系图。5.如权利要求1所述的方法，其特征在于，基于所述跳转关系图和所述访问关系图生成所述多个网页文件中每个网页文件的特征数据，包括：根据所...

【专利技术属性】
技术研发人员：谭天，孙昊翔，曹浪，
申请(专利权)人：杭州迪普科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人