一种网页后门的检测方法、装置、设备及存储介质制造方法及图纸

技术编号:19866176 阅读:32 留言:0更新日期:2018-12-22 13:51
本说明书实施例提供了一种网页后门检测方法、装置、设备及存储介质。其方法包括:获取待检测的网页文件源代码;利用预设的规则库对所述网页文件源代码进行特征匹配,得到主观特征向量;对所述网页文件源代码的属性进行统计,得到客观特征值;利用所述主观特征向量和所述客观特征值构建特征向量;利用预先建立的分类模型对所述特征向量进行分类,分类结果指示了所述网页文件源代码中是否存在网页后门,所述分类模型是由预先获取的作为特征向量样本训练得到的,所述特征向量样本的数据结构与所述特征向量的数据结构相同。

【技术实现步骤摘要】
一种网页后门的检测方法、装置、设备及存储介质
本说明书实施例涉及网络安全
,尤其涉及一种网页后门的检测方法、装置、设备及存储介质。
技术介绍
Webshell是黑客攻击目标主机的常用工具。以webshell为例,其是以asp(ActiveServerPages,动态目标主机页面)、php(HypertextPreprocessor,超文本预处理器)、jsp(JavaServerPages,Java目标主机页面)或cgi(通用网关接口)等网页文件形式存在的命令执行环境,也可以将其称为一种网页后门。传统的网页后门检测方法主要是通过对已知网页后门文件的特征做出准确描述,进而形成正则表达式,利用正则表达式进行网页后门检测。这种检测方式依赖于人工经验,其灵活性差,且漏检率较高。
技术实现思路
本说明书实施例提供及一种网页后门的检测方法、装置、设备及存储介质,较之基于正则表达式的检测方法,其实现方式简单灵活,且漏检率较低。第一方面,本说明书实施例提供一种网页后门的检测方法,该方法包括:获取待检测的网页文件源代码;利用预设的规则库对所述网页文件源代码进行特征匹配,得到主观特征向量;对所述网页文件本文档来自技高网...

【技术保护点】
1.一种网页后门的检测方法,其特征在于,包括:获取待检测的网页文件源代码;利用预设的规则库对所述网页文件源代码进行特征匹配,得到主观特征向量;对所述网页文件源代码的属性进行统计,得到客观特征值;利用所述主观特征向量和所述客观特征值构建特征向量;利用预先建立的分类模型对所述特征向量进行分类,分类结果指示了所述网页文件源代码中是否存在网页后门,所述分类模型是由预先获取的作为特征向量样本训练得到的,所述特征向量样本的数据结构与所述特征向量的数据结构相同。

【技术特征摘要】
1.一种网页后门的检测方法,其特征在于,包括:获取待检测的网页文件源代码;利用预设的规则库对所述网页文件源代码进行特征匹配,得到主观特征向量;对所述网页文件源代码的属性进行统计,得到客观特征值;利用所述主观特征向量和所述客观特征值构建特征向量;利用预先建立的分类模型对所述特征向量进行分类,分类结果指示了所述网页文件源代码中是否存在网页后门,所述分类模型是由预先获取的作为特征向量样本训练得到的,所述特征向量样本的数据结构与所述特征向量的数据结构相同。2.根据权利要求1所述的方法,其特征在于,所述规则库包括多条规则,所述利用预设的规则库对所述网页文件源代码进行特征匹配,得到主观特征向量,包括:分别利用所述规则库中的每条规则对所述网页文件源代码进行特征匹配;记录每条规则的匹配结果,匹配结果由数值表示;按照每条规则在所述规则库中的顺序对所述匹配结果进行排序,得到主观特征向量。3.根据权利要求2所述的方法,其特征在于,所述客观特征值包括以下至少一种:所述网页文件源代码的单词数,所述网页文件源代码的符号数,所述网页文件源代码的空白行数,所述网页文件源代码的压缩率,所述网页文件源代码的最长单词的字符数。4.根据权利要求3所述的方法,其特征在于,所述对所述网页文件源代码的属性进行统计之前,该方法还包括:对所述网页文件源代码进行分词处理。5.根据权利要求1~4任一项所述的方法,其特征在于,所述分类模型为随机森...

【专利技术属性】
技术研发人员:张鑫
申请(专利权)人:北京奇虎科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1