网页后门的检测方法、装置和计算机设备制造方法及图纸

技术编号：22102134 阅读：29 留言：0更新日期：2019-09-14 03:24

本申请提出了一种网页后门的检测方法、装置和计算机设备，其中，上述网页后门的检测方法包括：获取待检测文件；从所述待检测文件的源文件中提取操作码；从所述操作码中提取N元模型特征，以所述N元模型特征作为所述操作码的特征向量；将所述操作码的特征向量输入预先训练的卷积神经网络模型进行分类，获得所述待检测文件是否包括网页后门的分类结果。本申请可以通过卷积神经网络对网页后门进行检测，提高网页后门检测的准确度，并且实现简单，对系统性能的影响较小。

Inspection methods, devices and computer equipment for back doors of web pages

全部详细技术资料下载

【技术实现步骤摘要】
网页后门的检测方法、装置和计算机设备
本申请涉及网络安全
，尤其涉及一种网页后门的检测方法、装置和计算机设备。
技术介绍
Web，全名WorldWideWeb，即全球广域网，通俗称呼为网站，是一种基于超文本和超文本传输协议(HyperTextTransferProtocol；以下简称：HTTP)的、全球性的、动态交互的、跨平台的分布式图形信息系统。WebShell就是以动态服务器页面(ActiveServerPages；以下简称：ASP)、超文本预处理器(HypertextPreprocessor；以下简称：PHP)、Java服务器页面(JavaServerPages；以下简称：JSP)或者公共网关接口(CommonGatewayInterface；以下简称：CGI)等网页文件形式存在的一种命令执行环境，也可以将其称作为一种网页后门。现有相关技术中，通常采用静态检测方案、动态检测方案、日志分析方案和统计学分析方案对Webshell进行检测，由于业务系统更新频繁，Web脚本文件相关的属性经常发生变化，所以偏重于文件属性检测的方法往往会产生更多的误报。基于动态行为检测的方法往往技术难度较大，难以实现，而且对系统造成的性能影响较大，甚至可能对系统稳定性造成影响。基于日志的检测方法，一方面由于业务功能较多且复杂，部分功能可能很少会被用到，其日志访问可能会命中某些检测规则，从而造成更多的误报，另一方面大量的日志记录处理起来会对服务器性能产生负担，而且由于日志量巨大检测过程消耗时间长，检测速度较慢。而窃密型WebShell后门往往会模拟正常的数据库操作，...

【技术保护点】
1.一种网页后门的检测方法，其特征在于，包括：获取待检测文件；从所述待检测文件的源文件中提取操作码；从所述操作码中提取N元模型特征，以所述N元模型特征作为所述操作码的特征向量；将所述操作码的特征向量输入预先训练的卷积神经网络模型进行分类，获得所述待检测文件是否包括网页后门的分类结果。

【技术特征摘要】
1.一种网页后门的检测方法，其特征在于，包括：获取待检测文件；从所述待检测文件的源文件中提取操作码；从所述操作码中提取N元模型特征，以所述N元模型特征作为所述操作码的特征向量；将所述操作码的特征向量输入预先训练的卷积神经网络模型进行分类，获得所述待检测文件是否包括网页后门的分类结果。2.根据权利要求1所述的方法，其特征在于，所述从所述待检测文件的源文件中提取操作码包括：利用所述待检测文件的源文件的解释器，将所述待检测文件的源代码转换为对应的操作码。3.根据权利要求1所述的方法，其特征在于，所述从所述操作码中提取N元模型特征包括：利用N-Gram模型从所述操作码中提取N元模型特征。4.根据权利要求1-3任意一项所述的方法，其特征在于，所述将所述操作码的特征向量输入预先训练的卷积神经网络模型进行分类，获得所述待检测文件是否包括网页后门的分类结果之前，还包括：收集预定数量的网页文件的源文件作为样本数据；对所述样本数据中属于网页后门的源文件和不属于网页后门的源文件进行标注；从标注后的样本数据中提取所述样本数据的操作码；从所述样本数据的操作码中提取N元模型特征，以提取的N元模型特征作为所述样本数据的操作码的样本特征向量；将所述样本特征向量划分为训练集和测试集；将所述训练集中的样本特征向量输入待训练的卷积神经网络模型进行训练，获得训练结果模型；将所述测试集中的样本特征向量输入所述训练结果模型进行递归训练，当所述训练结果模型输出的分类结果与所述测试集中的样本特征向量的标注信息的误差在预定范围内时，获得训练好的卷积神经网络模型，所述...

【专利技术属性】
技术研发人员：李坤，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人