一种基于语境分析的Web攻击检测方法技术

技术编号：28036239 阅读：36 留言：0更新日期：2021-04-09 23:18

本发明专利技术涉及一种基于语境分析的Web攻击检测方法，所述Web攻击检测方法包括：数据预处理步骤：根据Esprima对JavaScript代码的词法进行解析和语法分析，得到抽象语法树，并将每一行作为一个语法单元，进而将一个JavaScript代码文件解析成语法单元序列；特征提取步骤：使用动态词嵌入模型得到语法单元序列的语境表征，转换为具有真实上下文信息的动态词向量；对象分类步骤：根据TextCNN模型进行对语法单元进行分类。本发明专利技术的优点在于：充分利用代码信息，获取源代码解析成语法单元序列的详细信息。现有的技术只是提取代码的节点信息，但本发明专利技术充分利用了代码信息，可以获得较好的检测效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于语境分析的Web攻击检测方法
本专利技术涉及网络监测
，尤其涉及一种基于语境分析的Web攻击检测方法。
技术介绍
随着互联网对我们生活的不断渗透，人们已经越来越习惯于使用Web网站与Web应用，通过Web浏览新闻、消费购物、传递信息等等。这样的变化在是我们的生活更加方便的同时也带来了信息安全的隐患：某些攻击者在不法利益的驱使下，将攻击目标转向了Web网站。据Symantec信息安全公司发布的《2019年网络安全报告》显示，全球每天有数万网站受到黑客攻击，而JavaScript(JS)作为web开发中占据统治地位的编程语言，绝大多数的web攻击都是利用JS发起的。此外，越来越多的恶意JS代码使用了混淆技术以逃避检测。因此，如何高效检测出恶意JavaScript代码是预防web攻击的必要途径。目前已有大量相关研究工作对JS代码进行检测分析来解决web安全中的恶意代码问题。现有的检测方法可以分为两类：基于代码内容和结构的静态分析；基于执行结果的动态分析。与静态分析相比，动态分析方法往往需要更多的资源和执行时间。然而现有的静态分析方法都是基于静态词嵌入的语义分析，代码的二义性得不到解决，进而不能有效监测混淆代码。如基于语义分析的恶意JS代码检测方法(DOI：10.1016/J.COSE.2020.101764)和基于段落向量的恶意JS代码检测方法(DOI：10.1016/j.asoc.2019.105721)等。但是无论是基于语义分析还是段落向量的检测方法，都只利用代码的语义信息并使用静态词嵌入技术，不...

【技术保护点】
1.一种基于语境分析的Web攻击检测方法，其特征在于：所述Web攻击检测方法包括：/n数据预处理步骤：根据Esprima对JavaScript代码的词法进行解析和语法分析，得到抽象语法树，并将每一行作为一个语法单元，进而将一个JavaScript代码文件解析成语法单元序列；/n特征提取步骤：使用动态词嵌入模型得到语法单元序列的语境表征，转换为具有真实上下文信息的动态词向量；/n对象分类步骤：根据TextCNN模型进行对语法单元进行分类。/n

【技术特征摘要】
1.一种基于语境分析的Web攻击检测方法，其特征在于：所述Web攻击检测方法包括：
数据预处理步骤：根据Esprima对JavaScript代码的词法进行解析和语法分析，得到抽象语法树，并将每一行作为一个语法单元，进而将一个JavaScript代码文件解析成语法单元序列；
特征提取步骤：使用动态词嵌入模型得到语法单元序列的语境表征，转换为具有真实上下文信息的动态词向量；
对象分类步骤：根据TextCNN模型进行对语法单元进行分类。

2.根据权利要求1所述的一种基于语境分析的Web攻击检测方法，其特征在于：所述动态词嵌入模型由Word2Vec和两个双向长短期记忆循环神经网络组成，语法单元序列通过Word2Vec转换为静态词向量并将其输入到长短期记忆循环神经网络中，转换为具有真实上下文信息的动态词向量。

3.根据权利要求2所述的一种基于语境分析的Web攻击检测方法，其特征在于：所述特征提取步骤具体包括：
将语法单元序列(u1,u2,…,uN)中每一个语法单...

【专利技术属性】
技术研发人员：李涛，黄云华，李贝贝，兰小龙，王运鹏，
申请(专利权)人：四川大学，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人