一种基于抽象语法树的XSS对抗攻击检测方法及模型技术

技术编号：35690892 阅读：9 留言：0更新日期：2022-11-23 14:39

本发明专利技术涉及一种基于抽象语法树的XSS对抗攻击检测方法及模型，包括请求预处理模块、抽象语法树处理模块、分词处理和词向量化模块以及XSS分类器模块，能够检测出攻击者使用绕过方法构造的XSS对抗样本，弥补了现有模型无法精准检测XSS对抗样本的缺陷，提高了Web应用系统的安全性，通过预处理，删除样本中无意义的字符串，然后通过抽象语法树找出样本中HTML部分和JavaScript部分，再使用训练过的XSS分类器对样本进行分类，从而精准识别出攻击者使用绕过方法构造的XSS对抗样本，提高WEB应用系统的安全性。本发明专利技术还进一步在两种对抗样本数据集上进行验证，结果表明，本发明专利技术所提方法对XSS对抗样本的检测率高达98.2％和99.8％，使得XSS对抗样本的绕过率低至1.8％和0.2％。XSS对抗样本的绕过率低至1.8％和0.2％。XSS对抗样本的绕过率低至1.8％和0.2％。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于抽象语法树的XSS对抗攻击检测方法及模型

[0001]本专利技术涉及一种基于抽象语法树的XSS对抗攻击检测方法及模型，属于网络安全防御

技术介绍

[0002]XSS攻击的全称是跨站脚本攻击(Cross Site Scripting)，该攻击方法将恶意代码注入到浏览器页面，诱使用户执行该恶意代码。执行后，攻击者可以访问浏览器保存的任何敏感信息，导致用户的敏感信息泄露，威胁WEB应用程序的安全，以达到攻击目的。
[0003]目前的XSS攻击检测模型主要基于深度学习，具有很高的检测率，但忽略了检测模型本身的安全性。攻击者会通过构造XSS对抗样本，绕过模型检测，攻击WEB应用程序。现有检测模型会被攻击者误导，从而将XSS对抗样本分类为正常样本，导致模型对XSS对抗样本的检测率较低。
[0004]针对上述问题，本专利技术提出一种基于抽象语法树的XSS对抗攻击检测方法及模型。能够检测出攻击者使用绕过方法构造的XSS对抗样本，检测率达98％以上，弥补了现有模型无法精准检测XSS对抗样本的缺陷。本专利技术首先通过预处理，删除样本中无意义的字符串，然后通过抽象语法树找出样本中HTML部分和JavaScript部分，再使用训练过的XSS分类器对样本进行分类，从而精准识别出攻击者使用绕过方法构造的XSS对抗样本，提高WEB应用系统的安全性。本专利技术还进一步在两种对抗样本数据集上进行验证，结果表明，本专利技术所提方法对XSS对抗样本的检测率高达98.2％和99.8％，使得XSS对抗样本的绕过率低至1.8％...

【技术保护点】

【技术特征摘要】
1.一种基于抽象语法树的XSS对抗攻击检测模型，其特征在于：包括请求预处理模块：用于处理用户请求，得到请求参数，用户访问WEB页面时，模型获取到用户访问请求，对访问请求进行预处理，根据请求传输方式选择解析大文件传输请求、解析分块传输请求或解析HTTPpipeline请求，得到请求参数；抽象语法树处理模块：用于处理请求预处理模块得到的请求参数，将请求参数中的HTML部分解析为HTML抽象语法树，将请求参数中的JavaScript部分解析为JavaScript抽象语法树，后将抽象语法树中的无效数据移除后，重新构建为HTML和JavaScript，得到抽象语法树处理后的简化参数；分词处理和词向量化模块：用于对抽象语法树处理后的简化参数进行分词处理，得到分词序列，利用Word2vec把该分词序列映射为词向量矩阵；以及XSS分类器模块：用于判断请求是否为正常请求，将分词处理和词向量化模块得到的词向量矩阵作为分类器的输入，然后输出分类结果，即是否为正常请求。2.一种根据权利要求1所述的基于抽象语法树的XSS对抗攻击检测模型的检测方法，其特征在于：包括以下步骤：步骤一、请求预处理：对用户访问请求进行预处理，得到具体执行的请求参数；步骤二、抽象语法树处理：将步骤一中所提取的参数中HTML部分解析为HTML抽象语法树，将参数中的JavaScript部分解析为JavaScript抽象语法树，并将语法树中的无效数据移除，重新构建为HTML和JavaScript，最后得到简化后的参数；步骤三、分词处理和词向量化：对上述抽象语法树处理后的简化参数进行分词处理，得到分词序列，利用Word2vec把该分词序列映射为词向量矩阵；步骤四、XSS攻击分类器分类：对步骤三得到的词向量矩阵P
m
×
k
进行分类，判断其是否为正常请求。3.根据权利要求2所述的一种基于抽象语法树的XSS对抗攻击的检测方法，其特征在于：所述步骤二具体包括：步骤2.1：将步骤一中所提取的参数中的HTML部分进行URL解码，得到实际请求参数；步骤2.2：使用解析器，对实际请求参数进行解析，得到HTML抽象语法树；步骤2.3：对HTML抽象语法树进行遍历，找到其具体执行的Java...

【专利技术属性】
技术研发人员：王秋华，李逸佳，李成煜，吴国华，王烨茹，张祯，袁理锋，任一支，王冬，
申请(专利权)人：杭州电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人