基于机器学习的XSS攻击检测方法技术

技术编号：31797964 阅读：63 留言：0更新日期：2022-01-08 10:58

本发明专利技术公开了一种基于机器学习的XSS攻击检测方法，其包括以下步骤：步骤一，数据收集和数据预处理；步骤二，XSS特征提取；其包括：扫描数据库中的样本数据，循环计算每个词的信息熵，以及使用TF

全部详细技术资料下载

【技术实现步骤摘要】
基于机器学习的XSS攻击检测方法

[0001]本专利技术涉及一种网络安全智能防御技术。更具体地说，本专利技术涉及一种基于机器学习的XSS攻击检测方法。

技术介绍

[0002]近些年，随着移动互联网的迅猛发展，客户端与服务端的交互变得越来越频繁。很多服务器后端从以前的单一设备访问，发展为现在的多设备访问。而这些不同设备的不同系统跟服务器交互，虽然交互变得更加便利且高效但同时也引发了更多的安全问题。而跨站脚本攻击(Cross
‑
Site Scripting,XSS)就是最常见且危害最广泛的一种Web攻击,严重威胁着Web系统的安全。
[0003]而随着移动互联的发展，交互便利使得网络请求越来越复杂，参数更加多元化，从而导致网络攻击的复杂性增大，防御复杂性增大。目前，当前主流的XSS攻击检测以传统工具的静态防御为主，滞后性较强。比如一些传统的防御组件只针对一些变形的XSS攻击，除了防御规则的时效性外，还有很多攻击欺诈绕过风险，会产生很多漏报。并且伴随着当前网络请求的复杂性增加，一些常规的合法请求，由于其参数的复杂，容易与传统工具的防御规则发生冲突，导致了很多误报行为。

技术实现思路

[0004]本专利技术的一个目的是解决至少上述问题，并提供至少后面将说明的优点。
[0005]本专利技术还有一个目的是提供一种基于机器学习的XSS攻击检测方法，其不仅可以在针对已有攻击数据的检测准确度中高达90％以上，而且能够大大提高对未知的XSS攻击数据的检测精准度和防御效果。
[00...

【技术保护点】

【技术特征摘要】
1.基于机器学习的XSS攻击检测方法，其特征在于，包括以下步骤：步骤一，数据收集和数据预处理；步骤二，XSS特征提取；其包括：扫描数据库中的样本数据，循环计算每个词的信息熵，以及使用TF
‑
IDF算法提取样本数据的TF
‑
IDF值；将满足关联规则的信息熵和TF
‑
IDF值形成XSS特征；步骤三，将所述步骤二提取的XSS特征送入SVM分类模型中进行训练，生成训练后的XSS攻击检测模型，对XSS攻击进行检测。2.如权利要求1所述的基于机器学习的XSS攻击检测方法，其特征在于，还包括：在所述步骤二的特征提取前，数据预处理后，通过构建转义及加密对照树，进行递归多次解码，并结合相似度算法匹配缺失部分机构的标签，直至还原到最原始文本。3.如权利要求1所述的基于机器学习的XSS攻击检测方法，其特征在于，所述步骤二中，还包括：通过Aprior算法从黑数据的分词结果中提取出频繁项，通过支持度(support)与置信度(confidence)提取出频繁项集，将各个样本中频繁项集的出现频次形成XSS特征。4.如权利要求1所述的基于机器学习的XSS攻击检测方法，其特征在于，所述步骤二中，所述信息熵通过以下步骤计算：步骤1，通过香农公式，循环计算每个词出现的频率；步骤2，通过公式(Ⅰ)循环计算出信息熵；公式(Ⅰ)如下：其中p(x
i
)表示第i个词出现的频率，N表示公有词的总数。5.如权利要求1所述的基于机器学习的XSS攻击检测方法，其特征在于，所述步骤二中，所述TF
‑
IDF值通过以下步骤计算：将数据库中的XSS攻击黑数据作为对照样本库，利用公式(...

【专利技术属性】
技术研发人员：田新远，
申请(专利权)人：北京华清信安科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人