一种基于机器学习的跨站脚本攻击识别方法技术

技术编号：32510819 阅读：44 留言：0更新日期：2022-03-02 10:55

本发明专利技术公开了一种基于机器学习的跨站脚本攻击识别方法，包括以下步骤：S1、网页数据收集：搭建含有跨站脚本攻击漏洞的靶场，使用扫描器和人工渗透的方式收集含有跨站脚本攻击的相关数据，对相关数据进行分类标注；S2、数据特征工程：对相关数据进行数据清洗；S3、数据特征化分析：将跨站脚本攻击语句视为文本信息，进行文本特征抽取，生成分词信息；S4、机器学习：将分词信息通过XGBoost集成算法模型进行训练，得到用于跨站脚本攻击识别的分类器模型；S5、跨站脚本攻击识别：将Web请求数据经过特征工程及向量化处理后进入分类器模型进行预测，识别跨站脚本攻击。本发明专利技术能够有效提高跨站脚本攻击识别效率，提高安全性。提高安全性。提高安全性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于机器学习的跨站脚本攻击识别方法

[0001]本专利技术涉及网络数据安全
，具体涉及一种基于机器学习的跨站脚本攻击识别方法。

技术介绍

[0002]当今，计算机网络技术发展得十分迅速，网络犯罪行为日益增加。网络犯罪行为主要有两种形式,一是非法获取系统数据，二是让系统无法提供服务。在非法获取系统数据方面，跨站脚本攻击利用网站漏洞恶意盗取信息是非常典型的攻击手段。与大多数攻击不同的是，跨站脚本漏洞涉及到攻击者、客户端和网站，而不像大多数攻击一样只有攻击者和受害者。这无疑增加了跨站脚本漏洞的攻防难度。
[0003]传统的方法是人工动态检测检测方法和静态检测方法两种方式进行。第一种动态检测方法，该方法从黑盒测试入手，又结合了渗透攻击相关的方法，实现了对XSS漏洞的检测。当前的动态检测方法都会使用真实的XSS攻击代码，或者利用网络爬虫对目标网页进行爬取分析，但是网络爬虫的时间开销十分巨大，且不能保证爬取到的页面数据覆盖了网站的全部页面，并且数据库中存储的攻击代码又无法涵盖所有的攻击场景，存取的开销对服务器的要求也非常。第二种静态检测方法是HTML5和CORS属性规则在浏览器设计一个过滤器来检测XSS攻击，并提供了一个系统来判断被拦截的请求是否有恶意企图。通过以上我们不难看出传统的跨站脚本检测方法往往需要花费大量的时间和精力来提取这些攻击数据的特征，而且还需要一定的经验相结合才能取得很好的效果。对人员依赖程度很大，人员能力水平参差不齐，会影响最终的效果，并且对服务器资源的开销也是非常大的。
专利技术内...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的跨站脚本攻击识别方法，其特征在于：包括以下步骤：S1、网页数据收集：搭建含有跨站脚本攻击漏洞的靶场，使用扫描器和人工渗透的方式收集含有跨站脚本攻击的相关数据，对所述相关数据进行分类标注；S2、数据特征工程：对所述相关数据进行数据清洗；S3、数据特征化分析：将跨站脚本攻击语句视为文本信息，进行文本特征抽取，生成分词信息；S4、机器学习：将所述分词信息通过XGBoost集成算法模型进行训练，得到用于跨站脚本攻击识别的分类器模型；S5、跨站脚本攻击识别：将Web请求数据经过特征工程及向量化处理后进入所述分类器模型进行预测，识别所述跨站脚本攻击。2.根据权利要求1所述的一种基于机器学习的跨站脚本攻击识别方法，其特征在于：所述相关数据包括请求参数、请求方法、响应...

【专利技术属性】
技术研发人员：刘兵，谢鑫，何召阳，任玉坤，何晓刚，郗朝旭，
申请(专利权)人：北京墨云科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人