一种基于贝叶斯惩罚特征选择的SQL注入攻击检测方法技术

技术编号:33251159 阅读:15 留言:0更新日期:2022-04-27 18:13
本发明专利技术的实施例提供了一种基于贝叶斯惩罚特征选择的SQL注入攻击检测方法。所述方法包括获取SQL注入攻击样本数据,并进行预处理;将预处理后的SQL注入攻击样本数据进行特征提取,得到特征流;通过改进的贝叶斯算法对所述特征流中的特征进行分类,得到潜在子集和激活子集;利用Pearson相关系数算法将所述激活子集中具有相关性的特征剔除,得到SQL注入攻击数据。以此方式,可以高效的筛选出就具有稀疏性的数据中筛选出有用特征,并且在特征空间发生变化时,及时根据最新的特征空间进行建模,从而更能适应当今的大数据以及在线流特征数据的情况。据的情况。据的情况。

【技术实现步骤摘要】
一种基于贝叶斯惩罚特征选择的SQL注入攻击检测方法


[0001]本专利技术一般涉及网络安全领域,并且更具体地,涉及一种基于贝叶斯惩罚特征选择的SQL注入攻击检测方法。

技术介绍

[0002]SQL注入攻击是web安全防御所面临的最常见攻击手段。攻击者利用web网站没有细致过滤访问者提交的SQL语句的漏洞,构造特殊的输入参数作为访问请求的一部分,通过绕过服务器防护执行恶意SQL命令的方式,获取web服务器系统信息、拷贝或删除文件、操作数据库、甚至提升权限以进行更多恶意行为。
[0003]传统的web防护技术可以采用特征检测的方法检测SQL注入,即在特定的访问请求URI识别特定的注入参数,根据存在SQL注入漏洞的web服务器类型和版本的不同,编写成千上万的检测规则,且这些规则只能防御已经发现的web服务器上的SQL注入攻击;同时其检测特征也缺乏普适性,难以防御更为复杂的服务器漏洞SQL注入和0day注入攻击。

技术实现思路

[0004]根据本专利技术的实施例,提供了一种基于贝叶斯惩罚特征选择的SQL注入攻击检测方案。本方案能够在具有稀疏性的数据中有效的筛选出有用特征,同时排除相关性高的特征,实现SQL注入攻击检测。
[0005]在本专利技术的第一方面,提供了一种基于贝叶斯惩罚特征选择的SQL注入攻击检测方法。该方法包括:获取SQL注入攻击样本数据,并进行预处理;将预处理后的SQL注入攻击样本数据进行特征提取,得到特征流;通过改进的贝叶斯算法对所述特征流中的特征进行分类,得到潜在子集和激活子集;利用Pearson相关系数算法将所述激活子集中具有相关性的特征剔除,得到SQL注入攻击数据。
[0006]进一步地,所述预处理,包括:对所述SQL注入攻击样本数据进行噪声去除、缺失值处理、编码转换、相同数据去重中的一种或多种操作,得到一次预处理结果;从所述一次预处理结果中提取关键字段,并对所述关键字段进行泛化处理,得到二次预处理结果;将所述二次预处理结果的文本数据进行分词处理,得到预处理后的SQL注入攻击样本数据。
[0007]进一步地,所述特征提取,包括:通过预训练语言模型对预处理后的SQL注入攻击样本数据进行特征编码,提取语义信息,得到特征流。
[0008]进一步地,所述通过改进的贝叶斯算法对所述特征流中的特征进行分类,包括:初始化潜在子集和激活子集;从所述特征流中依次获取特征,判断所述特征与响应变量是否相关,若不相关,则将所述特征丢弃;若所述特征与响应变量相关,则对所述特征进行梯度测试,并判断所述特征是否通过所述梯度测试,若通过,则将该特征加入所述潜在子集中;否则将该特征加入所述激活子集中。
[0009]进一步地,所述方法还包括:当潜在子集存在待加入特征时,遍历所述潜在子集中的所有特征进行梯度测试,将通过梯度测试的特征加入所述激活子集中,将未通过梯度测试的特征剔除;以及遍历当前激活子集中的所有特征进行梯度测试,将通过梯度测试的特征留在激活子集中,将未能通过梯度测试的特征剔除;直至所述激活子集中的所有特征均为通过梯度测试的特征,遍历特征流中的下一特征;若遍历完所述特征流中的全部特征,则分类结束。
[0010]进一步地,所述梯度测试,包括:其中,为第j个特征的系数,其中 j表示序列数;L为损失函数;为伪正则化参数,通过进行更新,为关键特征的个数,其中将系数值是非零的特征作为关键特征。
[0011]进一步地,所述判断所述特征与响应变量是否相关,包括:计算特征与响应变量的相关性,若相关性满足,C为预设值,则所述特征与响应变量不相关;若相关性满足,则所述特征与响应变量相关。
[0012]进一步地,所述利用Pearson相关系数算法将所述激活子集中具有相关性的特征剔除,包括:通过Pearson相关系数算法计算所述激活子集中每个特征的皮尔森相关系数r,将r > 0.8的特征作为具有相关性的特征,从所述激活子集中剔除。
[0013]在本专利技术的第二方面,提供了一种基于贝叶斯惩罚特征选择的SQL注入攻击检测装置。该装置包括:预处理模块,用于获取SQL注入攻击样本数据,并进行预处理;特征提取模块,用于将预处理后的SQL注入攻击样本数据进行特征提取,得到特征流;分类模块,用于通过改进的贝叶斯算法对所述特征流中的特征进行分类,得到潜在子集和激活子集;剔除模块,用于利用Pearson相关系数算法将所述激活子集中具有相关性的特征剔除,得到SQL注入攻击数据。
[0014]在本专利技术的第三方面,提供了一种电子设备。该电子设备至少一个处理器;以及与所述至少一个处理器通信连接的存储器;所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术
第一方面的方法。
[0015]应当理解,
技术实现思路
部分中所描述的内容并非旨在限定本专利技术的实施例的关键或重要特征,亦非用于限制本专利技术的范围。本专利技术的其它特征将通过以下的描述变得容易理解。
附图说明
[0016]结合附图并参考以下详细说明,本专利技术各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:图1示出了根据本专利技术的实施例的基于贝叶斯惩罚特征选择的SQL注入攻击检测方法的流程图;图2示出了根据本专利技术的实施例的改进的贝叶斯算法流程图;图3示出了根据本专利技术的实施例的基于贝叶斯惩罚特征选择的SQL注入攻击检测装置的方框图;图4示出了能够实施本专利技术的实施例的示例性电子设备的方框图;其中,400为电子设备、401为CPU、402为ROM、403为RAM、404为总线、405为I/O接口、406为输入单元、407为输出单元、408为存储单元、409为通信单元。
具体实施方式
[0017]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本专利技术保护的范围。
[0018]另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
[0019]图1示出了本专利技术实施例的基于贝叶斯惩罚特征选择的SQL注入攻击检测方法的流程图。
[0020]该方法包括:S101、获取SQL注入攻击样本数据,并进行预处理。
[0021]作为本专利技术的一种实施例,可以利用互联网抓取和分析平台从网络上获取公开的SQL注入攻击样本。
[0022]具体地,可以收集包含SQL注入和真实查询字符串的开源数据集:例如github上有很多web攻击的数据集包含SQL注入的攻击载荷。还可以通过扫描工具收集:网络上专用本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于贝叶斯惩罚特征选择的SQL注入攻击检测方法,其特征在于,包括:获取SQL注入攻击样本数据,并进行预处理;将预处理后的SQL注入攻击样本数据进行特征提取,得到特征流;通过改进的贝叶斯算法对所述特征流中的特征进行分类,得到潜在子集和激活子集;利用Pearson相关系数算法将所述激活子集中具有相关性的特征剔除,得到SQL注入攻击数据。2.根据权利要求1所述的方法,其特征在于,所述预处理,包括:对所述SQL注入攻击样本数据进行噪声去除、缺失值处理、编码转换、相同数据去重中的一种或多种操作,得到一次预处理结果;从所述一次预处理结果中提取关键字段,并对所述关键字段进行泛化处理,得到二次预处理结果;将所述二次预处理结果的文本数据进行分词处理,得到预处理后的SQL注入攻击样本数据。3.根据权利要求1所述的方法,其特征在于,所述特征提取,包括:通过预训练语言模型对预处理后的SQL注入攻击样本数据进行特征编码,提取语义信息,得到特征流。4.根据权利要求1所述的方法,其特征在于,所述通过改进的贝叶斯算法对所述特征流中的特征进行分类,包括:初始化潜在子集和激活子集;从所述特征流中依次获取特征,判断所述特征与响应变量是否相关,若不相关,则将所述特征丢弃;若所述特征与响应变量相关,则对所述特征进行梯度测试,并判断所述特征是否通过所述梯度测试,若通过,则将该特征加入所述潜在子集中;否则将该特征加入所述激活子集中。5.根据权利要求4所述的方法,其特征在于,还包括:当潜在子集存在待加入特征时,遍历所述潜在子集中的所有特征进行梯度测试,将通过梯度测试的特征加入所述激活子集中,将未通过梯度测试的特征剔除;以及遍历当前激活子集中的所有特征进行梯度测试,将通过梯度测试的特征留在激活子集中,将未能通过梯度测试...

【专利技术属性】
技术研发人员:曲武胡文友胡永亮
申请(专利权)人:金睛云华沈阳科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1