攻击信息预测模型的训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号：26845838 阅读：14 留言：0更新日期：2020-12-25 13:08

本发明专利技术提供了一种攻击信息预测模型的训练方法，包括：获取第一训练样本集合；通过所述攻击信息预测模型对所述第一训练样本集合进行处理，确定所述攻击信息预测模型中的词向量模型网络的参数，对与所述攻击载荷信息相匹配的词向量进行二分类处理，确定所述攻击信息预测模型中二分类模型网络的参数，对与所述攻击载荷信息相匹配的词向量进行多分类处理，确定所述攻击信息预测模型中多分类模型网络的参数，对不同的种子攻击载荷信息进行组合，确定入侵防御系统对应的正则表达式。本发明专利技术还提供了攻击信息预测方法、装置电子设备及存储介质。本发明专利技术能自动化的对攻击信息进行预测，提升预测的速度与精确度。

全部详细技术资料下载

【技术实现步骤摘要】
攻击信息预测模型的训练方法、装置、电子设备及存储介质
本本专利技术涉及网络攻击信息处理处理技术，尤其涉及攻击信息预测模型的训练方法、攻击信息预测方法、装置、系统、设备及存储介质。
技术介绍
相关技术中，WAF的正则表达式是一种重要的攻击数据，对其进行分析有助于为攻击行为的识别以及安全防御措施提供依据，具体可以通过Web应用防火墙采用正则表达式匹配攻击特征的方式来检测Web注入型攻击，即对每一种具体的注入的攻击特征进行特征匹配，但是，现有攻击信息预测中，通过人工生成正则表达式的方式速度慢并且精确度较差，不利于及时地对入侵防御系统进行检测。
技术实现思路
有鉴于此，本专利技术实施例提供一种攻击信息预测模型的训练方法、攻击信息预测方法、装置、电子设备及存储介质，能够实现对不同的种子攻击载荷信息进行组合，确定入侵防御系统对应的正则表达式，自动化的对攻击信息进行预测，提升预测的速度与精确度。本专利技术实施例的技术方案是这样实现的：本专利技术实施例提供了一种攻击信息预测模型的训练方法，包括：获取第一训练样本集合，其中，所述第一训练样本集合包括与攻击信息预测模型相匹配的攻击载荷信息和对应的结构化查询语言关键词；通过所述攻击信息预测模型对所述第一训练样本集合进行处理，确定所述攻击信息预测模型中的词向量模型网络的参数，以实现通过所述词向量模型网络输出与所述训练样本相匹配的词向量；通过所述攻击信息预测模型，对与所述攻击载荷信息相匹配的词向量进行二分类处理，确定所述攻击信息预测模型中二分类模型网...

【技术保护点】
1.一种攻击信息预测模型的训练方法，其特征在于，所述方法包括：/n获取第一训练样本集合，其中，所述第一训练样本集合包括与攻击信息预测模型相匹配的攻击载荷信息和对应的结构化查询语言关键词；/n通过所述攻击信息预测模型对所述第一训练样本集合进行处理，确定所述攻击信息预测模型中的词向量模型网络的参数，以实现通过所述词向量模型网络输出与所述训练样本相匹配的词向量；/n通过所述攻击信息预测模型，对与所述攻击载荷信息相匹配的词向量进行二分类处理，确定所述攻击信息预测模型中二分类模型网络的参数，以实现通过所述攻击信息预测模型中二分类模型网络确定与所述词向量相匹配的种子攻击载荷信息；/n通过所述攻击信息预测模型，对与所述攻击载荷信息相匹配的词向量进行多分类处理，确定所述攻击信息预测模型中多分类模型网络的参数，以实现通过所述攻击信息预测模型中多分类模型网络确定与所述种子攻击载荷信息相对性的组合规则；/n基于所述种子攻击载荷信息和与所述种子攻击载荷信息相对性的组合规则，对不同的种子攻击载荷信息进行组合，确定入侵防御系统对应的正则表达式。/n

【技术特征摘要】
1.一种攻击信息预测模型的训练方法，其特征在于，所述方法包括：
获取第一训练样本集合，其中，所述第一训练样本集合包括与攻击信息预测模型相匹配的攻击载荷信息和对应的结构化查询语言关键词；
通过所述攻击信息预测模型对所述第一训练样本集合进行处理，确定所述攻击信息预测模型中的词向量模型网络的参数，以实现通过所述词向量模型网络输出与所述训练样本相匹配的词向量；
通过所述攻击信息预测模型，对与所述攻击载荷信息相匹配的词向量进行二分类处理，确定所述攻击信息预测模型中二分类模型网络的参数，以实现通过所述攻击信息预测模型中二分类模型网络确定与所述词向量相匹配的种子攻击载荷信息；
通过所述攻击信息预测模型，对与所述攻击载荷信息相匹配的词向量进行多分类处理，确定所述攻击信息预测模型中多分类模型网络的参数，以实现通过所述攻击信息预测模型中多分类模型网络确定与所述种子攻击载荷信息相对性的组合规则；
基于所述种子攻击载荷信息和与所述种子攻击载荷信息相对性的组合规则，对不同的种子攻击载荷信息进行组合，确定入侵防御系统对应的正则表达式。

2.根据权利要求1所述的方法，其特征在于，所述通过所述攻击信息预测模型对所述第一训练样本集合进行处理，确定所述攻击信息预测模型中的词向量模型网络的参数，包括：
通过所述攻击信息预测模型中的词向量模型网络，对所述第一训练样本集合进行采样处理，确定所述训练样本对应的正例样本与负例样本；
根据所述训练样本对应的正例样本与负例样本，确定词向量模型网络中的上下文样本对；
根据所述词向量模型网络中的上下文样本对，确定所述攻击信息预测模型中的词向量模型网络的参数。

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：
确定与所述攻击信息预测模型相匹配的分词策略；
对所述第一训练样本集合中的攻击载荷信息进行分词处理；
将所述第一训练样本集合中的结构化查询语言关键词随机插入所经过分词处理的所述攻击载荷信息中，形成第二训练样本集合。

4.根据权利要求1所述的方法，其特征在于，所述通过所述攻击信息预测模型，对与所述攻击载荷信息相匹配的词向量进行二分类处理，确定所述攻击信息预测模型中二分类模型网络的参数，包括：
通过所述攻击信息预测模型，对与所述攻击载荷信息相匹配的词向量进行第一二分类处理，确定所述攻击信息预测模型中基于注意力机制的二分类模型网络的初始参数；
基于所述二分类模型网络的初始参数，通过所述攻击信息预测模型，对与所述攻击载荷信息相匹配的词向量进行第二二分类处理，确定所述攻击信息预测模型中基于注意力机制的二分类模型网络的更新参数；
根据所述二分类模型网络的更新参数，通过所述第一训练样本集合对所述注意力机制的二分类模型进行迭代更新，以实现通过所述攻击信息预测模型中二分类模型网络确定与所述词向量相匹配的种子攻击载荷信息。

5.根据权利要求4所述的方法，其特征在于，所述基于所述二分类模型网络的初始参数，通过所述攻击信息预测模型，对与所述攻击载荷信息相匹配的词向量进行第一二分类处理，确定所述攻击信息预测模型中基于注意力机制的二分类模型网络的更新参数，包括：
将所述第一训练样本集合中不同语句样本，代入由所述攻击信息预测模型中的二分类模型网络的编码器和解码器构成的自编码网络对应的损失函数；
确定所述损失函数满足第一收敛条件时对应所述二分类模型网络的编码器的参数和相应的解码器参数作为所述二分类模型网络的更新参数。

6.根据权利要求4所述的方法，其特征在于，所述根据所述二分类模型网络的更新参数，通过所述第一训练样本集合对所述注意力机制的二分类模型进行迭代更新，包括：
确定所述攻击信息预测模型中的二分类模型网络的编码器和解码器构成的自编码网络对应的迭代收敛条件；
基于所述二分类模型网络对应的更新参数，对所述二分类模型网络的编码器参数和解码器参数进行迭代更新，
直至所述二分类模型网络的编码器和解码器构成的自编码网络对应的损失函数满足对应的收敛条件并能够确定与所述词向量相匹配的种子攻击载荷信息。

7.根据权利要求1所述的方法，其特征在于，所述通过所述攻击信息预测模型，对与所述攻击载荷信息相匹配的词向量进行多分类处理，确定所述攻击信息预测模型中多分类模型网络的参数，包括：
通过所述攻击信息预测模型，对与所述攻击载荷信息相匹配的词向量进行第一多分类处理，确定所述攻击信息预测模型中基于多分类模型网络的初始参数；
基于所述多分类模型网络的初始参数，通过所述攻击信息预测模型，对与所述攻击载荷信息相匹配的词向量进行第二多分类处理，确定所述攻击信息预测模型中多分类模型网络的更新参数；
根据所述多分类模型网络的更新参数，通过所述第一训练样本集合对所述多分类模型进行迭代更新，以...

【专利技术属性】
技术研发人员：苏洵，骆克云，李海炜，曾凡，甘祥，杨勇，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人