一种基于生成模型的payload自动生成方法、装置、系统制造方法及图纸

技术编号:29836631 阅读:23 留言:0更新日期:2021-08-27 14:26
本发明专利技术实施例公开了一种基于生成模型的payload自动生成方法、装置、系统,所述方法为:获取数据并进行数据预处理,根据词法和语法进行分析,得到可用数据;生成特征向量,使用生成模型进行自然语言处理,收集到的训练数据做出词库表,采用相关技术把词库表生成词向量,拟合后最终形成词向量模型文件;对数据进行生成算法模型训练,根据词向量模型文件生成相应的词向量,利用机器学习的生成算法进行训练,经过训练得到一个机器学习的算法模型;根据目标资源自动生成payload,只需要输入目标资源类别,模型会根据目标资源类别自动生成payload。本发明专利技术解决了现有payload难以自动生成、攻击载荷固化、缺乏攻击智能化、无法与目标环境进行交互的问题。

【技术实现步骤摘要】
一种基于生成模型的payload自动生成方法、装置、系统
本专利技术实施例涉及网络安全测试
,具体涉及一种基于生成模型的payload自动生成方法、装置、系统。
技术介绍
随着web应用的普及应用于我们的日常生活,使我们会开发出许多的web应用来服务于我们的日常生活,web应用的形式也越来越多,但大部分的web应用依旧有着相同点,他们都具备交互性,他们通常包含很多页面,而在这些页面中包含了利用某种编程语言来写成的服务器端脚本,这些脚本作用于web页面来与用户进行交互。因此对web应用中的漏洞挖掘变得越来越重要,但是在漏洞挖掘的过程中,需要针对不同的web资源使用不同的payload进行漏洞挖掘,便于让安全测试人员进行更好的进行测试。目前国内常用的payload生成主要是根据规则进行手工编写,或者有些安全测试人员根据其从业经验的积累。在漏洞挖掘过程中需要安全检测人员进行不断的尝试,而且也不会根据目标资源进行灵活的改变。通过上述介绍的几种payload生成方式我们不难发现,传统的payload生成存在以下问题:攻击载荷固化,往往由自动化渗透系统内置组件包含;攻击过程中需要穷举当前目标可利用攻击载荷对目标实施渗透,缺乏攻击的智能化;无法与目标环境进行交互,动态生成可渗透的有效攻击载荷。
技术实现思路
本专利技术实施例的目的在于提供一种基于生成模型的payload自动生成方法、装置、系统,用以解决现有payload难以自动生成、攻击载荷固化、缺乏攻击智能化、无法与目标环境进行交互的问题。为实现上述目的,本专利技术实施例主要提供如下技术方案:第一方面,本专利技术实施例提供了一种基于生成模型的payload自动生成方法,该方法包括:获取数据并进行数据预处理,根据词法和语法进行分析,得到可用数据;生成特征向量,使用生成模型进行自然语言处理,收集到的训练数据做出词库表,采用相关技术把词库表生成词向量,拟合后最终形成词向量模型文件;对数据进行生成算法模型训练,根据词向量模型文件生成相应的词向量,利用机器学习的生成算法进行训练,经过训练得到一个机器学习的算法模型;根据目标资源自动生成payload,只需要输入目标资源类别,模型会根据目标资源类别自动生成payload。进一步地,所述数据预处理过程中,对获取的数数据进行清洗脏数据,对缺失值进行补全、降维操作,然后采用相关方法对数据中的低频词或者高频词进行去除停用词。进一步地,所述特征向量生成过程中,创建词库表,对词库中的词进行编码,其中每个词以编码方式生成词向量,词向量模型中逐渐聚集语义功能相近的字,缩短近义词之间的向量空间距离,将其逐渐拟合,最后形成一个词向量模型文件。进一步地,所述数据进行生成算法模型训练过程中,对请求的数据进行清洗后,根据词向量模拟文件生成相应的词向量,利用机器学习的生成算法进行训练,生成算法模型由数据学习联合概率密度分布P(X,Y),求出条件概率分布P(Y|X)作为预测的模型。进一步地,所述生成算法模型首先建立样本的联合概率密度模型P(X,Y),再得到后验概率P(Y|X),再利用生成算法模型生成所需要的内容,经过训练得到机器学习算法模型。进一步地,所述机器学习算法模型在渗透测试过程中需要payload进行漏洞挖掘时,只需要输入目标资源类别,模型会根据目标资源类别自动生成payload。第二方面,本专利技术实施例还提供一种基于生成模型的payload自动生成装置,该装置包括:预处理单元、特征向量生成单元和算法模型生成单元;所述预处理单元进行清洗脏数据,对缺失值进行补全、降维,对数据中的低频词或者高频词进行去除停用词;所述特征向量生成单元,将收集到的训练数据做成词库表,通过编码方式将词库表生成词向量,词向量模型中逐渐聚集语义功能相近的字,缩短近义词之间的向量空间距离,将其逐渐拟合,形成一个词向量模型文件;所述算法模型生成单元,根据词向量模拟文件生成相应的词向量,利用机器学习的生产算法进行训练,得到机器学习算法模型。进一步地,所述算法模型生成单元生成模型由数据学习联合概率密度分布P(X,Y),然后求出条件概率分布P(Y|X)作为预测的模型。第三方面,本专利技术实施例还提供一种基于生成模型的payload自动生成系统,所述存储器用于存储一个或多个程序指令;所述处理器,用于运行一个或多个程序指令,用以执行基于生成模型的payload自动生成方法。第四方面,本专利技术实施例还提供一种计算机可读存储介质,所述计算机存储介质中包含一个或多个程序指令,所述一个或多个程序指令用于执行基于生成模型的payload自动生成方法。本专利技术实施例提供的技术方案至少具有如下优点:本专利技术实施例提供的一种基于生成模型的payload自动生成方法、装置、系统,对获取的数据进行预处理,得到可用数据,通过词向量模型文件生成词向量,根据词向量模型文件生成相应的词向量,利用机器学习的生成算法进行训练,经过训练得到一个机器学习的算法模型,目标资源自动生成payload,只需要输入目标资源类别,模型会根据目标资源类别自动生成payload。提高了payload生成的质量和效率,提高了渗透过程的效率,减少对渗透人员技术或能力的依赖程度,使渗透结果统一化、标准化,不受渗透人员主观因素的影响,有效降低了渗透测试工作的复杂度。附图说明图1为本专利技术实施例提供的一种基于生成模型的payload自动生成方法的流程图。图2为本专利技术实施例提供的一种基于生成模型的payload自动生成装置连接示意图。图3为本专利技术实施例提供的一种基于生成模型的payload自动生成系统结构示意图。图中:1-预处理单元、2-特征向量生成单元、3-算法模型生成单元、4-处理器、5-存储器具体实施方式以下由特定的具体实施例说明本专利技术的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本专利技术的其他优点及功效。以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本专利技术。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本专利技术。在其它情况中,省略对众所周知的系统、电路以及方法的详细说明,以免不必要的细节妨碍本专利技术的描述。实施例本实施例公开了一种基于生成模型的payload自动生成方法,所述方法为:获取数据并进行数据预处理,根据词法和语法进行分析,得到可用数据;生成特征向量,使用生成模型进行自然语言处理,收集到的训练数据做出词库表,采用相关技术把词库表生成词向量,拟合后最终形成词向量模型文件;对数据进行生成算法模型训练,根据词向量模型文件生成相应的词向量,利用机器学习的生成算法进行训练,经过训练得到一个机器学习的算法模型;根据目标资源自动生成payload,只需要输入目标资源类别,模型会根据目标资源类别自动生成pa本文档来自技高网...

【技术保护点】
1.一种基于生成模型的payload自动生成方法,其特征在于,所述方法为:/n获取数据并进行数据预处理,根据词法和语法进行分析,得到可用数据;/n生成特征向量,使用生成模型进行自然语言处理,收集到的训练数据做出词库表,采用相关技术把词库表生成词向量,拟合后最终形成词向量模型文件;/n对数据进行生成算法模型训练,根据词向量模型文件生成相应的词向量,利用机器学习的生成算法进行训练,经过训练得到一个机器学习的算法模型;/n根据目标资源自动生成payload,只需要输入目标资源类别,模型会根据目标资源类别自动生成payload。/n

【技术特征摘要】
1.一种基于生成模型的payload自动生成方法,其特征在于,所述方法为:
获取数据并进行数据预处理,根据词法和语法进行分析,得到可用数据;
生成特征向量,使用生成模型进行自然语言处理,收集到的训练数据做出词库表,采用相关技术把词库表生成词向量,拟合后最终形成词向量模型文件;
对数据进行生成算法模型训练,根据词向量模型文件生成相应的词向量,利用机器学习的生成算法进行训练,经过训练得到一个机器学习的算法模型;
根据目标资源自动生成payload,只需要输入目标资源类别,模型会根据目标资源类别自动生成payload。


2.如权利要求1所述的一种基于生成模型的payload自动生成方法,其特征在于,所述数据预处理过程中,对获取的数数据进行清洗脏数据,对缺失值进行补全、降维操作,然后采用相关方法对数据中的低频词或者高频词进行去除停用词。


3.如权利要求1所述的一种基于生成模型的payload自动生成方法,其特征在于,所述特征向量生成过程中,创建词库表,对词库中的词进行编码,其中每个词以编码方式生成词向量,词向量模型中逐渐聚集语义功能相近的字,缩短近义词之间的向量空间距离,将其逐渐拟合,最后形成一个词向量模型文件。


4.如权利要求1所述的一种基于生成模型的payload自动生成方法,其特征在于,所述数据进行生成算法模型训练过程中,对请求的数据进行清洗后,根据词向量模拟文件生成相应的词向量,利用机器学习的生成算法进行训练,生成算法模型由数据学习联合概率密度分布P(X,Y),求出条件概率分布P(Y|X)作为预测的模型。


5.如权利要求4所述的一种基于生成模型的payload自动生成方法,其特征在于,所述生成算法模型首先建立样本的联合概率密度模型P(X,...

【专利技术属性】
技术研发人员:任玉坤何召阳李乾坤刘兵谢鑫郗朝旭周欢
申请(专利权)人:北京墨云科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1