一种负样本变换方法及装置制造方法及图纸

技术编号:21121049 阅读:22 留言:0更新日期:2019-05-16 10:42
本发明专利技术公开了一种负样本变换方法及装置,该方法包括:通过行为选择神经网络,确定数据流的第一负样本在行为集合中每个行为被选择的概率值;通过所述行为选择神经网络,根据所述行为集合中每个行为被选择的概率值,确定所述行为集合中的第一行为;通过所述第一行为中的变换规则,对所述第一负样本进行特征变换,并将所述第一负样本变换后的样本作为第二负样本;将所述第二负样本输入预设的检测系统进行样本判别,若通过所述检测系统的样本判别,则将所述第二负样本添加到样本库。

【技术实现步骤摘要】
一种负样本变换方法及装置
本专利技术涉及网络安全领域,尤其涉及一种负样本变换方法及装置。
技术介绍
在网络安全领域,通常通过人工智能(artificialintelligence,AI)检测系统来判断数据流是否为恶意,若为恶意数据流,则禁止该数据流通过,以达到防御目的。AI检测系统的判断规则是通过AI模型自学习形成并更新的,AI检测系统通过对流量与日志的特征抽取后,会获取正常数据流的状态特征向量,称为正样本,以及恶意数据流的状态特征向量,称为负样本。将大量的正样本与负样本输入至AI模型进行分析后,从而学习到负样本的潜在特征,用于以后检测出具有这些特征的攻击行为。但是,现有技术中,能提供给AI模型的负样本数量较少。因此,如何对负样本进行变换,以获得更多的负样本,是一个亟待解决的问题。
技术实现思路
本申请实施例提供了一种负样本变换方法及装置,解决了现有技术中能提供给AI模型的负样本数量较少的问题。本专利技术实施例提供一种负样本变换方法,该方法包括:通过行为选择神经网络,确定数据流的第一负样本在行为集合中每个行为被选择的概率值;所述第一负样本为所述数据流经过特征抽取形成的n维向量,n为正整数;所述行为集合中每个行为是一套对样本进行变换的规则;通过所述行为选择神经网络,根据所述行为集合中每个行为被选择的概率值,确定所述行为集合中的第一行为;通过所述第一行为中的变换规则,对所述第一负样本进行特征变换,并将所述第一负样本变换后的样本作为第二负样本;将所述第二负样本输入预设的检测系统进行样本判别,若通过所述检测系统的样本判别,则将所述第二负样本添加到样本库。可选的,所述通过行为选择神经网络,确定数据流的第一负样本在行为集合中每个行为被选择的概率值,包括:将所述行为集合中每个行为输入所述行为选择神经网络的行为训练模型,确定出该行为的奖励值;该行为的奖励值与所述第一负样本经过该行为变化后的样本通过所述检测系统的样本判别的概率呈正相关;将所述行为集合中每个行为的奖励值,与所述行为集合的所有行为的奖励值之和的比值,作为该行为被选择的概率值。可选的,所述通过所述行为选择神经网络,根据所述行为集合中每个行为被选择的概率值,确定所述行为集合中的第一行为,包括:按照所述行为集合中每个行为被选择的概率值,将通过所述行为选择神经网络在所述行为集合中,进行随机选择的一个行为,作为第一行为。可选的,所述行为集合中每个行为被选择的概率值是根据所述行为选择神经网络的第一参数值确定的;通过所述行为选择神经网络,确定所述第一行为的第一奖励值;通过行为评价神经网络,确定所述第一行为的第二奖励值;根据所述第一奖励值和所述第二奖励值,更新所述第一参数值。可选的,更新所述第一参数值之前,还包括:所述第二奖励值是根据所述行为评价神经网络的第二参数值确定的;根据所述行为选择神经网络输出的第二行为的第三奖励值,通过所述行为评价神经网络,确定所述第二行为的奖励现实值;所述第二行为是所述行为集合中任一行为;根据所述行为评价神经网络输出的所述第二行为的第四奖励值,通过所述行为评价神经网络,确定所述第二行为的奖励估计值;根据所述奖励现实值和所述奖励估计值,更新所述第二参数值。可选的,若所述第二负样本未通过所述预设检测系统的样本判别,且对所述第一负样本变换的次数未达到K次,则从所述行为集合中确定出第三行为;K为正整数;通过所述第三行为,将所述第一负样本变换为第三负样本。本专利技术实施例根据通过行为选择神经网络,确定行为集合中每个行为被选择的概率值,并根据所述行为集合中每个行为被选择的概率值,确定出一个将第一负样本进行变换的行为,在这种变换方式下,可通过第一负样本变换出多个样本,并将能通过所述检测系统的样本判别的负样本添加到样本库,从而扩充了样本库中的负样本。本专利技术实施例提供一种负样本变换装置,该装置包括:确定模块,用于通过行为选择神经网络,确定数据流的第一负样本在行为集合中每个行为被选择的概率值;所述第一负样本为所述数据流经过特征抽取形成的n维向量,n为正整数;所述行为集合中每个行为是一套对样本进行变换的规则;以及用于通过所述行为选择神经网络,根据所述行为集合中每个行为被选择的概率值,确定所述行为集合中的第一行为;变换模块,用于通过所述第一行为中的变换规则,对所述第一负样本进行特征变换,并将所述第一负样本变换后的样本作为第二负样本;处理模块,用于将所述第二负样本输入预设的检测系统进行样本判别,若通过所述检测系统的样本判别,则将所述第二负样本添加到样本库。可选的,所述确定模块,具体用于:将所述行为集合中每个行为输入所述行为选择神经网络的行为训练模型,确定出该行为的奖励值;该行为的奖励值与所述第一负样本经过该行为变化后的样本通过所述检测系统的样本判别的概率呈正相关;将所述行为集合中每个行为的奖励值,与所述行为集合的所有行为的奖励值之和的比值,作为该行为被选择的概率值。可选的,所述确定模块,具体用于:按照所述行为集合中每个行为被选择的概率值,将通过所述行为选择神经网络在所述行为集合中,进行随机选择的一个行为,作为第一行为。可选的,所述行为集合中每个行为被选择的概率值是根据所述行为选择神经网络的第一参数值确定的;所述确定模块,还用于通过所述行为选择神经网络,确定所述第一行为的第一奖励值;通过行为评价神经网络,确定所述第一行为的第二奖励值;根据所述第一奖励值和所述第二奖励值,更新所述第一参数值。可选的,所述第二奖励值是根据所述行为评价神经网络的第二参数值确定的;所述确定模块,还用于根据所述行为选择神经网络输出的第二行为的第三奖励值,通过所述行为评价神经网络,确定所述第二行为的奖励现实值;所述第二行为是所述行为集合中任一行为;根据所述行为评价神经网络输出的所述第二行为的第四奖励值,通过所述行为评价神经网络,确定所述第二行为的奖励估计值;根据所述奖励现实值和所述奖励估计值,更新所述第二参数值。可选的,所述处理模块,还用于若所述第二负样本未通过所述预设检测系统的样本判别,且对所述第一负样本变换的次数未达到K次,则从所述行为集合中确定出第三行为;K为正整数;通过所述第三行为,将所述第一负样本变换为第三负样本。附图说明图1为本专利技术实施例提出的一种负样本变换方法对应的交互示意图;图2为本专利技术实施例提出的一种负样本变换方法对应的具体交互示意图;图3为本专利技术实施例提出的一种负样本变换方法对应的行为选择神经网络的具体架构图;图4为本专利技术实施例提出的一种负样本变换方法对应的行为评价神经网络更新参数的示意图;图5为本专利技术实施例提出的一种负样本变换方法对应的步骤流程图;图6为本专利技术实施例提出的一种基于跨站脚本攻击(CrossSiteScripting,XSS)的负样本变换方法对应的深度学习神经网络的建模示意图;图7为本专利技术实施例提出的一种基于XSS攻击的负样本变换方法对应的数据流图;图8为本专利技术实施例提出的一种基于XSS攻击的负样本变换方法对应的整体架构图;图9为本专利技术实施例提出的一种负样本变换装置对应的结构示意图。具体实施方式为了更好的理解上述技术方案,下面将结合说明书附图及具体的实施方式对上述技术方案进行详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本本文档来自技高网...

【技术保护点】
1.一种负样本变换方法,其特征在于,包括:通过行为选择神经网络,确定数据流的第一负样本在行为集合中每个行为被选择的概率值;所述第一负样本为所述数据流经过特征抽取形成的n维向量,n为正整数;所述行为集合中每个行为是一套对样本进行变换的规则;通过所述行为选择神经网络,根据所述行为集合中每个行为被选择的概率值,确定所述行为集合中的第一行为;通过所述第一行为中的变换规则,对所述第一负样本进行特征变换,并将所述第一负样本变换后的样本作为第二负样本;将所述第二负样本输入预设的检测系统进行样本判别,若通过所述检测系统的样本判别,则将所述第二负样本添加到样本库。

【技术特征摘要】
1.一种负样本变换方法,其特征在于,包括:通过行为选择神经网络,确定数据流的第一负样本在行为集合中每个行为被选择的概率值;所述第一负样本为所述数据流经过特征抽取形成的n维向量,n为正整数;所述行为集合中每个行为是一套对样本进行变换的规则;通过所述行为选择神经网络,根据所述行为集合中每个行为被选择的概率值,确定所述行为集合中的第一行为;通过所述第一行为中的变换规则,对所述第一负样本进行特征变换,并将所述第一负样本变换后的样本作为第二负样本;将所述第二负样本输入预设的检测系统进行样本判别,若通过所述检测系统的样本判别,则将所述第二负样本添加到样本库。2.如权利要求1所述的方法,其特征在于,所述通过行为选择神经网络,确定数据流的第一负样本在行为集合中每个行为被选择的概率值,包括:将所述行为集合中每个行为输入所述行为选择神经网络的行为训练模型,确定出该行为的奖励值;该行为的奖励值与所述第一负样本经过该行为变化后的样本通过所述检测系统的样本判别的概率呈正相关;将所述行为集合中每个行为的奖励值,与所述行为集合的所有行为的奖励值之和的比值,作为该行为被选择的概率值。3.如权利要求1所述的方法,其特征在于,所述通过所述行为选择神经网络,根据所述行为集合中每个行为被选择的概率值,确定所述行为集合中的第一行为,包括:按照所述行为集合中每个行为被选择的概率值,将通过所述行为选择神经网络在所述行为集合中,进行随机选择的一个行为,作为第一行为。4.如权利要求1所述的方法,其特征在于,还包括:所述行为集合中每个行为被选择的概率值是根据所述行为选择神经网络的第一参数值确定的;通过所述行为选择神经网络,确定所述第一行为的第一奖励值;通过行为评价神经网络,确定所述第一行为的第二奖励值;根据所述第一奖励值和所述第二奖励值,更新所述第一参数值。5.如权利要求4所述的方法,其特征在于,更新所述第一参数值之前,还包括:所述第二奖励值是根据所述行为评价神经网络的第二参数值确定的;根据所述行为选择神经网络输出的第二行为的第三奖励值,通过所述行为评价神经网络,确定所述第二行为的奖励现实值;所述第二行为是所述行为集合中任一行为;根据所述行为评价神经网络输出的所述第二行为的第四奖励值,通过所述行为评价神经网络,确定所述第二行为的奖励估计值;根据所述奖励现实值和所述奖励估计值,更新所述第二参数值。6.如权利要求1-5任一所述的方法,其特征在于,还包括:若所述第二负样本未通过所述预设检测系统的样本判别,且对所述第一负样本变换的次数未达到K次,则从所述行为集合中确定出第三行为;K为正整数;通过所述第三...

【专利技术属性】
技术研发人员:黄自力杨阳陈舟胡景秀熊璐
申请(专利权)人:中国银联股份有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1