The invention discloses a fuzzy detection seed set generator based on WGAN model, which comprises a training set acquisition module, a fuzzy detection tool based on mutation algorithm, a program with common input as seed to detect multiple input formats of the same program, and an input to discover a new path of the program or to trigger abnormal conditions of the program as W. The training set of GAN model, the binary transformation matrix module, transforms the training set from binary form to matrix form, WGAN module, including WGAN model, takes the training set of matrix form as the real data set, trains the WGAN model to convergence, and generates the fuzzy detection seed set of matrix form through the training WGAN model. The matrix is converted to binary module, and the fuzzy detection seed set is transformed from matrix to binary form. The invention also discloses a method for generating a fuzzy detection seed set based on a fuzzy detection seed set generator, and the fuzzy detection seed set obtained by the method can greatly improve the vulnerability mining efficiency of fuzzy detection.
【技术实现步骤摘要】
一种基于WGAN模型的模糊检测种子集合生成方法及生成器
本专利技术涉及软件模糊检测
,尤其涉及一种基于WGAN模型的模糊检测种子集合生成方法及生成器。
技术介绍
随着计算机技术和互联网信息技术的发展,各式各样的软件与系统被开发出来,软件的功能也变得越来越丰富。然而由于开发人员水平参差不齐、开发人员之间沟通不足、架构设计不合理等原因,软件中往往存在着会导致程序崩溃、甚至会受不法分子利用的漏洞。由于软件漏洞总是不可避免地存在,因而漏洞检测受到广泛关注。传统的漏洞检测方案是由富有经验的安全人员人工检查代码,然而该方案任务繁重,成本高,效率较低,检测漏洞的召回率也较低,大型系统难以用该方案完整测试。新兴的一种漏洞检测方案是由机器学习算法去检查代码,返回可能存在漏洞的代码位置。然而机器学习算法检测软件漏洞的方案存在着诸多限制与不足:该方案误报率较高;只能做到缩小检测范围的作用,最终仍需要安全人员人工检查是否存在漏洞;该方案的机器学习模型效果取决于训练集合是否完备、训练次数是否合理,实际过程中存在机器学习模型在训练集合上表现优良但在使用中表现不尽人意、训练过拟合欠拟合等情况。有别于以上提到的漏洞检测方案,模糊测试是一种自动化的软件漏洞检测方法。模糊测试可以分成两大类型:(1)基于规范生成的模糊测试;(2)基于突变算法的模糊测试。基于规范生成的模糊测试根据人工提供的规范随机生成具有一定格式的种子文件,模糊测试将生成的种子输入被测软件,并监视被测软件是否出现预期外的异常情况。基于突变算法的模糊测试根据突变算法对人工输入的种子集合进行位变换、组合交叉等处理,获取到大量 ...
【技术保护点】
1.一种基于WGAN模型的模糊检测种子集合生成器,其特征在于,包括:训练集合获取模块,具有基于突变算法的模糊检测工具,所述的模糊检测工具对普通输入进行随机修改得到随机输入,再通过所述随机输入检测多个输入格式相同的程序,将发现程序新路径或触发程序异常情况的随机输入作为WGAN模型的训练集合;二进制转矩阵模块,将训练集合由二进制形式转换成WGAN模块可以学习的矩阵形式;WGAN模块,包含WGAN模型,以转换成矩阵形式的训练集合为真实数据集,将WGAN模型训练至收敛,通过训练后的WGAN模型生成矩阵形式的模糊检测种子集合;矩阵转二进制模块,将WGAN模块生成的模糊检测种子集合由矩阵形式转换为二进制形式。
【技术特征摘要】
1.一种基于WGAN模型的模糊检测种子集合生成器,其特征在于,包括:训练集合获取模块,具有基于突变算法的模糊检测工具,所述的模糊检测工具对普通输入进行随机修改得到随机输入,再通过所述随机输入检测多个输入格式相同的程序,将发现程序新路径或触发程序异常情况的随机输入作为WGAN模型的训练集合;二进制转矩阵模块,将训练集合由二进制形式转换成WGAN模块可以学习的矩阵形式;WGAN模块,包含WGAN模型,以转换成矩阵形式的训练集合为真实数据集,将WGAN模型训练至收敛,通过训练后的WGAN模型生成矩阵形式的模糊检测种子集合;矩阵转二进制模块,将WGAN模块生成的模糊检测种子集合由矩阵形式转换为二进制形式。2.根据权利要求1所示的模糊检测种子集合生成器,其特征在于,所述的模糊检测工具为AFL模糊测试工具。3.根据权利要求1所示的模糊检测种子集合生成器,其特征在于,所述的WGAN模型包括:生成器,学习真实数据的特征,并生成近似的虚假数据,将真实数据和虚假数据传输给判别器;判别器,区分真实数据和虚假数据。4.一种基于WGAN模型的模糊检测种子集合生成方法,其特征在于,包括以下步骤:(1)通过基于突变算法的模糊检测工具对普通输入进行随机修改得到随机输入,再通过所述随机输入检测多个输入格式相同的程序,将发现程序新路径或触发程序异常情况的随机输入作为WGAN模型的训练集合;(2)将所述...
【专利技术属性】
技术研发人员:纪守领,吕晨阳,陈建海,李宇薇,
申请(专利权)人:浙江大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。