模糊测试用例生成方法技术

技术编号：39670865 阅读：7 留言：0更新日期：2023-12-11 18:36

本发明专利技术公开了一种模糊测试用例生成方法，涉及深度学习技术领域，用于解决现有训练样本数量少，长短不一，存在着较多低质量

全部详细技术资料下载

【技术实现步骤摘要】
模糊测试用例生成方法、装置、设备及介质

[0001]本专利技术涉及深度学习
，尤其涉及一种面向二进制程序的模糊测试用例生成方法
、
装置
、
设备及介质
。

技术介绍

[0002]模糊测试
(Fuzz Testing)
是一种自动化的软件测试技术，其核心是自动或半自动的生成随机数据输入到应用程序中，同时监控程序的异常情况，如崩溃
、
代码断言失败，以此发现可能的程序错误，如内存泄漏
。
[0003]现有的模糊测试用例基于生成模型得到，不能准确地生成样本的格式结构，对于高度结构化的输入种子，生成的样本在尝试还原其格式结构时，在许多字节上易出现偏差
。
此外，目前主流的使用生成对抗网络的生成方法，在训练生成结构复杂的样本时，容易出现不收敛的情况
。
再次，当进行深度学习模型训练时，所使用的训练集大多来源于真实场景收集与模糊工具变异生成，此类训练样本往往数量较少，长短不一，存在着较多低质量
、
内容重复的样本，严重影响着模型的训练效果
。

技术实现思路

[0004]为了克服现有技术的不足，本专利技术的目的之一在于提供一种模糊测试用例生成方法，其通过对测试用例向量化，并进行线性插值处理，进而获取多样化的测试用例
。
[0005]本专利技术的目的之一采用以下技术方案实现：
[0006]一种模糊测试用例生成方法，包括以下步骤：
[00...

【技术保护点】

【技术特征摘要】
1.
一种模糊测试用例生成方法，其特征在于，包括以下步骤：通过模糊测试工具实时生成初始模糊测试用例；通过聚类对所述测试用例进行数据筛选；将筛选后的所述测试用例读取为二进制流，并进行归一化处理得到测试用例向量；对所述测试用例向量进行线性插值处理，得到合成向量；将所述测试用例向量及所述合成向量输入生成对抗网络进行模型训练并生成多样化模糊测试用例
。2.
如权利要求1所述的模糊测试用例生成方法，其特征在于，所述模糊测试工具为
AFL++。3.
如权利要求1所述的模糊测试用例生成方法，其特征在于，所述聚类为
kmeans
聚类
。4.
如权利要求3所述的模糊测试用例生成方法，其特征在于，通过聚类对所述测试用例进行数据筛选，包括：计算所述初始模糊测试用例字节数；通过
kmeans
方法对所述测试用例字节数进行聚类，得到聚类簇；选取所述聚类簇中测试用例数最多的簇
C
，若簇
C
的用例数量小于总用例数量的
70
％，则令聚类中心数减1，重新聚类直到簇
C
用例数大于等于总用例数量的
70
％；丢弃其余用例，仅保留簇
C。5.
如权利要求1所述的模糊测试用例生成方法，其特征在于，将筛选后的所述测试用例读取为二进制流，并进行归一化处理得到测试用例向量，包括：将筛选后的所述测试用例读取为二进制流，并记录所述测试用例中最大字节长度
L
；通过补0的方式将所有所述二进制流长度填充至
L
；将所述二进制流中每4比特转化为
16
进制；归一化得到测试用例向量
x
i
,i∈(1,N)
，其中，
N
为用例向量的总数

【专利技术属性】
技术研发人员：王文，李泽儒，李沁园，刘煦健，孙歆，汪自翔，秦中元，王译锋，侯虎成，
申请(专利权)人：东南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人