System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及计算机软件安全漏洞领域,更具体地说,涉及一种用于漏洞分类评估的异常样本数据集自动生成方法及系统。
技术介绍
1、异常样本数据集包括若干异常样本文件以及相关信息。异常样本文件通常简称为异常样本。其中,一个异常样本文件为存储在计算机储存设备中的一段数据流,当其在目标软件运行过程中作为输入时,可触发目标软件中的漏洞,使得目标软件发生崩溃并异常退出。相关信息包括数据集中所有异常样本文件的来源、修改时间、触发缺陷或漏洞的条件、注释等,通常以纯文本、json(javascript object notation,js对象简谱)等格式存储。计算机领域从业人员可以通过分析异常样本文件,以及目标软件读取异常样本文件作为输入后的运行过程,发现并解决其所触发的漏洞。实际场景中,往往存在大量异常样本使上述分析过程难度增加,因此,按所触发漏洞的相关属性对异常样本分类(简称漏洞分类),从而降低人工分析难度,是软件安全漏洞分析领域的热门研究方向之一。在漏洞分类的研究工作中,必须借助大规模、高质量的异常样本数据集来评估分类方法的性能。
2、目前,异常样本数据集大多基于业界公开的模糊测试工具评估数据集构建得到,即在这些数据集上人工运行模糊测试工具,收集并筛选其输出的异常样本。然而,这种方法存在不可忽略的缺陷,一是不同的模糊测试工具评估数据集差别大,建立运行模糊测试工具和目标软件所需环境步骤繁琐、迁移成本高、效率低;二是需要人工收集并筛选异常样本,人为的不确定因素会对数据集精度产生影响,随着样本数量规模增大,将显著消耗大量人力和时间,失误
技术实现思路
1、本专利技术的目的在于提供一种用于漏洞分类评估的异常样本数据集自动生成方法及系统,以便高效率高质量地构造异常样本数据集,解决现有异常样本数据集建立方法中存在的人为的不确定因素影响数据集精度、步骤繁琐、管理困难、成本高、效率低的问题。
2、为实现上述目的,一方面,本申请提供了一种用于漏洞分类评估的异常样本数据集自动生成方法,所述异常样本数据集自动生成方法包括:
3、通过模糊测试工具软件针对目标软件生成异常样本;
4、获取所述目标软件对应的软件副本,并利用目标漏洞补丁修复所述软件副本上的目标漏洞,生成已修复软件;
5、将所述异常样本输入所述已修复软件;
6、若所述已修复软件的目标漏洞未被触发,则判定所述异常样本为有效异常样本;
7、根据所述有效异常样本、所述目标漏洞补丁的标识信息及所述目标漏洞的标识信息生成异常样本数据集。
8、可选地,所述异常样本数据集自动生成方法通过容器实例执行所述异常样本数据集自动生成方法。
9、可选地,通过容器实例执行异常样本数据集自动生成方法之前,还包括:
10、获取容器模板;其中,所述容器模板中描述了操作系统配置信息、软件配置信息以及样本配置信息;
11、根据所述容器模板构建所述容器实例。
12、可选地,将所述异常样本输入已修复软件之后,还包括:
13、若所述已修复软件的目标漏洞被触发,则将所述异常样本判定为无效异常样本,并在满足销毁条件时销毁所有无效异常样本。
14、可选地,所述异常样本数据集自动生成方法还包括:
15、若当前满足控制指令生成条件,则自动生成如下指令中的至少一者并执行对应的操作:容器实例构造指令、异常样本生成指令、异常样本验证指令、无效异常样本销毁指令、数据集生成指令。
16、可选地,所述异常样本数据集自动生成方法还包括:
17、生成异常样本数据集生成日志,并存储至数据库;其中,所述异常样本数据集生成日志包括如下日志中的至少一者:容器实例构造日志、异常样本生成日志、异常样本验证日志、无效异常样本销毁日志、数据集生成日志。
18、又一方面,本申请还提供了一种用于漏洞分类评估的异常样本数据集自动生成系统,所述异常样本数据集自动生成系统包括:
19、样本生成单元,用于通过模糊测试工具软件针对目标软件生成异常样本;
20、修复单元,用于获取所述目标软件对应的软件副本,并利用目标漏洞补丁修复所述软件副本上的目标漏洞,生成已修复软件;
21、验证单元,用于将所述异常样本输入所述已修复软件;若所述已修复软件未的目标漏洞未被触发,则判定所述异常样本为有效异常样本;
22、数据集生成单元,用于根据所述有效异常样本、所述目标漏洞补丁的标识信息及所述目标漏洞的标识信息生成异常样本数据集。
23、可选地,所述样本生成单元、所述修复单元、所述验证单元及所述数据集生成单元设置于容器实例内。
24、可选地,所述异常样本数据集自动生成系统还包括:
25、监视与控制服务模块,用于在当前满足控制指令生成条件时,自动生成容器实例构造指令并发送至容器管理服务模块,或触发所述容器管理服务模块生成如下指令中的至少一者:异常样本生成指令、异常样本验证指令、无效异常样本销毁指令、数据集生成指令;
26、所述容器管理服务模块,用于根据所述容器实例构造指令构建所述容器实例;生成异常样本生成指令、异常样本验证指令、无效异常样本销毁指令、数据集生成指令中的至少一者,并控制所述容器实例执行对应的操作。
27、可选地,所述容器实例还用于:生成异常样本数据集生成日志;其中,所述异常样本数据集生成日志包括如下日志中的至少一者:容器实例构造日志、异常样本生成日志、异常样本验证日志、异常样本销毁日志、数据集生成日志;
28、所述监视与控制服务模块还用于:将所述异常样本数据集生成日志发送至数据库服务模块,以通过所述数据库服务模块将所述异常样本数据集生成日志存储至数据库。
29、通过以上方案可知,本专利技术公开了一种用于漏洞分类评估的异常样本数据集自动生成方法及系统;在本方案中,可自动执行与目标软件的漏洞相关的异常样本生成、验证、整理和打包过程,最终得到异常样本数据集。本方案通过以上方式,可充分利用计算机资源,高效率大规模地生成异常样本数据集;并且,本方案通过对异常样本的有效性验证过程,可从已生成异常样本中准确快速地识别出有效异常样本,保证所生成异常样本数据集的质量;进一步,本方案还可通过描述目标软件漏洞的一个或多个容器模板创建至少一个容器实例,并通过该容器实例执行该异常样本数据集自动生成方法,通过该方式,使得本方案可通过多个互相独立且同时执行的容器实例,高效且自动地得到数量规模更大的不同类型的异常样本数据集。
本文档来自技高网...【技术保护点】
1.一种用于漏洞分类评估的异常样本数据集自动生成方法,其特征在于,所述异常样本数据集自动生成方法包括:
2.根据权利要求1所述的异常样本数据集自动生成方法,其特征在于,通过容器实例执行所述异常样本数据集自动生成方法。
3.根据权利要求2所述的异常样本数据集自动生成方法,其特征在于,所述通过容器实例执行所述异常样本数据集自动生成方法之前,还包括:
4.根据权利要求1所述的异常样本数据集自动生成方法,其特征在于,将所述异常样本输入已修复软件之后,还包括:
5.根据权利要求1至4中任意一项所述的异常样本数据集自动生成方法,其特征在于,所述异常样本数据集自动生成方法还包括:
6.根据权利要求1至4中任意一项所述的异常样本数据集自动生成方法,其特征在于,所述异常样本数据集自动生成方法还包括:
7.一种用于漏洞分类评估的异常样本数据集自动生成系统,其特征在于,所述异常样本数据集自动生成系统包括:
8.根据权利要求7所述的异常样本数据集自动生成系统,其特征在于,
9.根据权利要求8所述的异常样本数据
10.根据权利要求8所述的异常样本数据集自动生成系统,其特征在于,
...【技术特征摘要】
1.一种用于漏洞分类评估的异常样本数据集自动生成方法,其特征在于,所述异常样本数据集自动生成方法包括:
2.根据权利要求1所述的异常样本数据集自动生成方法,其特征在于,通过容器实例执行所述异常样本数据集自动生成方法。
3.根据权利要求2所述的异常样本数据集自动生成方法,其特征在于,所述通过容器实例执行所述异常样本数据集自动生成方法之前,还包括:
4.根据权利要求1所述的异常样本数据集自动生成方法,其特征在于,将所述异常样本输入已修复软件之后,还包括:
5.根据权利要求1至4中任意一项所述的异常样本数据集自动生成方法,...
【专利技术属性】
技术研发人员:李瑞林,李志伟,冯超,
申请(专利权)人:中国人民解放军国防科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。