基于代码组装的深度学习框架测试方法技术

技术编号：39402944 阅读：14 留言：0更新日期：2023-11-19 15:54

本发明专利技术公开了基于代码组装的深度学习框架测试方法，属于软件测试及深度学习框架测试领域。该方法使用代码组装技术，包括：首先，选定若干经典模型作为种子模型，分析其结构特点，然后将种子模型拆分成框架和可嵌入框架的语句，这之后根据一定的相似度算法对语句中的接口进行变异，并使用重塑形、参数适配和相似度阈值等手段来保证嵌入框架后生成的测试用例有较高的成功率，大幅减少变异导致的形状不匹配等问题，组装生成大量的测试用例后对框架进行测试，并使用过滤器筛选出有效的报错信息，同时使用剪枝来提高效率，最后，通过对错误报告及其对应的用例进行分析，即可发现潜在问题，对深度学习框架实现更全面的测试与评估。对深度学习框架实现更全面的测试与评估。对深度学习框架实现更全面的测试与评估。

全部详细技术资料下载

【技术实现步骤摘要】
基于代码组装的深度学习框架测试方法

[0001]本专利技术涉及一种基于代码组装的深度学习框架测试方法，属于软件测试与深度学习框架测试

技术介绍

[0002]深度学习(DL)已越来越多地应用于诸如身份验证、自动驾驶等关键任务。目前，许多工作都集中在确保深度学习相关应用的质量，例如测试已训练好的深度学习模型或测试由软件开发人员编写的深度学习应用程序。然而，关于测试深度学习框架(如TensorFlow，PyTorch，Jittor)的研究工作有待完善。这些深度学习框架是当前深度学习应用程序开发和部署的基础。然而，最近的研究发现这些库经常出现编码错误。因此，尽早发现这些错误至关重要。
[0003]以前的工作主要遵循同样的测试范式，即提供各种模型(称为测试输入)以测试深度学习框架中的特定模块(例如模型加载、构建和推理模块)。为了获得足够的测试输入(即深度学习模型)，现有的工作要么通过对已发布的模型(例如ResNet和InceptionNet)的网络结构、参数或输入值进行变异，要么基于预定义的模型结构模板(例如链式结构)从头开始构建深度学习模型。
[0004]然而，现有工作的测试充分性远远不够令人满意(例如，测试覆盖率低，效率低，定位不准确)。即使使用最新的测试技术，也无法达到高效率、高覆盖率、定位准确的效果。不令人满意的结果揭示了现有技术的不足之处。仔细观察后，我们发现一个主要原因是测试输入的匮乏，即模型数量和多样性不足。具体来说，现有技术旨在生成DL模型以扩大差分测试中的预测不一致性，增加层API的...

【技术保护点】

【技术特征摘要】
1.基于代码组装的深度学习框架测试方法，其特征在于，包括如下步骤：步骤SS1：相似度计算与约束获取步骤，包括：分析官方文档接口信息获取接口约束信息，根据所述接口约束信息进行接口相似度计算，获得可信的相似度和接口约束信息以及加载所述接口约束信息和所述相似度的入口；步骤SS2：种子模型收集与模型拆分步骤，包括：从流行的深度学习应用中收集N个经典的神经网络模型作为种子模型，所述N个经典的神经网络模型中的每一个都有对应框架的版本；对所述种子模型进行特定结构的拆分获得进行后续变异、组装、生成测试用例用的模板、定义语句、执行语句；步骤SS3：设计变异算法，具体包括：在步骤SS1获得的接口约束信息和相似度的基础上，对接口的定义语句设计一个变异算法，所述变异算法包括随机改变接口名的接口名变异算法API_MUTATE和参数变异算法PARAM_MUTATE。步骤SS4：代码组装步骤，包括：基于步骤SS2中得到的模板、定义语句、执行语句进行代码组装；步骤SS5：代码树生成步骤，包括：在步骤SS4的基础上，对拆分后的种子模型进行基于变异和组装的代码树生成；步骤SS6：剪枝、过滤与记录步骤，包括：准确定位触发报错的api调用。2.根据权利要求1所述的基于代码组装的深度学习框架测试方法，其特征在于，所述步骤SS1具体包括：步骤SS11：收集框架作者或发行公司提供的官方文档中所给出的文档，以及源代码中的API定义和注释在内的文档接口信息，对所述文档接口信息进行分析和对细节处的调整、校对之后，形成具有一定格式的约束说明，然后设计接口以使得测试工具的其他模块能读取到包含所述约束说明和所述文档接口信息的接口约束信息并进行相应的处理；步骤SS12：根据获得的所述接口约束信息进行接口相似度计算，所述接口相似度计算包括使用文本分析模型对接口功能描述的相似度进行计算，以及使用特定算法对接口的参数列表进行计算，计算过后将每个接口的相似度信息存入文件，并提供一个接口以使得测试工具的其他模块能读取到相似度信息并基于所述相似度信息进行后续运算。3.根据权利要求1所述的基于代码组装的深度学习框架测试方法，其特征在于，所述步骤SS2中的所述种子模型进行特定结构的拆分具体包括：首先，分析种子模型的结构，在不改变种子模型的运算规则和功能的基础上，对种子模型做出语句调用方式以及语句书写规格的结构性调整；然后，对每个种子模型拆分出一个基本模板TEMPLATE、若干接口定义语句API、接口执行语句EXECUTE，在本拆分方式下，每个种子模型会拥有一个嵌入语句后保证不发生代码结构错误的基本模板，待变异的若干接口定义语句，以及与定义语句逐条对应的接口执行语句。4.根据权利要求1所述的基于代码组装的深度学习框架测试方法，其特征在于，所述步骤SS3包括：所述接口名变异算法API_MUTATE接受一个接口定义语句API输入，然后基于相似度选择一个新的接口...

【专利技术属性】
技术研发人员：冯洋，吉品，吴朵，闫凌岳，刘嘉，赵志宏，
申请(专利权)人：南京大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人