一种面向人工智能组件的测试用例生成方法技术

技术编号：36693402 阅读：119 留言：0更新日期：2023-02-27 20:02

本发明专利技术公开了一种面向人工智能组件的测试用例生成方法，属于图像处理领域；具体为：首先，针对原始图片，基于条件生成对抗网络cGAN，使用one

全部详细技术资料下载

【技术实现步骤摘要】
一种面向人工智能组件的测试用例生成方法

[0001]本专利技术属于图像处理的测试用例生成领域，具体为一种面向人工智能组件的测试用例生成方法。

技术介绍

[0002]人工智能技术是近年来计算机科学研究的焦点，随着计算能力的提升，人工智能在当下已经广泛应用于图像识别、自然语言处理等方面，在具体的场景如自动驾驶、人脸识别、语音识别以及医疗辅助等方面人工智能更是有着无与伦比的优势。在大数据时代下，人工智能能够多快好省地从大量、多样、低价值密度的数据中提取有价值信息，相关成果已经广泛应用于生活的各个角落。
[0003]在传统的软件系统开发过程中，测试是一个极为重要的环节，测试的充分与否直接影响软件上线后能否正常运行。随着互联网的发展，软件规模已经发展到一个匪夷所思的地步，一旦软件出现问题，造成的后果也难以想象。在航空、航天、医疗、自动驾驶等安全攸关的领域，测试不仅涉及大量经济利益、更涉及使用者的生命安全，因此，充分的测试是至关重要的。
[0004]传统软件是算法驱动的，软件系统的内部逻辑由算法决定，传统测试技术依据测试覆盖准则对程序分支做严格覆盖测试就可以找出算法存在的缺陷。以神经网络系统为代表的人工智能组件是数据驱动的，其内在逻辑由训练数据训练出的带有特定权值的神经元以及神经元的连接方式决定，因此针对传统软件的测试方法和测试指标无法对特定神经网络系统的内部逻辑进行充分测试和评估。对于神经网络而言，同一输入同一模型，在不同的训练情况下输出可能是不同的，因此单独针对算法的测试是无法得出稳定、可靠并且有效的结论的。...

【技术保护点】

【技术特征摘要】
1.一种面向人工智能组件的测试用例生成方法，其特征在于，具体步骤如下：首先，针对原始图片，基于条件生成对抗网络cGAN，使用one
‑
hot编码拼接到原始图片生成测试样例；然后，通过cGAN的损失函数，采取模糊测试方法加入扰动项对生成的测试样例进行扩充；通过隐空间采样约束和训练约束，并设计收益函数来估计扩充后测试样例集的质量，保证样例集满足测试要求；接着，构建蜕变关系对满足要求的样例集进行缩减，生成最终面向人工智能组件的测试用例；蜕变关系包括：MR1：当一个用例被判定为某一个分类并且置信度极高时，说明该用例处于决策空间中心位置，此时对其施加微小扰动，其分类结果不应该改变；MR2：当一个用例被判定为某一个分类并且置信度足够高并且与其他被判定为该分类的样例有一定差异时，说明该用例未处于决策空间中心也位处于决策空间边缘，此时对其施加微小扰动，其分类结果不应该改变；MR3：当一个用例被判定为两个分类的概率接近，说明其处于决策边界，对其进行小幅扰动，会让其结果出现错误；MR4：当一个用例对于各类的概率接近，说明无法将其分类，其处于决策空间外部，此时对该样本进行扰动，分类结果仍然错误，这些用例为无效用例；通过MR1筛出的用例是能够测试出被测模型是否实现了预期功能，能够准确分类出较为明确的用例；通过MR2筛出的用例能够测试出被测模型是否具有抵御噪声的能力；MR3则是测试被测模型是否能够抗混淆；通过MR4能够选取出用例集中最具有代表性，高价值的用例；最后，利用可靠性、充分性以及覆盖率三个指标对最终生成的测试用例进行验证；可靠性描述的是用例集是否准确有效，用例执行结果的正确性是否是可判定的；充分性则用来描述用例集是否能够发现尽可能多的问题；覆盖率则是衡量测试用例是否覆盖了所有功能约束；可靠性指标：g(X
R,model
)＝a*g1(X
R,model
)+(1
‑
a)*g2(X
R,model
)其中，g1(X
R,model
)为正确性评估函数，该指标是用正确用例数目比有效用例集规模，用以评估用例集中具有正确预期结果的比例；g2(X
R,model
)为有效性评估函数，该指标使用满足MR4的用例数量比用例集整体规模，用以评估用...

【专利技术属性】
技术研发人员：吕江花，刘泽玉，陈奕宁，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人