一种面向神经元特性的AI系统软件模型变异技术技术方案

技术编号：29934029 阅读：21 留言：0更新日期：2021-09-04 19:07

本发明专利技术涉及一种面向神经元特性的AI系统软件模型变异技术。首先，计算出测试集中每个类别的数据子集的距离熵，即每个类子集的多样性程度，根据整个测试集的平均距离熵，量化测试集的整体多样性程度，自动选择相应的变异级别；在此基础上，选择相应级别的变异算子，变异得到多个变异模型；最后，筛选掉查准率较低的变异模型，计算剩余变异模型的变异得分，有效地评估测试集质量。本发明专利技术目的在于解决深度学习系统测试集质量评估难题。利用变异得分指标，可以帮助软件研发人员准确地评价测试集，保障深度学习系统的质量。保障深度学习系统的质量。保障深度学习系统的质量。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向神经元特性的AI系统软件模型变异技术

[0001]本专利技术属于深度学习测试领域，尤其适用于深度学习测试中的测试充分性度量领域，其目的在于解决深度学习系统测试集质量评估问题，是一种帮助软件测试人员提高测试有效性，保障深度学习系统质量的方法。

技术介绍

[0002]深度学习定义了一种全新的数据驱动范式。与传统软件不同，深度学习系统内部逻辑是由数据集驱动产生的。现如今，深度学习技术迅猛发展，逐渐成为人工智能领域的关键技术，并且在许多重要的应用中取得了显著的成功。但随着其广泛应用，深度神经网络系统的质量问题也被重点关注。由于深度神经网络的结构复杂，数据中微小的扰动，即便无法被人类发现，却可能造成深度神经网络做出错误的判断，进而输出错误的结果。特别地，深度神经网络越来越多地被部署在自动驾驶汽车系统、恶意软件检测系统以及飞机碰撞避免系统等安全攸关领域，所以对这类深度学习系统进行充分的测试并保证其质量至关重要。由于深度学习系统特性，测试集在测试过程中起着重要的作用。一个好的测试集，能对深度学习系统的一般行为和各种边界条件下的行为进行充分的测试，尽可能找多的模型缺陷。这表明，找到一个高质量的测试集是一项十分重要的工作。
[0003]如何评估测试集的质量是一类重要的研究问题。当系统中错误数量是已知时，测试集能检测到的错误越多，则可称该测试集的质量越高。但在实际场景下，深度学习系统中缺陷的总数量是未知的。对此，研发人员只能依赖于其它手段来评估测试集的质量。神经元覆盖率是一种评估测试集质量和发现模型缺陷的有效指标：首先，...

【技术保护点】

【技术特征摘要】
1.一种面向神经元特性的AI系统软件模型变异技术，其特征在于，首先计算出测试集中每个类别的数据子集的距离熵distance_entropy，即每个类子集的多样性程度，根据整个测试集的平均距离熵，量化测试集的整体多样性程度div_value，自动选择相应的变异级别mutation_level；在此基础上，选择相应级别的变异算子source_operator或model_operator，变异得到多个变异模型mutation_model；最后，筛选掉查准率较低的变异模型，计算剩余变异模型的变异得分mutation_score，有效地评估测试集质量；该方法包括下列步骤：1)变异级别自动选择，给定测试集TS＝{TS1，TS2，...，TS
n
}；其中，每个类的子集TS
k
＝{t
k，1
，t
k，2
，...，t
k，m
}；利用欧式距离distance(t
k，i
，t
k，j
)计算并用距离矩阵matrix保存TS
k
中两两数据的距离；欧式距离的计算公式如下：(n为数据x和y的维数)计算出距离矩阵matrix的最小生成树tree，并将tree的权重边加入到集合W中，其中W＝{w1，w2，
……
，w
m
‑1}；基于W计算出TS
k
的距离熵dis_entropy，其计算公式如下：其中，对于n个测试子集，计算出dis_entropy的平均值div_value与div_threshold比较，得到相应的变异级别mutation_level；其计算公式如下：本步骤的目的是根据测试集的多样性，自动选择适合测试集的变异级别；具体地对于多样性程度高的测试集，适合用模型级变异测试；相反，对于测试集多样性程度低的测试测试集，适合用源级变异测试；2)变异模型生成，根据变异级别mutation_level选择相应的流程生成多个变异模型mutation_model；对于源级变异级别source，利用源级变异算子source_operator变异原始训练程序OP，再把OP与训练集TT进行训练，训练出的变异模型mutation_model加入到变异模型集合VM中；对于模型级变异级别model，利用OP与TT训练出原始模型origin_model，再用模型级变异算子model_opera...

【专利技术属性】
技术研发人员：王兴亚，冯力超，白光伟，魏汉宇，黄勇，申玉强，师玉星，赵志宏，
申请(专利权)人：南京慕测信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人