当前位置: 首页 > 专利查询>清华大学专利>正文

一种面向外包深度学习的训练质量验证方法及装置制造方法及图纸

技术编号:36189022 阅读:26 留言:0更新日期:2022-12-31 21:00
本发明专利技术公开了一种面向外包深度学习的训练质量验证方法及装置,其中,该方法包括:获取训练数据集;训练数据集,包括额外数据集和原始训练数据集;构建基于深度神经网络的云端执行模型;将训练数据集输入云端执行模型进行训练,以得到训练好的云端执行模型;对生成额外数据集的准确率和准确率阈值进行比较,根据比较结果判断训练好的云端执行模型的训练质量是否达标,以得到训练质量的判断结果。本发明专利技术所提出的验证方案开销较小,同时不改变现有外包深度学习服务的流程,易于部署,能够有效地保护用户权益。保护用户权益。保护用户权益。

【技术实现步骤摘要】
一种面向外包深度学习的训练质量验证方法及装置


[0001]本专利技术涉人工智能安全
,特别是涉及一种面向外包深度学习的训练质量验证方法及装置。

技术介绍

[0002]近年来人工智能领域一直处于飞速发展阶段,各类创新应用层出不穷,取得了令人瞩目的发展成果。作为实现人工智能的主要方法,深度学习技术已经被广泛应用到各类任务中,如利用深度神经网络进行图像识别等。在实践中,用户(即数据的持有者)出于自己有限的计算资源或专业知识,经常会将训练深度学习模型的过程外包给专业的云服务商进行,这类服务被称为外包深度学习服务。外包深度学习为那些不具备训练条件的用户提供了便利,已成为推广人工智能应用的重要途径。
[0003]然而在外包深度学习的过程中,由于对数据、模型的操作均在云端进行,用户不参与任何训练过程,所以用户难以确定云服务商所交付的模型是否被训练到了最佳性能。一方面云服务商不可信的行为可能会损害用户权益,其可能在模型还未完全收敛的时候就停止训练以节省自己的计算资源从而获取经济收益;另一方面云端的网络环境复杂,攻击者可能利用其中潜在的漏洞,对数据、模型参数在传输或存储的过程中进行篡改,以影响模型的正常训练。因此有必要对外包深度学习的训练质量进行验证,以保护用户权益。关于外包深度学习的验证当前主要有以下两类方案:
[0004]1.基于可验证计算技术的方案。现有的绝大多数针对外包深度学习的验证方法都属于此类,它们利用可信执行环境和交互式证明协议等技术来防止云端或攻击者对于云端运算流程的恶意篡改。然而此类方法都存在巨大的运算效率开销,以可信计算环境SGX为例,其在所需内存超过128MB后会产生严重的换页调度开销以影响效率。2.基于深度学习自身性质的方案。此类工作利用了深度学习自身的一些特性,来实现对于外包深度学习的验证,例如可通过构造敏感样本来识别云端是否对所部属的模型进行篡改。此类方法由于没有使用到可验证计算技术,因此具备运算开销小的优点。然而将深度学习自身特性与验证目标进行关联是困难的,已有的此类方法仅能被应用于模型部署阶段,无法拓展到针对模型训练质量的验证。

技术实现思路

[0005]本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。
[0006]为此,本专利技术旨在针对上述提到的安全问题,提出一种面向外包深度学习的训练质量验证方案。本专利技术基于深度学习模型对于不同类型数据的敏感程度的差异性,使用户在不参与训练过程仅能获取到模型最终结果的情况下验证模型是否收敛,进而判断训练质量是否达标。其主要思路是在用户上传训练数据的过程中,向正常的训练数据中添加一些仅有自己知晓的特殊的人工合成数据,深度学习模型在这些人工合成数据上的表现能反映出模型的收敛状态。本专利技术把这些特殊的训练数据称为额外数据,用户可以通过观察最终
交付的模型在这些额外数据上的表现来判断所交付的模型训练质量是否达标。
[0007]本专利技术地另一个目的在于提出一种面向外包深度学习的训练质量验证装置。
[0008]为达上述目的,本专利技术一方面提出一种面向外包深度学习的训练质量验证方法,包括:
[0009]获取训练数据集;所述训练数据集,包括额外数据集和原始训练数据集;
[0010]构建基于深度神经网络的云端执行模型;
[0011]将所述训练数据集输入所述云端执行模型进行训练,以得到训练好的云端执行模型;
[0012]对生成所述额外数据集的准确率和准确率阈值进行比较,根据比较结果判断所述训练好的云端执行模型的训练质量是否达标,以得到训练质量的判断结果。
[0013]另外,根据本专利技术上述实施例的面向外包深度学习的训练质量验证方法还可以具有以下附加的技术特征:
[0014]进一步地,在本专利技术的一个实施例中,所述原始训练集包括多个类别标签的图像数据集,所述额外数据集包括所述图像数据集的特征维度、所述类别标签的数量和预设区域特征;所述获取训练数据集,包括:
[0015]将图像数据集的所有图像特征划分为固定区域和随机区域,在固定区域内进行随机采样得到固定区域特征,在所述随机区域进行采样得到随机区域特征;
[0016]根据所述固定区域特征和所述随机区域特征生成额外数据;
[0017]根据所述原始训练数据集的数量确定的所述额外数据的数量以构建额外数据集,将所述额外数据集与所述原始训练数据合并得到所述训练数据集。
[0018]进一步地,在本专利技术的一个实施例中,所述对生成的额外数据集的准确率和准确率阈值进行比较,根据比较结果判断所述训练好的云端执行模型的训练质量是否达标,以得到训练质量的判断结果,包括:
[0019]对生成的所述额外数据的准确率进行计算,得到准确率计算结果;
[0020]根据正确预测额外数据的概率和正确预测额外数据的累积分布函数,得到所述额外数据的准确率阈值;其中,所述正确预测额外数据的概率是基于第一预设公式和所述云端执行模型计算得到;
[0021]对所述准确率计算结果与所述准确率阈值进行比较,若所述准确率计算结果大于准确率阈值,则得到训练质量达标的判断结果。
[0022]进一步地,在本专利技术的一个实施例中,对所述固定和随机区域特征进行划分和拼接生成额外数据;在所述根据固定区域特征和所述随机区域特征生成额外数据之后,所述方法,还包括:
[0023]基于伪随机函数得到所述额外数据的标签。
[0024]进一步地,在本专利技术的一个实施例中,所述根据正确预测额外数据的概率和正确预测额外数据的累积分布函数,得到所述额外数据的准确率阈值,包括:
[0025]根据初始学习额外数据的概率,计算云端执行模型训练时的正确预测额外数据的概率;
[0026]根据所述正确预测额外数据的概率和第二预设公式计算正确预测额外数据的累积分布函数;
[0027]基于假设检验方法和所述累积分布函数求解得到所述准确率阈值。
[0028]为达上述目的,本专利技术另一方面提出一种面向外包深度学习的训练质量验证装置,包括:
[0029]训练集获取模块,用于获取训练数据集;所述训练数据集,包括额外数据集和原始训练数据集;
[0030]模型构建模块,用于构建基于深度神经网络的云端执行模型;
[0031]模型训练模块,用于将所述用户训练数据集输入所述云端执行模型进行训练,以得到训练好的云端执行模型;
[0032]质量判断模块,用于对生成所述额外数据集的准确率和准确率阈值进行比较,根据比较结果判断所述训练好的云端执行模型的训练质量是否达标,以得到训练质量的判断结果。
[0033]本专利技术实施例的面向外包深度学习的训练质量验证方法和装置,所提出的验证方案开销较小,同时不改变现有外包深度学习服务的流程,易于部署,能够有效地保护用户权益。
[0034]本专利技术的有益效果为:
[0035]1)当前针对外包深度学习的验证方案大多都基于可验证计算技术,然而在实际场景中此类技术由于效率问题具有较低的可用性,而本专利技术则基于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向外包深度学习的训练质量验证方法,其特征在于,包括以下步骤:获取训练数据集;所述训练数据集,包括额外数据集和原始训练数据集;构建基于深度神经网络的云端执行模型;将所述训练数据集输入所述云端执行模型进行训练,以得到训练好的云端执行模型;对生成所述额外数据集的准确率和准确率阈值进行比较,根据比较结果判断所述训练好的云端执行模型的训练质量是否达标,以得到训练质量的判断结果。2.根据权利要求1所述的方法,其特征在于,所述原始训练集包括多个类别标签的图像数据集,所述额外数据集包括所述图像数据集的特征维度、所述类别标签的数量和预设区域特征;所述获取训练数据集,包括:将图像数据集的所有图像特征划分为固定区域和随机区域,在固定区域内进行随机采样得到固定区域特征,在所述随机区域进行采样得到随机区域特征;根据所述固定区域特征和所述随机区域特征生成额外数据;根据所述原始训练数据集的数量确定的所述额外数据的数量以构建额外数据集,将所述额外数据集与所述原始训练数据合并得到所述训练数据集。3.根据权利要求2所述的方法,其特征在于,所述对生成的额外数据集的准确率和准确率阈值进行比较,根据比较结果判断所述训练好的云端执行模型的训练质量是否达标,以得到训练质量的判断结果,包括:对生成的所述额外数据的准确率进行计算,得到准确率计算结果;根据正确预测额外数据的概率和正确预测额外数据的累积分布函数,得到所述额外数据的准确率阈值;其中,所述正确预测额外数据的概率是基于第一预设公式和所述云端执行模型计算得到;对所述准确率计算结果与所述准确率阈值进行比较,若所述准确率计算结果大于准确率阈值,则得到训练质量达标的判断结果。4.根据权利要求2所述的方法,其特征在于,对所述固定和随机区域特征进行划分和拼接生成额外数据;在所述根据固定区域特征和所述随机区域特征生成额外数据之后,所述方法,还包括:基于伪随机函数得到所述额外数据的标签。5.根据权利要求3所述的方法,其特征在于,所述根据正确预测额外数据的概率和正确预测额外数据的累积分布函数,得到所述额外数据的准确率阈值,包括:根据初始学习额外数据的概率,计算云端执行模型训练时的正确预测额外数据的概率;根据所述正确预测额外数据的概率和第二预设公式计算正确预测额外数据的累积分布函数;基于假设...

【专利技术属性】
技术研发人员:李琦李沛洋徐恪王叶刘卓涛
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1