一种面向外包深度学习的训练质量验证方法及装置制造方法及图纸

技术编号：36189022 阅读：42 留言：0更新日期：2022-12-31 21:00

本发明专利技术公开了一种面向外包深度学习的训练质量验证方法及装置，其中，该方法包括：获取训练数据集；训练数据集，包括额外数据集和原始训练数据集；构建基于深度神经网络的云端执行模型；将训练数据集输入云端执行模型进行训练，以得到训练好的云端执行模型；对生成额外数据集的准确率和准确率阈值进行比较，根据比较结果判断训练好的云端执行模型的训练质量是否达标，以得到训练质量的判断结果。本发明专利技术所提出的验证方案开销较小，同时不改变现有外包深度学习服务的流程，易于部署，能够有效地保护用户权益。保护用户权益。保护用户权益。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向外包深度学习的训练质量验证方法及装置

[0001]本专利技术涉人工智能安全
，特别是涉及一种面向外包深度学习的训练质量验证方法及装置。

技术介绍

[0002]近年来人工智能领域一直处于飞速发展阶段，各类创新应用层出不穷，取得了令人瞩目的发展成果。作为实现人工智能的主要方法，深度学习技术已经被广泛应用到各类任务中，如利用深度神经网络进行图像识别等。在实践中，用户(即数据的持有者)出于自己有限的计算资源或专业知识，经常会将训练深度学习模型的过程外包给专业的云服务商进行，这类服务被称为外包深度学习服务。外包深度学习为那些不具备训练条件的用户提供了便利，已成为推广人工智能应用的重要途径。
[0003]然而在外包深度学习的过程中，由于对数据、模型的操作均在云端进行，用户不参与任何训练过程，所以用户难以确定云服务商所交付的模型是否被训练到了最佳性能。一方面云服务商不可信的行为可能会损害用户权益，其可能在模型还未完全收敛的时候就停止训练以节省自己的计算资源从而获取经济收益；另一方面云端的网络环境复杂，攻击者可能利用其...

【技术保护点】

【技术特征摘要】
1.一种面向外包深度学习的训练质量验证方法，其特征在于，包括以下步骤：获取训练数据集；所述训练数据集，包括额外数据集和原始训练数据集；构建基于深度神经网络的云端执行模型；将所述训练数据集输入所述云端执行模型进行训练，以得到训练好的云端执行模型；对生成所述额外数据集的准确率和准确率阈值进行比较，根据比较结果判断所述训练好的云端执行模型的训练质量是否达标，以得到训练质量的判断结果。2.根据权利要求1所述的方法，其特征在于，所述原始训练集包括多个类别标签的图像数据集，所述额外数据集包括所述图像数据集的特征维度、所述类别标签的数量和预设区域特征；所述获取训练数据集，包括：将图像数据集的所有图像特征划分为固定区域和随机区域，在固定区域内进行随机采样得到固定区域特征，在所述随机区域进行采样得到随机区域特征；根据所述固定区域特征和所述随机区域特征生成额外数据；根据所述原始训练数据集的数量确定的所述额外数据的数量以构建额外数据集，将所述额外数据集与所述原始训练数据合并得到所述训练数据集。3.根据权利要求2所述的方法，其特征在于，所述对生成的额外数据集的准确率和准确率阈值进行比较，根据比较结果判断所述训练好的云端执行模型的训练质量是否达标，以得到训练质量的判断结果，包括：对生成的所述额外数据的准确率进行计算，得到准确率计算结果；根据正确预测额外数据的概率和正确预测额外数据的累积分布函数，得到所述额外数据的准确率阈值；其中，所述正确预测额外数据的概率是基于第一预设公式和所述云端执行模型计算得到；对所述准确率计算结果与所述准确率阈值进行比较，若所述准确率计算结果大于准确率阈值，则得到训练质量达标的判断结果。4.根据权利要求2所述的方法，其特征在于，对所述固定和随机区域特征进行划分和拼接生成额外数据；在所述根据固定区域特征和所述随机区域特征生成额外数据之后，所述方法，还包括：基于伪随机函数得到所述额外数据的标签。5.根据权利要求3所述的方法，其特征在于，所述根据正确预测额外数据的概率和正确预测额外数据的累积分布函数，得到所述额外数据的准确率阈值，包括：根据初始学习额外数据的概率，计算云端执行模型训练时的正确预测额外数据的概率；根据所述正确预测额外数据的概率和第二预设公式计算正确预测额外数据的累积分布函数；基于假设...

【专利技术属性】
技术研发人员：李琦，李沛洋，徐恪，王叶，刘卓涛，
申请(专利权)人：清华大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人