一种模型安全检测方法、装置以及电子设备制造方法及图纸

技术编号：17486398 阅读：30 留言：0更新日期：2018-03-17 10:39

本说明书实施例公开了一种模型安全检测方法、装置以及电子设备。所述方法包括：利用GAN框架、待检测模型以及样本训练得到判别器，通过判别器对待检测模型针对当前输入数据计算出的中间结果和/或输出结果的数据进行判别，检测待检测模型当前是否安全。

A model security detection method, device, and electronic equipment

An embodiment of the specification discloses a model security detection method, device and electronic equipment. The method includes: using the GAN framework, test model and sample training method is to determine the intermediate results through discriminant analysis to detection model according to the input data to calculate and / or output data is used to detect whether the current security model.

全部详细技术资料下载

【技术实现步骤摘要】
一种模型安全检测方法、装置以及电子设备
本说明书涉及计算机软件
，尤其涉及一种模型安全检测方法、装置以及电子设备。
技术介绍
深度学习是目前比较热门的一个
，基于深度学习模型，可以执行诸如风险识别、语音识别、图像识别等任务。在现有技术中，深度学习模型通常处于服务器上，但其同样也可以处于诸如用户终端等相对开放的环境中。对于后一种情况，需要能够检测模型安全的方案。
技术实现思路
本说明书实施例提供一种模型安全检测方法、装置以及电子设备，用以解决如下技术问题：需要能够检测处于相对开放的环境中的模型的安全的方案。为解决上述技术问题，本说明书实施例是这样实现的：本说明书实施例提供的一种模型安全检测方法，包括：获取待检测模型计算出的结果数据，所述结果数据包括中间结果和/或输出结果的数据；通过判别器对所述结果数据进行判别，确定所述待检测模型的安全检测结果；其中，所述判别器是利用生成对抗网络(GenerativeAdversarialNets，GAN)框架、所述待检测模型以及样本训练得到，在训练得到所述判别器的过程中，所述待检测模型处于可信环境中。本说明书实施例提供的一种模型安全检测装置，包括：获取模块，获取待检测模型计算出的结果数据，所述结果数据包括中间结果和/或输出结果的数据；检测模块，通过判别器对所述结果数据进行判别，确定所述待检测模型的安全检测结果；其中，所述判别器是利用GAN框架、所述待检测模型以及样本训练得到，在训练得到所述判别器的过程中，所述待检测模型处于可信环境中。本说明书实施例提供的一种电子设备，包括：至少一个处理器；以及，与所述至少一个处理器通...
一种模型安全检测方法、装置以及电子设备

【技术保护点】
一种模型安全检测方法，包括：获取待检测模型计算出的结果数据，所述结果数据包括中间结果和/或输出结果的数据；通过判别器对所述结果数据进行判别，确定所述待检测模型的安全检测结果；其中，所述判别器是利用生成对抗网络GAN框架、所述待检测模型以及样本训练得到，在训练得到所述判别器的过程中，所述待检测模型处于可信环境中。

【技术特征摘要】
1.一种模型安全检测方法，包括：获取待检测模型计算出的结果数据，所述结果数据包括中间结果和/或输出结果的数据；通过判别器对所述结果数据进行判别，确定所述待检测模型的安全检测结果；其中，所述判别器是利用生成对抗网络GAN框架、所述待检测模型以及样本训练得到，在训练得到所述判别器的过程中，所述待检测模型处于可信环境中。2.如权利要求1所述的方法，所述待检测模型为深度学习模型，所述中间结果的数据为所述待检测模型的中间层计算出的数据。3.如权利要求1所述的方法，利用GAN框架、所述待检测模型以及样本训练得到所述判别器，具体包括：获取所述待检测模型针对样本计算出的第二结果数据，所述第二结果数据包括第二中间结果和/或第二输出结果的数据；利用所述第二结果数据和GAN框架，训练得到相应的GAN，所述GAN由生成器和所述判别器构成。4.如权利要求3所述的方法，所述第二结果数据是可信的。5.如权利要求3所述的方法，所述利用所述第二结果数据和GAN框架，训练得到相应的GAN，具体包括：根据随机数据和/或所述第二结果数据，生成用于输入生成器的数据；根据所述第二结果数据、所述用于输入生成器的数据和GAN框架，训练得到相应的GAN。6.如权利要求1所述的方法，所述判别器对所述结果数据进行判别，具体包括：判别器判别所述结果数据是真还是假，其中，所述判别结果反映所述结果数据与所述第二结果数据的数据分布是否一致。7.如权利要求6所述的方法，所述通过判别器对所述结果数据进行判别，确定所述待检测模型的安全检测结果，具体包括：通过判别器对所述结果数据进行判别获得判别结果，根据所述判别结果确定所述待检测模型的安全检测结果；或者，获取所述输出结果的数据，根据所述输出结果的数据和所述判别结果，确定所述待检测模型的安全检测结果。8.如权利要求1～7任一项所述的方法，所述判别器处于预定的安全环境中。9.如权利要求8所述的方法，所述判别器处于用户终端。10.一种模型安全检测装置，包括：获取模块，获取待检测模型计算出的结果数据，所述结果数据包括中间结果和/或输出结果的数据；检测模块，通过判别器对所述结果数据进行判别，确定所述待检测模型的安全检测结果；其中，所述判别器是利用生成对抗网络GAN框架、所述待检测模型以及样本训练得到，在训练得到所述判别器的过...

【专利技术属性】
技术研发人员：夏巨鹏，李才伟，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛,KY

全部详细技术资料下载我是这个专利的主人