基于训练过程证明的深度学习模型所有权验证方法和装置制造方法及图纸

技术编号：38332171 阅读：19 留言：0更新日期：2023-07-29 09:14

本申请提出了一种基于训练过程证明的深度学习模型所有权验证方法，包括：获取待验证深度学习模型初始化使用的高斯混合分布、待验证深度学习模型的待验证中间模型序列，以及对应的验证集，根据高斯混合分布、待验证中间模型序列和验证集，计算待验证中间模型序列的准确率单调性指标、参数距离单调性指标、参数分布连续性指标、初始参数分布指标、初始参数随机性指标和模型序列距离指标，并根据计算得到的待验证中间模型序列的各项指标，判断待验证中间模型序列的真实性，从而得到待验证深度学习模型的所有权验证结果。本申请提出一种模型所有权验证方案，适用范围广，不会造成模型性能损失，且难以被攻击者攻击。且难以被攻击者攻击。且难以被攻击者攻击。

全部详细技术资料下载

【技术实现步骤摘要】
基于训练过程证明的深度学习模型所有权验证方法和装置

[0001]本申请涉及人工智能安全
，尤其涉及一种基于训练过程证明的深度学习模型所有权验证方法和装置。

技术介绍

[0002]近年来深度学习技术迅速发展，在广泛的领域中得到了实际应用。在实践中，训练高性能的深度学习模型需要开发者大量调试模型结构与超参数，在这一过程中不可避免需要大量的计算资源和高质量的训练数据资源。因此,深度学习模型有较高的知识产权价值。然而，在实践中，深度学习模型可能被售卖给客户，客户可能违规将模型发布给第三方、侵犯模型所有者的模型知识产权权益。同时，深度学习模型应用场景复杂多样，攻击者可以利用模型提取攻击(model extraction attack)、基于侧信道的模型参数窃取等攻击手段非法获取所有者的模型。
[0003]面对这些潜在的对模型知识产权的侵犯行为，设计深度学习模型的所有权验证算法可以判断模型持有者是否对模型具有所有权，从而为模型真实所有者提供所有权证明、保护模型的知识产权。攻击者不具有非法获取的模型的所有权证明，在知识产权争议中无法证明对模型具有所有权。为应对现实中的安全和可用性问题，验证算法需要满足以下要求：(1)模型完整性(model intactness)，验证算法不应对模型本身功能产生较大影响；(2)鲁棒性(robustness)，攻击者无法使模型真实所有者的所有权证明失效；(3)排他性(exclusiveness)，攻击者非法获取到模型后无法伪造出一个对应的能通过验证的所有权证明。
[0004]现有...

【技术保护点】

【技术特征摘要】
1.一种基于训练过程证明的深度学习模型所有权验证方法，其特征在于，包括以下步骤：获取待验证深度学习模型初始化使用的高斯混合分布、所述待验证深度学习模型的待验证中间模型序列，以及对应的验证集，其中，所述待验证中间模型序列由所述待验证深度学习模型在每个训练轮次中的模型参数组成；根据所述高斯混合分布、所述待验证中间模型序列和所述验证集，计算所述待验证中间模型序列的准确率单调性指标、参数距离单调性指标、参数分布连续性指标、初始参数分布指标、初始参数随机性指标和模型序列距离指标；根据所述待验证中间模型序列的准确率单调性指标、参数距离单调性指标、参数分布连续性指标、初始参数分布指标、初始参数随机性指标和模型序列距离指标，判断所述待验证中间模型序列的真实性，从而得到所述待验证深度学习模型的所有权验证结果。2.如权利要求1所述的方法，其特征在于，所述根据所述高斯混合分布、所述待验证中间模型序列和所述验证集，计算所述待验证中间模型序列的准确率单调性指标、参数距离单调性指标、参数分布连续性指标、初始参数分布指标、初始参数随机性指标和模型序列距离指标，包括：根据所述待验证中间模型序列和所述验证集，依次计算所述待验证中间模型序列中的模型在所述验证集上的准确率，并计算所述准确率和训练轮次的皮尔森相关系数作为准确率单调性指标；计算所述待验证中间模型序列中的模型和收敛模型之间的参数距离，并计算所述参数距离和训练轮次之间的皮尔森相关系数作为参数距离单调性指标，其中，所述收敛模型为所述待验证中间模型序列中的最终模型；依次计算所述待验证中间模型序列中连续的两个模型的参数分布距离，得到参数分布连续性指标；计算所述待验证中间模型序列中初始模型和所述高斯混合分布之间的参数分布距离，得到初始参数分布指标；计算所述待验证中间模型序列中初始模型的参数的随机程度，得到初始参数随机性指标；计算所述待验证中间模型序列中的初始模型和收敛模型之间的参数距离，得到模型序列距离指标。3.如权利要求2所述的方法，其特征在于，所述准确率单调性指标的计算方法为：其中，ρ
acc
表示准确率单调性指标，N表示总训练轮次数目，rank(
·
)表示中间模型准确率在待验证中间模型序列中大小的排名，acc(C
i
,D
val
)表示待验证中间模型序列中的第i个中间模型C
i
在验证集上的准确率，D
val
表示验证集；所述参数距离单调性指标的计算方式为：
其中，ρ
dis
表示参数距离单调性指标，N表示总训练轮次数目，rank(d(C
i
,C
N
))表示中间模型和收敛模型之间参数的欧氏距离在待验证中间模型序列中大小的排名，d(C
i
,C
N
)表示待验证中间模型序列中的第i个中间模型C
i
和收敛模型C
N
之间参数的欧氏距离；所述参数分布连续性指标的计算方式为：其中，c
weight
表示参数分布连续性指标，N表示总训练轮次数目，L表示模型的层数，表示待验证中间模型序列中第i个中间模型第l层的参数矩阵，P(
·
)表示参数的分布，EMD(
·
,
·
)表示两个分布之间的推土距离；所述初始参数分布指标的计算方式为：其中，d
init
表示初始参数分布指标，L表示模型的层数，EMD(
·
,
·
)表示两个分布之间的推土距离，P(
·
)表示参数的分布，表示初始模型的第l层的参数矩阵，P
GMM
(
·
0表示高斯混合分布；所述初始参数随机性指标的计算方式为计算待验证中间模型序列中初始模型的各层参数主成分分析结果中最大主成分的方差占比；所述模型序列距离指标的计算方式为：d
chain
＝d(C
...

【专利技术属性】
技术研发人员：李琦，刘云鹏，徐恪，刘卓涛，
申请(专利权)人：清华大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人