【技术实现步骤摘要】
基于安全计算的图像数据标注方法及系统
[0001]本专利技术属于数据识别
,尤其涉及一种基于安全计算的图像数据标注方法及系统。
技术介绍
[0002]在图像数据标注领域,以及其他类人工智能领域,迁移学习的应用非常广泛;其中,在图像数据标注中,训练模型通常依赖大量可用的有标图像数据,但在实际中,有标签图像数据十分匮乏,绝大部分图像数据是没有标签的无标图像数据;使用迁移学习可以利用有标签图像数据为无标签图像数据标注标签。
[0003]然而,专利技术人发现,无论是有标签图像数据还是无标签图像数据,都蕴含着极大的商业价值和隐私信息,且这些图像数据往往由不同的实体用户(企业、单位或个人)所持有,出于对图像数据隐私性的考虑,实体用户不愿意直接将自己的图像数据贡献出来,用于迁移学习。
技术实现思路
[0004]本专利技术为了解决上述问题,提出了一种基于安全计算的图像数据标注方法及系统,本专利技术通过秘密分享算法和姚氏混淆电路协议,能够在有标签图像数据和无标签图像数据分别由两个实体用户参与方持有的分布式场景下, ...
【技术保护点】
【技术特征摘要】
1.一种基于安全计算的图像数据标注方法,其特征在于,包括:获取有标签图像数据集和无标签图像数据集;计算有标签图像数据集的秘密矩阵和无标签图像数据集的秘密矩阵;分别计算所述有标签图像数据集和所述无标签图像数据集的数据集算术秘密份额,以及秘密矩阵算术秘密份额;利用算术秘密分享的性质和安全乘法协议对数据集算术秘密份额和秘密矩阵算术秘密份额进行处理,得到安全乘积矩阵;计算得到安全乘积矩阵对应的特征多项式系数的算术秘密份额;将特征多项式系数的算术秘密份额转换为姚氏秘密分享份额;依据姚氏秘密分享份额,利用姚氏混淆电路协议得到该安全乘积矩阵对应的特征值份额,并利用基础解系协议得到对应的特征向量;将特征向量组成特征向量矩阵份额,利用安全乘法协议对特征向量矩阵份额和数据集算术秘密份额进行处理,得到迁移学习后的源域数据和目标域数据;以源域数据为训练数据集,目标域数据作为预测数据集,预测得到的预测值为目标域数据的标注标签;利用得到的标注标签,对无标签图像数据集进行标注。2.如权利要求1所述的一种基于安全计算的图像数据标注方法,其特征在于,有标签图像数据集和无标签图像数据集中,每个集合元素都是一个向量;计算有标签图像数据集的秘密矩阵和无标签图像数据集的秘密矩阵时:计算每个集合元素与其转置的内积得到新的集合元素,新的集合元素构成秘密矩阵。3.如权利要求1所述的一种基于安全计算的图像数据标注方法,其特征在于,利用算术秘密分享的性质和安全乘法协议对数据集算术秘密份额和秘密矩阵算术秘密份额进行处理,得到安全乘积矩阵的过程为:计算和;其中,和分别为有标签图像数据集和无标签图像数据集对应的秘密矩阵算术秘密份额,L为第一预设矩阵;K为有标签图像数据集和无标签图像数据集通过计算所得的矩阵;的下标1表示是属于有标签图像数据集的份额;的下标2表示是属于无标签图像数据集的份额;A表示算术秘密份额;计算,计算;其中,H为第二预设矩阵;依据和,通过安全乘法协议,计算得到和;随机选取实数和;计算得到和,其中,;通过和计算的秘密矩阵的逆矩阵,得到和;依据和,通过安全乘法协议,计算得到和
;依据和,通过安全乘法协议,计算得到最终安全乘积矩阵的秘密矩阵算术秘密份额和。4.如权利要求3所述的一种基于安全计算的图像数据标注方法,其特征在于,第二预设矩阵;其中,I
m+n
为(m+n)阶单位矩阵;e为一个元素全为1的(m+n)维列向量;e
T
为e的转置;m为源域数据样本个数;n为目标域数据样本个数。5.如权利要求4所述的一种基于安全计算的图像数据标注方法,其特征在于,第一预设矩阵L中的元素L
ij
满足:。6.如权利要求5所述的一种基于安全计算的图...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。