【技术实现步骤摘要】
本专利技术涉及人工智能领域,具体为一种基于大小模型协同的小模型侧隐私数据增强方法及系统。
技术介绍
1、在联邦学习中,如何在保护用户数据隐私的前提下实现多模态数据的高效增强是提升模型泛化性能的关键挑战。传统方法依赖公共数据集生成合成数据,但数据模态单一且易受领域限制,导致生成数据的多样性与实际场景需求不匹配。尽管用户可通过本地生成器生成特有数据,但单一用户的数据分布狭窄,且生成过程中存在隐私泄露风险。现有差分隐私技术虽能保护原始数据,但噪声添加常导致生成数据质量下降,难以平衡隐私保护与数据效用。此外,跨模态数据间的关联性与一致性缺乏有效优化机制,进一步限制了多模态联邦学习的性能提升。如何在隐私保护框架下实现多模态数据的高质量生成、筛选与融合,是当前联邦学习数据增强的核心难题,其研究对推动安全高效的多模态联邦学习具有重要意义。
技术实现思路
1、针对上述问题,在本专利技术的第一个方面,提供一种基于大小模型协同的小模型侧隐私数据增强方法,所述方法包括:
2、步骤1,根据数据模态类型
...【技术保护点】
1.一种基于大小模型协同的小模型侧隐私数据增强方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述生成器为单模态图像生成器、单模态文本生成器或者双模态生成器;
3.如权利要求1所述的方法,其特征在于,所述对聚类结果进行过滤,具体为:
4.如权利要求1所述的方法,其特征在于,所述步骤3中生成器的损失函数为其中是本地数据的预测损失;分别表示在用户i的数据集以及非用户i的数据集上大模型与用户生成器Di的损失。
5.如权利要求1所述的方法,其特征在于,在步骤3中不断更新生成器,直到数据的信息熵以及本地模
...【技术特征摘要】
1.一种基于大小模型协同的小模型侧隐私数据增强方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述生成器为单模态图像生成器、单模态文本生成器或者双模态生成器;
3.如权利要求1所述的方法,其特征在于,所述对聚类结果进行过滤,具体为:
4.如权利要求1所述的方法,其特征在于,所述步骤3中生成器的损失函数为其中是本地数据的预测损失;分别表示在用户i的数据集以及非用户i的数据集上大模型与用户生成器di的损失。
5.如权利要求1所述的方法,其特征在于,在步骤3中不断更新生成器,直到数据的信息熵以及本地模型的推理准确性的增幅小于阈值。
6...
【专利技术属性】
技术研发人员:邢小培,王龙华,翟艳慧,张阳卉,陈龙,滑展鹏,段志方,杨玉锋,
申请(专利权)人:河南众诚信息科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。