基于半监督学习的联合学习模型的生成方法及装置制造方法及图纸

技术编号:39494631 阅读:10 留言:0更新日期:2023-11-24 11:20
本公开涉及联合学习技术领域,提供了一种基于半监督学习的联合学习模型的生成方法及装置

【技术实现步骤摘要】
基于半监督学习的联合学习模型的生成方法及装置


[0001]本公开涉及联合学习
,尤其涉及一种基于半监督学习的联合学习模型的生成方法及装置


技术介绍

[0002]在模型训练中,很多情况下会同时存在有标签的样本和没有标签的样本,为了减少标注标签的工作量,提高训练的效率,现有技术在这种情况下往往使用的是半监督学习的方法训练模型

使用半监督学习训练模型的方法作为一个独立的模型训练方法存在于多种模型训练方法中,半监督学习训练模型的方法未能和其他模型训练方法很好的结合起来

比如在联合学习中,在同时存在有标签的样本和没有标签的样本时,往往只能对没有标签的样本进行标注,之后再进行联合学习训练,标注没有标签的样本会造成联合学习训练的效率低

[0003]在实现本公开构思的过程中,专利技术人发现相关技术中至少存在如下技术问题:当联合学习训练存在部分没有标签的样本,在训练前必须先标注没有标签的样本,进而导致联合学习训练的效率低的问题


技术实现思路

[0004]有鉴于此,本公开实施例提供了一种基于半监督学习的联合学习模型的生成方法

装置

电子设备及计算机可读存储介质,以解决现有技术中,联合学习训练的效率低的问题

[0005]本公开实施例的第一方面,提供了一种基于半监督学习的联合学习模型的生成方法,包括:通过每个参与方的教师模型标注每个参与方的训练数据集中的多个第一样本,得到每个参与方对应的每个第一样本的伪标签,其中,每个参与方的训练数据集,包括:多个第一样本和多个第二样本,第一样本是没有标签的样本,第二样本是有标签的样本;利用每个参与方的训练数据集中的多个第一样本

每个第一样本的伪标签

多个第二样本和每个第二样本的标签训练每个参与方的学生模型;将每个参与方训练后的学生模型通过指数平滑处理,更新每个参与方的教师模型;聚合多个参与方的教师模型的模型参数,得到聚合参数,根据聚合参数生成联合学习模型

[0006]本公开实施例的第二方面,提供了一种基于半监督学习的联合学习模型的生成装置,包括:标注模块,被配置为通过每个参与方的教师模型标注每个参与方的训练数据集中的多个第一样本,得到每个参与方对应的每个第一样本的伪标签,其中,每个参与方的训练数据集,包括:多个第一样本和多个第二样本,第一样本是没有标签的样本,第二样本是有标签的样本;训练模块,被配置为利用每个参与方的训练数据集中的多个第一样本

每个第一样本的伪标签

多个第二样本和每个第二样本的标签训练每个参与方的学生模型;更新模块,被配置为将每个参与方训练后的学生模型通过指数平滑处理,更新每个参与方的教师模型;生成模块,被配置为聚合多个参与方的教师模型的模型参数,得到聚合参数,根据
聚合参数生成联合学习模型

[0007]本公开实施例的第三方面,提供了一种电子设备,包括存储器

处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤

[0008]本公开实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤

[0009]本公开实施例与现有技术相比存在的有益效果是:通过每个参与方的教师模型标注每个参与方的训练数据集中的多个第一样本,得到每个参与方对应的每个第一样本的伪标签,其中,每个参与方的训练数据集,包括:多个第一样本和多个第二样本,第一样本是没有标签的样本,第二样本是有标签的样本;利用每个参与方的训练数据集中的多个第一样本

每个第一样本的伪标签

多个第二样本和每个第二样本的标签训练每个参与方的学生模型;将每个参与方训练后的学生模型通过指数平滑处理,更新每个参与方的教师模型;聚合多个参与方的教师模型的模型参数,得到聚合参数,根据聚合参数生成联合学习模型

采用上述技术手段,可以解决现有技术中,当联合学习训练存在部分没有标签的样本,在训练前必须先标注没有标签的样本,进而导致联合学习训练的效率低的问题,,从而减少在训练前必须先标注没有标签的样本的步骤,以提高联合学习训练的效率

附图说明
[0010]为了更清楚地说明本公开实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图

[0011]图1是本公开实施例的一种联合学习的架构示意图;
[0012]图2是本公开实施例提供的一种基于半监督学习的联合学习模型的生成方法的流程示意图;
[0013]图3是本公开实施例提供的一种基于半监督学习的联合学习模型的生成装置的结构示意图;
[0014]图4是本公开实施例提供的一种电子设备的结构示意图

具体实施方式
[0015]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构

技术之类的具体细节,以便透彻理解本公开实施例

然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本公开

在其它情况中,省略对众所周知的系统

装置

电路以及方法的详细说明,以免不必要的细节妨碍本公开的描述

[0016]联合学习是指在确保数据安全及用户隐私的前提下,综合利用多种
AI(Artificial Intelligence
,人工智能
)
技术,联合多方合作共同挖掘数据价值,催生基于联合建模的新的智能业态和模式

联合学习至少具有以下特点:
[0017](1)
参与节点控制自有数据的弱中心化联合训练模式,确保共创智能过程中的数据隐私安全

[0018](2)
在不同应用场景下,利用筛选和
/
或组合
AI
算法

隐私保护计算,建立多种模型聚合优化策略,以获取高层次

高质量的模型

[0019](3)
在确保数据安全及用户隐私的前提下,基于多种模型聚合优化策略,获取提升联合学习引擎的效能方法,其中效能方法可以是通过解决包括计算架构并行

大规模跨域网络下的信息交互

智能感知

异常处理机制等,提升联合学习引擎的整体效能

[0020](4)
获取各场景下多方用户的需求,通过互信机制,确定合理评估本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于半监督学习的联合学习模型的生成方法,其特征在于,包括:通过每个参与方的教师模型标注每个参与方的训练数据集中的多个第一样本,得到每个参与方对应的每个第一样本的伪标签,其中,每个参与方的训练数据集,包括:多个第一样本和多个第二样本,第一样本是没有标签的样本,第二样本是有标签的样本;利用每个参与方的训练数据集中的多个第一样本

每个第一样本的伪标签

多个第二样本和每个第二样本的标签训练每个参与方的学生模型;将每个参与方训练后的学生模型通过指数平滑处理,更新每个参与方的教师模型;聚合多个参与方的教师模型的模型参得到聚合参数,根据所述聚合参数生成联合学习模型
。2.
根据权利要求1所述的方法,其特征在于,所述通过每个参与方的教师模型标注每个参与方的训练数据集中的多个第一样本,得到每个参与方对应的每个第一样本的伪标签步骤之前,所述方法包括:初始化每个参与方的学生模型;将每个参与方初始化后的学生模型通过所述指数平滑处理,以得到每个参与方的教师模型;利用每个参与方的训练数据集中的多个第二样本训练每个参与方的教师模型
。3.
根据权利要求2所述的方法,其特征在于,所述将每个参与方初始化后的学生模型通过所述指数平滑处理,得到每个参与方的教师模型,包括:计算每个参与方初始化后的学生模型的模型参数对应的指数移动平均值;根据每个参与方对应的指数移动平均值,生成每个参与方的教师模型
。4.
根据权利要求1所述的方法,其特征在于,所述通过每个参与方的教师模型标注每个参与方的训练数据集中的多个第一样本,得到每个参与方对应的每个第一样本的伪标签步骤之前,所述方法包括:对每个参与方的训练数据集中的多个第一样本进行数据弱增强处理,得到每个参与方对应的弱增强处理结果;利用每个参与方对应的所述弱增强处理结果更新每个参与方的训练数据集中的多个第一样本
。5.
根据权利要求1所述的方法,其特征在于,所述利用每个参与方的训练数据集中的多个第一样本

每个第一样本的伪标签

多个第二样本和每个第二样本的标签训练每个参与方的学生模型,包括:利用交叉熵损失函数计算每个参与方的训练数据集中的多个第一样本和每个第一样本的伪标签对应的第一损失值;利用所述交叉熵损失函数计算每个参与方的训练数据集中的多个第二样本和每个第二样本的标签对应的第二损失值;根据每个参与方对应的第一损失值和第二损失值,按照预设权值计算每个参与方对应的第三损失值;基于每个参与方对应的第三损失值,更新每个参与方的学生模型
。6.
根据权利要求1所述的方法,其特征在于,所述利用每个参与方的训练...

【专利技术属性】
技术研发人员:何博睿
申请(专利权)人:新智我来网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1