一种基于联邦学习的多源异构数据融合方法技术

技术编号:34460406 阅读:125 留言:0更新日期:2022-08-06 17:19
本发明专利技术公开了一种基于联邦学习的多源异构数据融合方法,旨在解决现有异构数据融合方法所存在的网络带宽占用量大、用户数据存在泄露风险的问题,包括:在初始化阶段,中心控制节点对特征提取模块、特征融合模块和特征决策模块进行网络参数随机初始化,并下发至边缘节点;在模型训练阶段,边缘节点根据本地的数据集结构选择对应的特征提取模块,并利用本地数据集对选择的特征提取模块以及接收到的特征融合模块和特征决策模块进行训练;待训练结束后,将训练后的模型返回至中心控制节点;在模型聚合阶段,中心控制节点采用平均聚合算法对训练后的模型进行聚合,形成具有全局异构数据特征的共享模型,并将共享模型重新下发至边缘节点进行新一轮训练。节点进行新一轮训练。节点进行新一轮训练。

【技术实现步骤摘要】
一种基于联邦学习的多源异构数据融合方法


[0001]本专利技术属于数据处理
,具体地说,是涉及一种用于对多源异构数据进行融合的方法。

技术介绍

[0002]异构数据融合是一种用于解决不同数据源下,结构不一的数据之间融合问题的技术。异构数据融合的目标就在于实现不同结构的数据之间的数据信息资源、硬件设备资源和人力资源的合并与共享。
[0003]现阶段的异构数据融合方法主要采用以云计算模型为核心的数据集中化处理方式,其优势在于异构数据融合可以在云服务器层面上运行,继而降低服务的维护和部署成本。但是,这种异构数据融合方法存在以下问题:其一,需要将所有边缘设备的数据全部上传至云端进行统一处理,不仅效率低下,而且会造成额外的带宽开销,同时网络延迟也会增加;其二,随着用户隐私意识的提高,边缘设备的数据很有可能在上传通信链路时发生泄密,导致个人隐私的安全问题无法得到保障。

技术实现思路

[0004]本专利技术的目的在于提供一种基于联邦学习的多源异构数据融合方法,以解决现有的异构数据融合方法所存在的网络带宽占用量大、用户数据存在泄露本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习的多源异构数据融合方法,其特征在于,包括:初始化阶段:中心控制节点对特征提取模块、特征融合模块和特征决策模块进行网络参数随机初始化,并将初始化后的特征提取模块、特征融合模块和特征决策模块下发至边缘节点;模型训练阶段:边缘节点根据本地的数据集结构选择对应的特征提取模块,并利用本地数据集对选择的特征提取模块以及接收到的特征融合模块和特征决策模块进行训练;待训练结束后,将训练后的特征提取模块、特征融合模块和特征决策模块返回至中心控制节点进行模型聚合;模型聚合阶段:中心控制节点采用平均聚合算法对训练后的模型进行聚合,然后将聚合后的特征提取模块、特征融合模块和特征决策模块重新下发至边缘节点进行新一轮训练。2.根据权利要求1所述的基于联邦学习的多源异构数据融合方法,其特征在于,在所述模型训练阶段,边缘节点训练结束的条件是本地节点训练轮数超过中心控制节点给定的训练轮数。3.根据权利要求1所述的基于联邦学习的多源异构数据融合方法,其特征在于,所述特征提取模块包括:音频、视觉特征子网络,其针对音频信息和视觉信息,分别采用COVAREP声学分析框架和FACET面部表情分析框架对数据集进行特征采样提取;文本特征子网络,其在编码部分先采用全局词向量对口语词进行预处理,然后使用长短期记忆人工神经网络学习与时间相关的语言表示,并将此作为CNN卷积神经网络的输入,在卷积层通过卷积核对文本信息进行局部特征提取。4.根据权利要求1所述的基于联邦学习的多源异构数据融合方法,其特征在于,所述特征融合模块包括具有异构数据特征空间的记忆单元W,所述记忆单元W的每一模态对应...

【专利技术属性】
技术研发人员:侯瑞春魏振辉
申请(专利权)人:中国海洋大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1