一种基于联邦学习和生成对抗网络的医学图像数据集制作方法技术

技术编号:36299619 阅读:17 留言:0更新日期:2023-01-13 10:15
本发明专利技术涉及一种基于联邦学习和生成对抗网络的医学图像数据集制作方法,包括:将生成对抗网络模型中的判别器作为全局模型下发给所有客户端;客户端随机抽取训练样本发送至服务器;服务器将训练样本输入中心生成器生成仿真样本并发送给客户端;客户端利用全局模型对仿真样本和训练样本中的样本进行判别得到判别结果,根据判别结果更新全局模型的参数生成本地模型;并将本地模型以及判别结果上传至服务器;服务器根据所有客户端本地样本的数量计算客户端的聚合权重;并根据样本的判别结果更新中心生成器的参数;服务器根据所有客户端的聚合权重对本地模型进行聚合得到新的全局模型,重复步骤上述步骤利用收敛后的中心生成器生成仿真医学图像数据集。生成仿真医学图像数据集。生成仿真医学图像数据集。

【技术实现步骤摘要】
一种基于联邦学习和生成对抗网络的医学图像数据集制作方法


[0001]本专利技术属于联邦学习技术应用领域,具体涉及一种基于联邦学习和生成对抗网络的医学图像数据集制作方法。

技术介绍

[0002]近年来,随着图像分割、图像分类等机器学习技术的发展,机器学习技术在医学领域得到广泛应用,例如,通过将人工智能与病理诊断的结合即人工智能辅助判读是当前医学领域提升病理诊断效率和准确性的新趋势,人工智能辅助判读的效率在于机器学习的训练,而医学图像数据是该类算法在预测分析过程中的关键元素。然而由于保护患者隐私的要求,医疗机构通常不愿与其它机构共享私有数据。使得一些任务中的训练数据集过少,导致模型训练不充分、过拟合从而导致人工智能辅助判读的效率以及医学图像的预测分析不准确。
[0003]目前,针对图像的数据增强主要通过对图像进行一定程度内的随机旋转,平移,缩放,裁剪,填充,左右翻转;或对图像中像素添加噪声扰动,比如高斯白噪声;或使用生成对抗网络模型生成合成图像数据,而通过生成对抗网络模型生成图像数据存在以下技术问题:
[0004]问题1:输入图像的特征向量维度过高导致数据处理复杂度高、模型训练效率低、训练时间长导致训练成本高;
[0005]问题2:传统生成对抗网络模型只能在本地训练,生成具有本地图像数据特征的仿真图像,无法同时学习多个参与方的多源数据特征,因此生成的图像数据不能反应多个参与方的数据特征;
[0006]问题3:在多数据源环境中,局部数据分布可能差异较大,没有衡量各数据源分布的差异性,导致生成的仿真图像集不能反映各数据源的数据分布情况。

技术实现思路

[0007]为了解决
技术介绍
中存在的问题,本专利技术提供一种基于联邦学习和生成对抗网络的医学图像数据集制作方法,包括:该方法通过改进的分布式生成对抗网络模型学习多源数据分布,模型由服务器上唯一的中心生成器与分布在客户端上的多个判别器组成,每个判别器只根据其本地数据进行训练,并将反馈通过算法聚合后发送给生成器。当模型收敛后使用生成器生成高度仿真的合成数据,达到对数据进行增强的效果。
[0008]进一步的,一种基于联邦学习和生成对抗网络的医学图像数据集制作方法,具体包括以下步骤:
[0009]S1:服务器获取客户端每个类别的本地样本数量,并将生成对抗网络模型中的判别器作为全局模型下发给所有客户端;客户端对本地样本数据进行特征提取得到本地样本的特征向量;
[0010]S2:客户端随机抽取m个本地样本的特征向量作为训练样本集并发送至服务器;
[0011]S3:服务器将训练样本集中的训练样本输入生成对抗网络的中心生成器生成仿真样本集;并将仿真样本集发送给客户端;
[0012]S4:客户端利用全局模型对仿真样本集和训练样本集中的样本进行判别得到仿真样本集和训练样本集中样本的判别结果,并根据判别结果通过随机梯度上升的方式更新全局模型的参数生成本地模型;并将本地模型以及仿真样本集中样本的判别结果上传至服务器;
[0013]S5:服务器根据所有客户端每个类别的本地样本数量计算客户端的聚合权重;并根据仿真样本集中样本的判别结果利用随机梯度下降的方式更新中心生成器的参数;
[0014]S6:服务器根据所有客户端的聚合权重对所有客户端上传的本地模型进行聚合得到下一轮迭代训练的全局模型,并将下一轮迭代训练的全局模型下发给所有客户端重复步骤S2

S6直至中心生成器收敛为止,利用收敛后的中心生成器生成仿真医学图像数据集。
[0015]本专利技术至少具有以下有益效果
[0016]本专利技术通过稀疏编码技术解决了输入图像的特征向量维度过高的问题,减小了本地样本的特征维度,降低了数据处理的复杂度,提高了模型的训练效率,减少了训练时间,降低了训练成本;通过将判别器放在客户端本地进行训练可以学习多数据源的本地数据特征,使得分布式生成对抗网络模型能学习多个数据源的数据分布,生成仿真度更高的图像,本专利技术通过计算客户端的聚合权重衡量了多个客户端本地数据分布的差异性,使得全局模型对不同的数据分布能较好地拟合。
附图说明
[0017]图1为本专利技术的方法流程图;
[0018]图2为本专利技术中本地样本的特征向量提取示意图;
[0019]图3为本专利技术的分布式生成对抗网络架构图;
[0020]图4为本专利技术的本专利技术本地模型聚合流程图;
[0021]图5为本专利技术实施例中的数据增强应用于图像分割模型示意图。
具体实施方式
[0022]以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本专利技术的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
[0023]生成对抗网络:
[0024]生成对抗网络由一个生成网络与一个判别网络组成,通过两个神经网络相互博弈的方式进行学习。生成网络从潜在空间中随机取样作为输入,其输出结果需要尽量模仿训练集中的真实样本;判别网络的输入则为真实样本或生成网络的输出,其目的是将生成网络的输出从真实样本中尽可能分辨出来。而生成网络则要尽可能地欺骗判别网络。两个网
络相互对抗、不断调整参数,最终目的是使判别网络无法判断生成网络的输出结果是否真实。
[0025]请参阅图1和图3,本专利技术提供一种基于联邦学习和生成对抗网络的医学图像数据集制作方法,包括:
[0026]S1:服务器获取客户端每个类别的本地样本数量;并将生成对抗网络模型中的判别器作为全局模型下发给所有客户端;客户端对本地样本数据进行特征提取得到本地样本的特征向量;所述客户端为各大医疗机构平台;
[0027]请参阅图2,所述客户端对本地样本数据进行特征提取得到本地样本的特征向量包括:
[0028]S11:利用本地样本数据构造m行n列的样本空间矩阵D(m
×
n);其中,m*n表示客户端的本地样本数量;所述本地样本为医学图像数据,其中,m和n的值均大于2,N表示样本空间矩阵D的列数,m表示样本样本空间矩阵D的行数;
[0029]S12:从样本空间矩阵D中随机挑选k列样本数据作为字典矩阵M(m
×
k);k为小于n的正整数,所述字典矩阵如表1所示;
[0030]表1字典矩阵M
[0031]c
11
····
c
1y
···
c
1k
················
C
x1
····
C
xy
···
C
xk
···············
c
m1
····
c<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习和生成对抗网络的医学图像数据集制作方法,其特征在于,包括:S1:服务器获取客户端每个类别的本地样本数量,并将生成对抗网络模型中的判别器作为全局模型下发给所有客户端;客户端对本地样本数据进行特征提取得到本地样本的特征向量;S2:客户端随机抽取m个本地样本的特征向量作为训练样本集并发送至服务器;S3:服务器将训练样本集中的训练样本输入生成对抗网络的中心生成器生成仿真样本集;并将仿真样本集发送给客户端;S4:客户端利用全局模型对仿真样本集和训练样本集中的样本进行判别得到仿真样本集和训练样本集中样本的判别结果,并根据判别结果通过随机梯度上升的方式更新全局模型的参数生成本地模型;并将本地模型以及仿真样本集中样本的判别结果上传至服务器;S5:服务器根据所有客户端每个类别的本地样本数量计算客户端的聚合权重;并根据仿真样本集中样本的判别结果利用随机梯度下降的方式更新中心生成器的参数;S6:服务器根据所有客户端的聚合权重对所有客户端上传的本地模型进行聚合得到下一轮迭代训练的全局模型,并将下一轮迭代训练的全局模型下发给所有客户端重复步骤S2

S6直至中心生成器收敛为止,利用收敛后的中心生成器生成仿真医学图像数据集。2.根据权利要求1所述的一种基于联邦学习和生成对抗网络的医学图像数据集制作方法,其特征在于,所述客户端对本地样本数据进行特征提取得到本地样本的特征向量包括:S11:利用本地样本数据构造m行n列的样本空间矩阵D;S12:从样本空间矩阵D中随机挑选k列样本数据作为字典矩阵M;S13:创建稀疏编码矩阵a;所述稀疏编码矩阵a中每一个元素均为0;S14:根据字典矩阵M和稀疏编码矩阵a利用OMP算法求取样本空间矩阵D中每个本地样本的稀疏编码得到初始稀疏编码矩阵a

;S15:利用SVD算法更新字典M和初始稀疏编码矩阵a

中的非零编码,重复步骤S14

S15直至收敛,得到客户端...

【专利技术属性】
技术研发人员:肖云鹏李旭峰李暾贾朝龙庞育才王蓉王国胤
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1