一种基于联邦学习和生成对抗网络的医学图像数据集制作方法技术

技术编号：36299619 阅读：17 留言：0更新日期：2023-01-13 10:15

本发明专利技术涉及一种基于联邦学习和生成对抗网络的医学图像数据集制作方法，包括：将生成对抗网络模型中的判别器作为全局模型下发给所有客户端；客户端随机抽取训练样本发送至服务器；服务器将训练样本输入中心生成器生成仿真样本并发送给客户端；客户端利用全局模型对仿真样本和训练样本中的样本进行判别得到判别结果，根据判别结果更新全局模型的参数生成本地模型；并将本地模型以及判别结果上传至服务器；服务器根据所有客户端本地样本的数量计算客户端的聚合权重；并根据样本的判别结果更新中心生成器的参数；服务器根据所有客户端的聚合权重对本地模型进行聚合得到新的全局模型，重复步骤上述步骤利用收敛后的中心生成器生成仿真医学图像数据集。生成仿真医学图像数据集。生成仿真医学图像数据集。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于联邦学习和生成对抗网络的医学图像数据集制作方法

[0001]本专利技术属于联邦学习技术应用领域，具体涉及一种基于联邦学习和生成对抗网络的医学图像数据集制作方法。

技术介绍

[0002]近年来，随着图像分割、图像分类等机器学习技术的发展，机器学习技术在医学领域得到广泛应用，例如，通过将人工智能与病理诊断的结合即人工智能辅助判读是当前医学领域提升病理诊断效率和准确性的新趋势，人工智能辅助判读的效率在于机器学习的训练，而医学图像数据是该类算法在预测分析过程中的关键元素。然而由于保护患者隐私的要求，医疗机构通常不愿与其它机构共享私有数据。使得一些任务中的训练数据集过少，导致模型训练不充分、过拟合从而导致人工智能辅助判读的效率以及医学图像的预测分析不准确。
[0003]目前，针对图像的数据增强主要通过对图像进行一定程度内的随机旋转，平移，缩放，裁剪，填充，左右翻转；或对图像中像素添加噪声扰动，比如高斯白噪声；或使用生成对抗网络模型生成合成图像数据，而通过生成对抗网络模型生成图像数据存在以下技术问题：
[0004]问题1：输入图像的特征向量维度过高导致数据处理复杂度高、模型训练效率低、训练时间长导致训练成本高；
[0005]问题2：传统生成对抗网络模型只能在本地训练，生成具有本地图像数据特征的仿真图像，无法同时学习多个参与方的多源数据特征，因此生成的图像数据不能反应多个参与方的数据特征；
[0006]问题3：在多数据源环境中，局部数据分布可能差异较大，没有衡量各数据源分布的差异性，导致生成...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习和生成对抗网络的医学图像数据集制作方法，其特征在于，包括：S1：服务器获取客户端每个类别的本地样本数量，并将生成对抗网络模型中的判别器作为全局模型下发给所有客户端；客户端对本地样本数据进行特征提取得到本地样本的特征向量；S2：客户端随机抽取m个本地样本的特征向量作为训练样本集并发送至服务器；S3：服务器将训练样本集中的训练样本输入生成对抗网络的中心生成器生成仿真样本集；并将仿真样本集发送给客户端；S4：客户端利用全局模型对仿真样本集和训练样本集中的样本进行判别得到仿真样本集和训练样本集中样本的判别结果，并根据判别结果通过随机梯度上升的方式更新全局模型的参数生成本地模型；并将本地模型以及仿真样本集中样本的判别结果上传至服务器；S5：服务器根据所有客户端每个类别的本地样本数量计算客户端的聚合权重；并根据仿真样本集中样本的判别结果利用随机梯度下降的方式更新中心生成器的参数；S6：服务器根据所有客户端的聚合权重对所有客户端上传的本地模型进行聚合得到下一轮迭代训练的全局模型，并将下一轮迭代训练的全局模型下发给所有客户端重复步骤S2
‑
S6直至中心生成器收敛为止，利用收敛后的中心生成器生成仿真医学图像数据集。2.根据权利要求1所述的一种基于联邦学习和生成对抗网络的医学图像数据集制作方法，其特征在于，所述客户端对本地样本数据进行特征提取得到本地样本的特征向量包括：S11：利用本地样本数据构造m行n列的样本空间矩阵D；S12：从样本空间矩阵D中随机挑选k列样本数据作为字典矩阵M；S13：创建稀疏编码矩阵a；所述稀疏编码矩阵a中每一个元素均为0；S14：根据字典矩阵M和稀疏编码矩阵a利用OMP算法求取样本空间矩阵D中每个本地样本的稀疏编码得到初始稀疏编码矩阵a
′
；S15：利用SVD算法更新字典M和初始稀疏编码矩阵a
′
中的非零编码，重复步骤S14
‑
S15直至收敛，得到客户端...

【专利技术属性】
技术研发人员：肖云鹏，李旭峰，李暾，贾朝龙，庞育才，王蓉，王国胤，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人