一种基于医疗联邦方的训练系统及训练方法技术方案

技术编号：36186461 阅读：8 留言：0更新日期：2022-12-31 20:51

一种基于医疗联邦方的训练系统及训练方法，它属于机器学习模型训练领域。本发明专利技术解决了采用现有方法训练出的机器学习模型的精度低的问题。本发明专利技术以高效和隐私保护的方式提供了公平、准确的联邦学习参与方贡献评估，同时基于贡献评估结果设计了模型聚合方法，指导在线的联邦学习服务器选择性能最好的中间聚合模型分发给各医疗联邦方进行本地训练，就可以训练出满足精度要求的机器学习模型，提高了所获得的机器学习模型的精度。本发明专利技术方法可以应用于机器学习模型训练领域。用于机器学习模型训练领域。用于机器学习模型训练领域。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于医疗联邦方的训练系统及训练方法

[0001]本专利技术属于机器学习模型训练领域，具体涉及一种基于医疗联邦方的训练系统及训练方法。

技术介绍

[0002]人工智能技术日益与我们日常生活的许多方面交织在一起。对于大多数机器学习方法来说，数据是推动其性能的核心要素。对于涉及人工智能的医疗健康领域来说尤其如此。在这种应用程序中，通常需要更多高质量数据，以提高性能。然而，单一组织机构收集的医疗数据往往不足以达到这一目的。因此，协作训练是该领域受益于人工智能技术的必要条件。
[0003]医学数据通常是高度敏感的。因此，医疗机构之间的数据共享一直是一个挑战。最近世界各地的数据隐私保护法加剧了这种情况。另一方面，这一发展也加快了联邦学习领域的进步(一种新兴的机器学习范式，支持分布式协作模型训练，同时保护数据隐私)。联邦学习允许多个客户端通过迭代聚合模型更新来协作训练共享模型，而不暴露其原始数据。除了数据问题外，医疗生态系统中涉及的不同利益相关者对模型有额外的需求。例如，制药公司可能希望通过建立一个模型，利用来自多家医院的数据来促进药物研究。为了补偿参与的医院，制药公司需要提供奖励。然而，如果不能直接评估每家医院当地数据的质量，就很难对其进行公平补偿。在联邦学习中，如何量化每个参与方的训练数据的价值是一个挑战，但是现有方法很难对联邦学习中每个参与方的效用函数进行建模，这使得现有的激励机制设计工作无法直接应用。同时，由于联邦学习算法的复杂性，对联邦学习系统的最终学习性能进行建模具有挑战性，因此，采用现有的方法难以训练出精...

【技术保护点】

【技术特征摘要】
1.一种基于医疗联邦方的训练系统，其特征在于，所述系统包括机器学习模型、贡献评估模块、模型聚合模块、声誉管理模块和用户交互模块，其中：所述声誉管理模块用于根据各医院的历史贡献评估记录计算各医院在各情境中的声誉平均值；联邦学习的发起者根据声誉管理模块的计算结果选择参与联邦学习的医疗联邦方，选择的医疗联邦方用于根据各自的本地医学数据集训练机器学习模型；贡献评估模块用于对各医疗联邦方的训练结果进行贡献评估，并将贡献评估结果反馈给声誉管理模块，声誉管理模块对各医疗联邦方的历史贡献评估记录进行更新；模型聚合模块用于根据对各医疗联邦方的贡献评估结果进行模型聚合，获得聚合后的模型；并将聚合成的模型发送回参与下一轮训练的各个医疗联邦方；用户交互模块用于提供给授权人员访问和管理的功能。2.根据权利要求1所述的一种基于医疗联邦方的训练系统，其特征在于，所述联邦学习的发起者根据声誉管理模块的计算结果选择参与联邦学习的医疗联邦方，其具体为：将各家医院的声誉平均值按照降序排列后，从各家医院中选择出声誉平均值排在前面的医院作为联邦学习的参与方。3.根据权利要求1所述的一种基于医疗联邦方的训练系统，其特征在于，所述机器学习模型的初始化参数的获得方式为：根据训练任务随机初始化机器学习模型的参数或者通过在公共医学数据集上预训练机器学习模型来初始化机器学习模型的参数。4.根据权利要求1所述的一种基于医疗联邦方的训练系统，其特征在于，所述贡献评估模块对各医疗联邦方的训练结果进行贡献评估是基于Shapley值和引导截断梯度进行的，计算Shapley值所采用的效用评价函数V(S)为：其中，M是上一轮训练聚合成的机器学习模型，S是本轮训练过程中参与训练的医疗联邦方的个数，|D
j
|为第j个医疗联邦方的本地医学数据集D
j
的大小，|D
S
|表示S个医疗联邦方的本地医学数据集D
S
的大小之和，Δ
j
是第j个医疗联邦方的梯度更新。5.根据权利要求1所述的一种基于医疗联邦方的训练系统，其特征在于，所述模型聚合模块根据对各医疗联邦方的贡献评估结果进行模型聚合，其具体过程为：其中，M
(t+1)
为第t次迭代聚合成的新的机器学习模型，M
(t)
为第t
‑
1次迭代聚合成的新的机器学习模型，机器学习模型，为第t次迭代时第k个医疗联邦方的训练结果，为第t次迭代参与聚合的第k个医疗联邦方的梯度更新，D
k
为第t次迭代参与聚合的第k个医疗联邦方的本地医学数据集，|D
k
|为第t次迭代参与聚合的第k个医疗联邦方的本地医学数据集的大小，表示第t次迭代参与聚合的S
p
个医疗联邦方的本地医学
数据集的大小之和，k＝1,2,
…
,S
p
。6.一种基于医疗联邦方的训练方...

【专利技术属性】
技术研发人员：刘宇鹏，林明豪，
申请(专利权)人：哈尔滨理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人