一种基于区块链网络的医学图像分割协作方法技术

技术编号:38686592 阅读:10 留言:0更新日期:2023-09-02 23:00
本发明专利技术涉及一种基于区块链网络的医学图像分割协作方法,首先各个医疗机构将各自的医疗数据进行本地深度学习训练建模,训练生成局部权重文件,局部权重文件在其所属医疗机构签名之后作为一笔交易被提交到区块链网络中,区块链网络中拥有下载权限的节点,对局部权重文件进行下载,直至所有医疗机构均生成各自的局部权重文件,当区块链网络接收到预设数量的局部权重数据后聚合生成全局权重,经过有限次迭代循环后,保存效果最好的全局权重作为最终的图像分割神经网络参数。本发明专利技术“区块链+深度学习”的框架,是一个去中心的架构,去中心机制很大程度上保证了参与方的诚实行为,各个节点的医疗数据不会被其它设备所访问,更好的保护了数据隐私。数据隐私。数据隐私。

【技术实现步骤摘要】
一种基于区块链网络的医学图像分割协作方法


[0001]本专利技术涉及区块链与医学图像处理的交叉领域,尤其涉及一种基于区块链网络的医学图像分割协作方法。

技术介绍

[0002]深度学习近些年来发展迅速,是人工智能领域的主要研究方向[1]。在计算能力大大提高的情况下,很多深度学习方向的思想都得以实现。我们知道要想训练一个准确率高并且健壮的深度学习模型,其核心要素是需要大量的高质量的训练数据。因为如果数据不足会导致模型训练的结果欠拟合。针对深度学习输入样本不足的问题,现在也提出了很多方法。比如数据增强,也叫数据扩增、过采样和欠采样、人工数据合成等。通过这样的方式确实对于提高模型的健壮性、泛化性有显著的效果,让有限的数据产生更多的数据价值。但是原始数据起着决定性因素。如何获取各方数据一直以来都是深度学习应用的挑战。
[0003]此外,隐私问题也是阻碍数据收集一个重要因素。有一些数据由于存在一些特殊性也无法得以安全共享,用来做进一步的研究,比如医疗数据。医疗机构之间因为涉及到患者隐私和相关方的利益等原因导致各方机构数据无法互通,这形成了大大小小的数据孤岛。我们还知道为了训练出与医学专家水平相同的模型,达到临床所需要的精度,需要对AI算法提供大量的能够充分代表临床环境的病例参与训练。例如一个普通医生成长为一名专家需要十几年甚至几十年的时间,经手的病例高达几十万例,AI算法想要达到相同的精度需要对同等规模的病例进行学习才能够达到。遗憾的是目前开放的最大数据库离满足人工智能训练的要求还有很大一截。如果考虑到罕见病就更麻烦了,哪怕是医学大牛可能一生也就看到过百余例。加上隐私原因或者是当地政府、地方法律法规的原因。很多医疗数据都闲置浪费着。目前很多的人工智能企业或者是医院本身的人工智能团队都只能利用自己手头非常有限的数据量进行深度学习或者机器学习等其它研究。这就使得利用医疗数据进行AI算法学习存在很大的瓶颈。但是这些珍贵的医疗数据如果通过一定的方式整合起来有望打破这种瓶颈。目前存在的现象就是大部分医疗机构不愿意共享自己掌握的数据,再加上各方本地持有的数据量不足以支撑深度学习模型建模训练,然而他们实际上是有建模需求的。对于分散数据难以集中问题,2016年谷歌提出,用以解决安卓收集终端用户在本地更新模型的问题。2016年,谷歌提出解决Android终端用户收集的问题,在本地更新模型。参考,这些努力试图使用中央服务器从本地数据学习,同时保护隐私。但这些设计是核心。
[0004]基于上述提到的背景,本专利提出了一个“区块链+深度学习”的框架。这是一个去中心的架构。它的实现可以帮助各个医疗机构在不暴露自己手头的数据的情况下,联合训练一个深度学习模型,去中心的架构保证各方在整个训练过程中,不受第三方中心机构管辖,各参与方都具有平等的权利,整个数据交换的过程都是透明的,去中心机制很大程度上保证了参与方的诚实行为。基于这样一个区块链平台来实现多方合作的模式对于解决多中心数据难以集中进行联合建模的问题提供了思路。由于数据始终由产生数据的设备所保存,不会被其它设备所访问,所以对于数据隐私具有一定的保护性。经过实验验证,本专利
提出的“区块链+深度学习”能够有效解决数据孤岛和数据隐私保护的两难问题。
[0005]分布式机器学习主要涉及到如何分配训练任务、调配计算资源、协调各个功能模块,以达到训练速度与精度的平衡。数据并行化和模型并行化是分布式学习领域中的重要子领域。在在分布式数据并行的模式下,数据不需要汇集到中央服务器,每个节点计算一部分数据然后进行汇总聚合,这样可以有效解决单台机器的存储和计算能力。基于目前pb级社交媒体大数据的崛起,有学者提出了一些解决分布式机器学习可伸缩性挑战的策略,设计和开发了高性能软件框架。相较于数据并行化、模型并行化更加复杂。它是将模型分布在多台计算机上,对全局深度学习模型进行模块化训练达到更好的学习效果。此外,有学者提出的允许处理器访问共享内存,在深度学习训练时只需要更新变量的很小一部分就可以,是一种同步模型更新的方法。后来研究人员提出在异构环境中分布式机器学习,可以动态和异构集群中高效运行,适用于数据并行训练机制。这样使得数据不用再做均匀分批处理。
[0006]联邦学习主要是根据样本重合度分为纵向联邦学习和横向联邦学习。本专利主要是讨论横向联邦学习。有学者提出的联邦学习系统设计,是中心式的通信体系架构。意味着中心服务器需要从其它参与方收集梯度或者模型信息,后面又继续提出了去中心化的联邦学习框架。佐治亚理工学院和美国NEC实验室提出了基于区块链的联邦学习环境,通过区块链来存储和分享全局模型并通过智能合约完成聚合任务。中山大学和香港理工大学的研究人员提出了区块链分片5G分布式计算环境下拜占庭回弹的分布式学习放假,主要解决了分布式学习过程中的模型参数更新于梯度聚合过程中拜占庭攻击等问题。
[0007]现有技术方案存在的不足:
[0008]1、分布式机器学习策略中,设备没有控制权,分布在节点上的数据大多要求是独立同分布。这些需求在实际应用中很难得到满足。
[0009]2、联邦学习本地设备有控制权,数据也不要求独立同分布,节点负载通常不均衡,但很多的系统都是中心化的。此外在很多的文章中利用去中心架构进行联合深度学习建模时,没有详细讨论训练全局深度学习模型的方式。

技术实现思路

[0010]针对现有技术之不足,本专利技术提出一种基于区块链网络的医学图像分割协作方法,所述方法包括:首先各个医疗机构将各自的医疗数据进行本地协作分割网络训练建模,训练生成局部权重文件,所述局部权重文件在其所属医疗机构签名之后作为一笔交易被提交到区块链网络中,区块链网络中拥有下载权限的节点,对所述局部权重文件进行下载,直至所有医疗机构均生成各自的局部权重文件,当区块链网络接收到预设数量的局部权重数据后聚合生成全局权重,进行有限次迭代循环后,保存效果最好的全局权重作为最终的协作分割网络模型参数,具体包括:
[0011]步骤1:构建区块链网络作为各个医疗机构信息共享的平台,所属区块链网络用于支撑各节点协作完成全局深度学习模型建立全过程,主要包括四个部分:数据上传、共识协议达成、数据存储、全局模型的生成;
[0012]步骤2:进入所述区块链网络的节点必须获得授权,采用Hyperledger Fabric中的会员服务系统MSP管理,所述会员服务系统是一个用户证书和私钥管理体系,而非传统的用户名密码格式,在所述会员服务系统中任何交易都需要验证账号,采用两种训练方式:顺序
训练方式或并行训练方式,采用顺序训练方式执行步骤3,采用并行训练方式执行步骤4;
[0013]步骤3:参与协同的各个医疗机构采用顺序训练的方式一起训练一个全局模型,验证当模型收敛时所得全局模型是否比局部模型更优,训练方式主要分为局部权重上传、权重数据下载两部分:
[0014]步骤31:局部权重上传,第一家医疗机构先利用自己的本地医疗数据训练自己的深度学习模型,当深度学习模型收敛时,把第一局部权重保存下来,然后加密签名件之后上传到本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于区块链网络的医学图像分割协作方法,其特征在于,首先各个医疗机构将各自的医疗数据进行本地协作分割网络训练建模,训练生成局部权重文件,所述局部权重文件在其所属医疗机构签名之后作为一笔交易被提交到区块链网络中,区块链网络中拥有下载权限的节点,即其他医疗机构,对所述局部权重文件进行下载,直至所有医疗机构均生成各自的局部权重文件,当区块链网络接收到预设数量的局部权重数据后聚合生成全局权重,进行有限次迭代循环后,保存效果最好的全局权重作为最终的协作分割网络模型参数,具体包括:步骤1:构建区块链网络作为各个医疗机构信息共享的平台,所属区块链网络用于支撑各节点协作完成全局深度学习模型建立全过程,主要包括四个部分:数据上传、共识协议达成、数据存储、全局模型的生成;步骤2:进入所述区块链网络的节点必须获得授权,采用Hyperledger Fabric中的会员服务系统MSP管理,所述会员服务系统是一个用户证书和私钥管理体系,在所述会员服务系统中任何交易都需要验证账号,采用的训练方式包括:顺序训练方式或并行训练方式,采用顺序训练方式执行步骤3,采用并行训练方式执行步骤4;步骤3:参与协同的各个医疗机构采用顺序训练的方式一起训练一个全局模型,验证当模型收敛时所得全局模型是否比局部模型更优,训练方式主要分为局部权重上传、权重数据下载两部分:步骤31:局部权重上传,第一家医疗机构先利用自己的本地医疗数据训练自己的深度学习模型,当深度学习模型收敛时,把第一局部权重保存下来,然后加密签名件之后上传到区块链网络,各个节点开始验证这笔交易,如果验证通过,交易合法,达成共共识,这笔交易被承认,然后写入区块链网络中;步骤32:权重数据下载,第二家医疗机构从所述区块链网络中去下载第一家医疗机构上传的第一局...

【专利技术属性】
技术研发人员:苏红罗阳吴锡
申请(专利权)人:成都信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1