当前位置: 首页 > 专利查询>清华大学专利>正文

基于持续学习的医疗数据隐私保护与资源利用方法及装置制造方法及图纸

技术编号:33083270 阅读:26 留言:0更新日期:2022-04-15 10:41
本发明专利技术提出一种基于持续学习的医疗数据隐私保护与资源利用方法及装置,其中,方法包括:初始化特定医学任务所需的数据,该数据来自n个机构,其中,n为大于1的整数,此n个机构的数据相对独立,之后,初始化特定医学任务的深度模型,该深度模型包括特征采样模型、数据回顾模型与任务表达模型,最后依次根据来自n个机构的数据对深度模型进行训练。该方法能够克服数据共享障碍的医学知识共享的智能医疗系统将在未来大大提高现有医疗技术水平,解决现有技术中无需数据共享条件下进行知识共享的深度学习方法的技术问题。深度学习方法的技术问题。深度学习方法的技术问题。

【技术实现步骤摘要】
基于持续学习的医疗数据隐私保护与资源利用方法及装置


[0001]本专利技术涉及人工智能、深度学习领域,尤其涉及一种基于持续学习的医疗数据隐私保护与资源利用方法及装置。

技术介绍

[0002]随着深度学习技术的日益成熟与广泛使用,智慧医疗逐渐成为深度学习的产业落地重点项目。许多相关研究涉及医学数据的采集、分析,以及利用医学影像、病例报告、检测指标等多类型医学数据进行疾病检测、病理学分析、辅助治疗以及风向评估等内容。但是,大多数研究使用的数据规模小,来源机构数量、数据分布广度以及由此带来的模型泛化能力十分有限。由于医疗数据涉及病人隐私,难以共享,即使花费大量人力物力资源收集足够规模的医疗数据,也仅限于参与的科研和医疗机构进行少数几次研究,很难通过数据与经验共享的方式推动领域发展。
[0003]持续学习是近年来提出的一种深度学习技术,其致力于解决的应用场景设定有很多类型,但都存在以下几点共性:在持续不断的数据输入与训练过程中渐次迭代同一个深度学习模型;数据按获取时间划分为多个任务,任务间存在差异,例如训练目标、数据分布、模型输出等均可能发生变化;模型训练后一个任务时,前一任务的数据难以再次获得或只能部分获得。持续学习的目标就是在不断学习新任务的过程中,不遗忘旧任务的知识。
[0004]因此,在病例隐私保护严格的医疗数据方面,持续学习可以提供一种在无需数据共享条件下进行知识共享的深度学习方法。随着人们对健康生活的认识不断加深,能够克服数据共享障碍的医学知识共享的智能医疗系统将在未来大大提高现有医疗技术水平,改善医疗资源不平衡的问题,提高人民生活质量。

技术实现思路

[0005]本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。
[0006]为此,本专利技术的第一个目的在于提出一种基于持续学习的医疗数据隐私保护与资源利用方法,以实现数据共享障碍的医学知识共享的智能医疗系统。
[0007]本专利技术的第二个目的在于提出一种基于持续学习的医疗数据隐私保护与资源利用装置。
[0008]本专利技术的第三个目的在于提出一种非临时性计算机可读存储介质。
[0009]本专利技术的第四个目的在于提出一种计算机程序产品。
[0010]为达上述目的,本专利技术第一方面实施例提出了一种方法,包括:
[0011]初始化特定医学任务所需的数据,所述数据来自n个机构,其中,n为大于1的整数,所述n个机构的数据相对独立;
[0012]初始化特定医学任务的深度模型,所述深度模型包括特征采样模型、数据回顾模型与任务表达模型;
[0013]依次根据来自n个机构的数据对所述深度模型进行训练。
[0014]可选地,在本申请的一个实施例中,所述根据来自n个机构的数据对所述深度模型进行训练,包括:
[0015]确定机构i,其中,i<=n,且i为正整数;
[0016]当i为1时,使用机构i的数据对所述深度模型进行训练;
[0017]当i不为1时,使用机构i的数据对所述深度模型进行训练,并且根据多尺度回顾样本特征对所述深度模型的隐藏空间进行训练;
[0018]直至n个机构的数据全部训练完毕。
[0019]可选地,在本申请的一个实施例中,在根据多尺度回顾样本特征对所述深度模型的隐藏空间进行训练之前,还包括:
[0020]在机构1至机构i

1的数据分布空间中使用机构i

1的特征采样模型均采样多个样本编码;
[0021]将所述多个样本编码经过机构i

1的数据回顾模型,生成所述多尺度回顾样本特征。
[0022]可选地,在本申请的一个实施例中,使用特征采样模型均采样多个样本编码,包括:
[0023]通过所述特征采样模型为每个机构的每个数据样本提取一个特征向量,一个机构所有数据样本的所述特征向量张成一个特征空间,用于刻画该机构的整体特征;
[0024]根据所有机构的整体特征空间组成一个特征空间池;
[0025]使用余弦相似性对当前机构内每个数据样本的特征向量进行线性约束,并使用正交性对当前机构内每个数据样本的特征向量与当前机构之前的所有机构的整体特征空间进行正交约束;
[0026]在高斯空间采样一个隐变量,将采样的隐变量在当前机构之前的所有机构整体特征空间上投影,获得一个包含当前机构之前的机构的隐变量,并将投影后的隐变量通过编码映射网络映射为样本编码。
[0027]为达上述目的,本专利技术第二方面实施例提出了一种基于持续学习的医疗数据隐私保护与资源利用装置,包括:
[0028]数据初始化模块,用于初始化特定医学任务所需的数据,所述数据来自n个机构,其中,n为大于1的整数,所述n个机构的数据相对独立;
[0029]模型初始化模块,用于初始化特定医学任务的深度模型,所述深度模型包括特征采样模型、数据回顾模型与任务表达模型;
[0030]训练模块,用于依次根据来自n个机构的数据对所述深度模型进行训练。
[0031]为了实现上述目的,本专利技术第三方面实施例提出了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被处理器执行时实现本申请第一方面实施例所述的一种拥塞控制的方法。
[0032]为了实现上述目的,本专利技术第四方面实施例提出了非易失性存储介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行时,实现本申请第一方面实施例所述的一种拥塞控制的方法。
[0033]综上所述,本专利技术提出的基于持续学习的跨中心医疗数据隐私保护与资源利用方法、装置、计算机设备和非易失性存储介质,能够在有效保证病人隐私的情况下,对多机构
的医疗数据进行有效利用,从而有助于促进医疗机构经验共享,提高社会医疗水平,保障广大群众的身体健康。
附图说明
[0034]本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0035]图1为本专利技术实施例所提供的一种基于持续学习的医疗数据隐私保护与资源利用方法的流程示意图;
[0036]图2为本专利技术实施例所提供的一种特征采样模型流程图;
[0037]图3为本专利技术实施例所提供的一种方法总体流程图;
[0038]图4为本专利技术实施例所提供的一种基于持续学习的医疗数据隐私保护与资源利用装置的结构示意图。
具体实施方式
[0039]下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。
[0040]下面参考附图描述本专利技术实施例的基于持续学习的医疗数据隐私保护与资源利用方法和装置。
[0041]图1为本专利技术实施例所提供的一种基于持续学习的医疗数据隐私保护与资源利用方法的流程示本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于持续学习的医疗数据隐私保护与资源利用方法,其特征在于,包括以下步骤:初始化特定医学任务所需的数据,所述数据来自n个机构,其中,n为大于1的整数,所述n个机构的数据相对独立;初始化特定医学任务的深度模型,所述深度模型包括特征采样模型、数据回顾模型与任务表达模型;依次根据来自n个机构的数据对所述深度模型进行训练。2.根据权利要求1中所述的方法,其特征在于,所述根据来自n个机构的数据对所述深度模型进行训练,包括:确定机构i,其中,i<=n,且i为正整数;当i为1时,使用机构i的数据对所述深度模型进行训练;当i不为1时,使用机构i的数据对所述深度模型进行训练,并且根据多尺度回顾样本特征对所述深度模型的隐藏空间进行训练;直至n个机构的数据全部训练完毕。3.根据权利要求2中所述的方法,其特征在于,在根据多尺度回顾样本特征对所述深度模型的隐藏空间进行训练之前,还包括:在机构1至机构i

1的数据分布空间中使用机构i

1的特征采样模型均采样多个样本编码;将所述多个样本编码经过机构i

1的数据回顾模型,生成所述多尺度回顾样本特征。4.根据权利要求3中所述的方法,其特征在于,使用特征采样模型均采样多个样本编码,包括:通过所述特征采样模型为每个机构的每个数据样本提取一个特征向量,一个机构所有数据样本的所述特征向量张成一个特征空间,用于刻画该机构的整体特征;根据所有机构的整体特征空间组成一个特征空间池;使用余弦相似性对当前机构内每个数据样本的特征向量进行线性约束,并使用正交性对当前机构内每个数据样本的特征向量与当前机构之前的所有机构的整体特征空间进行正交约束;在高斯空间采样一个隐变量,将采样的隐变量在当前机构之前的所有机构整体特征空间上投影,获得一个包含当前机构之前的机构的隐变量,并将投影后的隐变量通过编码映射网络映射为样本编码。5.一种基于持续学习的医疗数据隐私保护与资源利用装置,其特征在于,包括:数据初始化模块,用于初始化特定医学任务所需的数据,所述数据来自n个机构,其中,n为大于1的整数,所述...

【专利技术属性】
技术研发人员:徐枫薄子豪娄昕郭雨晨吕晋浩戴琼海
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1