基于持续学习的医疗数据隐私保护与资源利用方法及装置制造方法及图纸

技术编号：33083270 阅读：26 留言：0更新日期：2022-04-15 10:41

本发明专利技术提出一种基于持续学习的医疗数据隐私保护与资源利用方法及装置，其中，方法包括：初始化特定医学任务所需的数据，该数据来自n个机构，其中，n为大于1的整数，此n个机构的数据相对独立，之后，初始化特定医学任务的深度模型，该深度模型包括特征采样模型、数据回顾模型与任务表达模型，最后依次根据来自n个机构的数据对深度模型进行训练。该方法能够克服数据共享障碍的医学知识共享的智能医疗系统将在未来大大提高现有医疗技术水平，解决现有技术中无需数据共享条件下进行知识共享的深度学习方法的技术问题。深度学习方法的技术问题。深度学习方法的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
基于持续学习的医疗数据隐私保护与资源利用方法及装置

[0001]本专利技术涉及人工智能、深度学习领域，尤其涉及一种基于持续学习的医疗数据隐私保护与资源利用方法及装置。

技术介绍

[0002]随着深度学习技术的日益成熟与广泛使用，智慧医疗逐渐成为深度学习的产业落地重点项目。许多相关研究涉及医学数据的采集、分析，以及利用医学影像、病例报告、检测指标等多类型医学数据进行疾病检测、病理学分析、辅助治疗以及风向评估等内容。但是，大多数研究使用的数据规模小，来源机构数量、数据分布广度以及由此带来的模型泛化能力十分有限。由于医疗数据涉及病人隐私，难以共享，即使花费大量人力物力资源收集足够规模的医疗数据，也仅限于参与的科研和医疗机构进行少数几次研究，很难通过数据与经验共享的方式推动领域发展。
[0003]持续学习是近年来提出的一种深度学习技术，其致力于解决的应用场景设定有很多类型，但都存在以下几点共性：在持续不断的数据输入与训练过程中渐次迭代同一个深度学习模型；数据按获取时间划分为多个任务，任务间存在差异，例如训练目标、数据分布、模型输出等均可能发生变化；模型训练后一个任务时，前一任务的数据难以再次获得或只能部分获得。持续学习的目标就是在不断学习新任务的过程中，不遗忘旧任务的知识。
[0004]因此，在病例隐私保护严格的医疗数据方面，持续学习可以提供一种在无需数据共享条件下进行知识共享的深度学习方法。随着人们对健康生活的认识不断加深，能够克服数据共享障碍的医学知识共享的智能医疗系统将在未来大大提高现有医疗技术水平，改...

【技术保护点】

【技术特征摘要】
1.一种基于持续学习的医疗数据隐私保护与资源利用方法，其特征在于，包括以下步骤：初始化特定医学任务所需的数据，所述数据来自n个机构，其中，n为大于1的整数，所述n个机构的数据相对独立；初始化特定医学任务的深度模型，所述深度模型包括特征采样模型、数据回顾模型与任务表达模型；依次根据来自n个机构的数据对所述深度模型进行训练。2.根据权利要求1中所述的方法，其特征在于，所述根据来自n个机构的数据对所述深度模型进行训练，包括：确定机构i，其中，i<＝n，且i为正整数；当i为1时，使用机构i的数据对所述深度模型进行训练；当i不为1时，使用机构i的数据对所述深度模型进行训练，并且根据多尺度回顾样本特征对所述深度模型的隐藏空间进行训练；直至n个机构的数据全部训练完毕。3.根据权利要求2中所述的方法，其特征在于，在根据多尺度回顾样本特征对所述深度模型的隐藏空间进行训练之前，还包括：在机构1至机构i
‑
1的数据分布空间中使用机构i
‑
1的特征采样模型均采样多个样本编码；将所述多个样本编码经过机构i
‑
1的数据回顾模型，生成所述多尺度回顾样本特征。4.根据权利要求3中所述的方法，其特征在于，使用特征采样模型均采样多个样本编码，包括：通过所述特征采样模型为每个机构的每个数据样本提取一个特征向量，一个机构所有数据样本的所述特征向量张成一个特征空间，用于刻画该机构的整体特征；根据所有机构的整体特征空间组成一个特征空间池；使用余弦相似性对当前机构内每个数据样本的特征向量进行线性约束，并使用正交性对当前机构内每个数据样本的特征向量与当前机构之前的所有机构的整体特征空间进行正交约束；在高斯空间采样一个隐变量，将采样的隐变量在当前机构之前的所有机构整体特征空间上投影，获得一个包含当前机构之前的机构的隐变量，并将投影后的隐变量通过编码映射网络映射为样本编码。5.一种基于持续学习的医疗数据隐私保护与资源利用装置，其特征在于，包括：数据初始化模块，用于初始化特定医学任务所需的数据，所述数据来自n个机构，其中，n为大于1的整数，所述...

【专利技术属性】
技术研发人员：徐枫，薄子豪，娄昕，郭雨晨，吕晋浩，戴琼海，
申请(专利权)人：清华大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人