跨组织边界地利用医学数据制造技术

技术编号:32509715 阅读:30 留言:0更新日期:2022-03-02 10:51
本公开的主题是用于利用医学数据集的方法和设备,其中医学数据集在本地存储在第一机构中并且具有多个原始的单数据集,所述原始的单数据集与真实存在的患者相关联并且具有关于一个或多个上级变量的原始值。可以执行以下步骤:基于医学数据集产生合成数据集,其中合成数据集具有多个合成的单数据集,所述合成的单数据集具有关于与医学数据集相同的上级变量的合成值,但是不能够追溯到原始存在的患者,其中步骤产生在本地在第一机构中通过将采样函数应用于医学数据来进行;将合成数据集从第一机构传送给在第一机构外的中央单元;以及在中央单元中利用合成数据集。在中央单元中利用合成数据集。在中央单元中利用合成数据集。

【技术实现步骤摘要】
跨组织边界地利用医学数据


[0001]本专利技术涉及用于在“分布式环境”中跨组织边界地尤其在考虑数据安全方面的条件下利用医学数据的方法和系统。

技术介绍

[0002]用于开发人工智能和机器学习的关键在于对于训练和验证智能算法必不可少的数据的可用性。
[0003]然而,在许多领域中,数据的交换经受约束性的限制。因此,人员相关的数据尤其可以受到数据保护规定,所述数据保护规定对于信息的利用设置窄的界限。转送这种数据通常需要将其匿名化或至少将其假名化。因为数据结构能够在提供者之间非常不同,所以为此然而几乎不存在统一的解决方案。此外,根据司法权,法律框架条件能够显著不同。数据的系统性的匿名化因此是时间和成本密集的任务。此外,存在可能对人员相关的数据进行重新识别的风险,这可能引起显著的法律的和经济的后果。具有人员相关的数据的许多机构或组织因此对于为了研发目的转送所述数据持批判态度。
[0004]这更加涉及医学领域。一方面,访问患者数据是对于开发先进的、基于人工智能的算法的前提条件。另一方面,这种患者数据是特别敏感的。任何不相干性恰好在所述领本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于利用医学数据集(MD)的计算机实施的方法,其中所述医学数据集(MD)在本地存储在第一机构(A)之内并且具有多个原始的单数据集(RDS1...RDS6),所述原始的单数据集与真实存在的患者相关联并且具有关于一个或多个上级变量(x,y)的原始值;并且所述方法具有以下步骤:基于所述医学数据集(MD)产生(S20)合成数据集(SD),其中所述合成数据集(SD)具有多个合成的单数据集(SDS),这些合成的单数据集具有关于与所述医学数据集(MD)相同的上级变量(x,y)的合成值,但是不能够追溯到原始存在的患者,其中产生(S20)的步骤在本地在所述第一机构(A)之内通过将采样函数(DSF)应用于所述医学数据(MD)来进行;将所述合成数据集(SD)从所述第一机构(A)传送(S30)给在所述第一机构(A)外的中央单元(100);以及在所述中央单元(100)之内利用(S40)所述合成数据集(SD)。2.根据权利要求1所述的方法,其中所述采样函数(DSF)构成用于在替代所有原始值的情况下通过对整个医学数据集(MD)采样来产生所述合成数据集(SD)。3.根据上述权利要求中任一项所述的方法,其中所述采样函数(DSF)具有经训练的函数。4.根据上述权利要求中任一项所述的方法,其中所述采样函数(DSF)具有k

最近邻算法。5.根据上述权利要求中任一项所述的方法,其中:在所述医学数据集(MD)中定义多个数据类别并且每个原始的单数据集(RDS1...RDS6)与一个数据类别相关联;以及在产生(S20)的步骤中,将所述采样函数(DSF)单独应用于所述数据类别中的每个数据类别,使得对于每个数据类别仅基于与所述数据类别相关联的原始的单数据集(RDS1...RDS6)产生合成数据集(SDS)。6.根据上述权利要求中任一项所述的方法,其中利用(S40)的步骤包括:基于所述合成数据集(SD)训练用于预测临床结果的可训练的分类器;和/或基于所述合成数据集(SD)验证用于预测临床结果的可训练的分类器;和/或统计学地评估所述合成数据集(SD);和/或将所述合成数据集(SD)存档在所述中央单元(100)中。7.根据上述权利要求中任一项所述的方法,所述方法还具有如下步骤:在所述第一机构(A)中提供(S21)采样函数(DSF),所述采样函数(DSF)构成用于产生所述合成数据集(SD)。8.根据上述权利要求中任一项所述的方法,其中所述合成数据集(SD)中的合成的单数据集(SDS)的数量大于所述医学数据集(MD)中的原始的单数据集的数量。9.根据上述权利要求中任一项所述的方法,所述方法还具有如下步骤:计算(O30)质量泛函,所述质量泛函是代表所述合成数据集(SD)的统计学特性与所述原始数据集(MD)的统计学特性的一致性的尺度。10.根据权利要求9所述的方法,其中
通过优化所述质量泛函对于所述医学数据集(MD)优化所述采样函数(DSF)的至少一个参数(k)(O10

O40)。11.根据权...

【专利技术属性】
技术研发人员:阿斯米尔
申请(专利权)人:西门子医疗有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1