训练机器学习算法的方法、机器学习算法和设备复合体技术

技术编号:33080373 阅读:9 留言:0更新日期:2022-04-15 10:32
本发明专利技术涉及一种用于训练机器学习算法的方法,方法包括以下步骤提:供具有与医学技术成像系统的安全数据连接和在该数据连接之外在网络中的中央计算装置的训练装置,提供数据接口,所述数据接口设计为用于从所述训练装置将数据发送至所述中央计算装置,创建多个基于图像记录的训练数据集,所述训练数据集分别配备有基本事实或者在数据技术方面与基本事实链接,经由所述安全数据连接将所述训练数据集发送给所述训练装置,借助于所述训练装置借助所述训练数据集训练所述机器学习算法,经由所述数据接口将经训练的所述机器学习算法的参数数据集发送给所述中央计算装置。本发明专利技术还涉及相应的机器学习算法、控制装置、成像系统以及设备复合体。及设备复合体。及设备复合体。

【技术实现步骤摘要】
训练机器学习算法的方法、机器学习算法和设备复合体


[0001]本专利技术涉及一种用于产生经训练的机器学习算法的方法,尤其是一种用于医疗
的训练方法。

技术介绍

[0002]深度学习算法或机器学习算法(以下也简称为用于“人工智能”的“AI”)广泛使用在医疗技术中。一个常见的医学应用情况在于,从医学图像数据中推导出诊断结果。另一应用情况在于,将AI应用于检测形状和/或患者的位置的传感器,以便能够推导出用于记录图像的适宜的参数,例如用于定位或数据采集。根据现有技术,为此例如借助于3D相机对计算机断层扫描仪(“CT扫描仪”)进行自动等中心化或者进行自动准直以在放射照相学中记录患者的解剖结构。
[0003]AI算法需要表示“基本事实”(“Ground Truth”或“Basiswahrheit,基础事实”)大的数据量,神经网络能够对该“基本事实”进行训练。然而在此必须注意:这些海量数据量一方面与数据保护规定相符,而另一方面必须注释,使得其与该基本事实相符。在训练神经网络来确定用于从传感器系统的信号记录图像的理想扫描或定位参数的特殊情况下,这表示:由患者和成像装置的传感器测量的数据理想地可能必须与基本事实一起提供。这例如能够通过监督训练的操作员进行。基本事实通常是用于扫描或位置参数的设定,所述扫描或位置参数由或会由受过培训的操作员选择并且与传感器数据一起被记录。
[0004]对于每次训练通常需要数千至数万个患者数据集,以便AI在大于99%的期望的精度范围内工作。
[0005]为了快速辅助大量基于AI的工具对医疗技术人员在成像设备的参数设定和定位时进行辅助,在理想情况下期望的是,从每个现有的成像设备中快速收集大量适宜的传感器数据。如果存在,这由于成本和法律边界条件只能非常困难地实际实施。下面列出最严重的问题。
[0006]i)收集并且为了训练发送给中央集线器的数据包非常大,尤其是如果在数据中包含图像、传感器数据或者甚至实时流,往往是这种情况。将该数据传输到中央数据处理设施并且在该处存储需要不可忽视的技术耗费和成本,尤其是对于符合法律要求的安全的存储。
[0007]ii)许多地区的立法使得记录或存储能够用于辨识患者的数据变得困难或不可行。尤其当数据应发送给供应商的中央数据处理设施以进行进一步处理时如此。为此通常需要患者的同意,这很少发生,并且会显著减慢为所有期望的应用检测足够的数据的过程。此外,对于附加的耗费产生附加的成本。

技术实现思路

[0008]本专利技术的一个目的是,提出一种替选的、更方便的方法和相应的装置来训练能够机器学习算法,借助其避免上述缺点。
[0009]所述目的通过根据本专利技术的方法、根据本专利技术的机器学习算法、根据本专利技术的控制装置、根据本专利技术的成像系统以及根据本专利技术的设备复合体来实现。
[0010]根据本专利技术的方法用于训练机器学习算法或者机器学习单元(替选地也简称为“AI”,见上文),尤其是深度学习算法。通常,机器学习算法的基本架构是已知的,并且能够普遍用于广泛的
然而,这与以下训练相关:能够实现机器学习算法的何种目的,以及其能够多好地实现该目的。因此,训练基本上定义了特定的机器学习算法。
[0011]如果考虑机器学习单元或机器学习算法的内部结构,则该AI包括特定的参数,例如权重参数或激活、传播或输出函数的函数值。通过训练过程改变和进而定义经训练的AI的工作方式的那些参数的集合在下文中称为“参数集”。其形成经训练的AI的功能核心。参数集的参数值在下文中称为“参数数据集”。未经训练的AI(当然与上述AI具有相同的基本结构),其参数集根据参数数据集设定,将与经训练的AI一样工作,因为即使在训练期间也会设定的参数现在具有相应的值。
[0012]该方法包括以下步骤:
[0013]‑
提供训练装置,其具有要训练的机器学习算法和与医学技术成像系统(例如在安全的医院网络内)的安全的数据连接。
[0014]训练装置在此是设计用于训练机器学习算法的计算系统,并且其基本结构在现有技术中是清楚已知的。训练装置优选安置在医学成像系统中,例如安置在其控制装置中,或者安置在成像系统外部的计算装置中。
[0015]能够借助于网络实现数据连接,也能够借助于线缆连接或数据总线来实现数据连接。对此的示例是WLAN、LAN或简单地是经由USB的数据连接。例如,医院的一个或多个设备能够经由医院网络与训练装置形成数据联系。但是,同样在医生诊所中的设备也能够经由数据线缆与训练装置连接,或者在患者家中的“床旁照护”医疗设备能够包含训练装置,所述训练装置直接经由数据总线获得其训练数据。
[0016]重要的是,保护该数据连接,以便未经授权方无法访问数据。对此的示例是安全的医院网络,但是也是所述数据线缆或数据总线。
[0017]尤其,呈医院网络形式的安全的数据连接对于本领域技术人员是已知的。这是被医院用于在内部发送患者特定的信息的网络。例如,医院网络是RIS(Radiologieinformationssystems,放射科信息系统)或PACS(Picture Archiving and Communication System=影像存档和通信系统)的网络。这种医院网络按标准受保护,例如借助于防火墙或借助于与其它网络的特定的安全的接触点(Kontaktstelle)。在这种网络内,通过这些适宜的安全措施符合用于发送和处理患者数据的法律边界条件,并且除了在网络内本来就已经符合的规则之外,提供和存储用于训练AI的数据通常不经受附加的监管或法律障碍。
[0018]‑
提供中央计算装置,所述中央计算装置设计为用于在网络中运行经训练的机器学习算法,而无需直接访问安全的数据连接(例如,在医院网络之外)。
[0019]该中央计算装置例如是服务器或其它功能强大的计算系统,并且位于数据连接(例如医院网络)的安全保护之外。这并不一定表示:该计算装置也必须始终位于医院之外。在此决定性的是网络与数据连接的界线。数据连接设计为用于,使得在其中能够根据适用的法律规定发送敏感的患者数据,这些限制不一定适用于其它网络(例如互联网的公共部
分)。术语“直接”表示:其它网络可以经由下文描述的数据接口间接地访问安全的数据连接(然而因此仅经由特别安全的访问选项,使得没有敏感数据会到达未经授权方)。但是优选的是,其它网络根本不具有对安全的数据连接的访问,并且所述数据接口仅允许在训练装置和中央计算装置之间的通信。
[0020]‑
提供数据接口,所述数据接口设计为用于从训练装置将数据发送至中央计算装置。
[0021]因此,数据能够从训练装置经由其它网络发送至计算装置。因为训练不在计算装置中发生,但是这必须不是敏感的患者数据。
[0022]数据接口优选设计为用于在训练装置和中央计算装置之间的数据通信,使得训练装置也能够从中央计算装置获得数据,例如在别处训练的AI。在此重要的是,中央计算装置的数据接口或其它网络不应允许访问敏感数据。因此,数据接口本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于训练机器学习算法(A)的方法,所述方法包括以下步骤:

提供具有要训练的机器学习算法(A

)的训练装置(6),所述训练装置(6)具有与医学技术成像系统(1)的安全数据连接(9),

提供中央计算装置(20),所述中央计算装置(20)设计为用于在网络(17)中运行经训练的机器学习算法(A),而无需直接访问所述安全数据连接(9),

提供数据接口(19),所述数据接口(19)设计为用于从所述训练装置(6)将数据发送至所述中央计算装置(20),

创建多个基于图像记录(B)的训练数据集(T),所述训练数据集(T)分别配备有基本事实(G)或者在数据技术方面与基本事实(G)链接,

经由所述安全数据连接(9)将所述训练数据集(T)发送给所述训练装置(6),

借助于所述训练装置(6)利用所述训练数据集(T)训练所述机器学习算法(A

),

经由所述数据接口(19)将经训练的所述机器学习算法(A)的参数数据集(PD)发送给所述中央计算装置(20)。2.根据权利要求1所述的方法,其中在将所述训练数据集(T)发送给所述训练装置(6)之前,基于预定的标准分析所述图像记录(B)的质量,并且在所述质量不符合预定的标准的情况下,将所述图像记录(B)调整为,使得所述图像记录(B)对应于所述标准,或者将所述图像记录(B)丢弃,优选其中在所述图像记录(B)已经被调整的情况下,这并入相应的基本事实(G)中,并且优选其中在图像记录(B)不能被调整为使得所述图像记录(B)对应于所述标准或者将其丢弃的情况下,则相应的训练数据集(T)被丢弃或者被标识为反面示例。3.根据权利要求2所述的方法,其中借助于已经被训练的检查算法(U),仅仅或除了通过用户进行分析之外,还基于预定的标准对所述图像记录(B)执行分析,所述已经被训练的检查算法(U)基于预定的标准评价相应的图像记录(B)的质量,和优选附加地在相应的所述图像记录(B)不符合预定的标准的情况下,

将所述图像记录(B)调整为,使得其对应于所述标准,和/或确定:哪些记录参数在记录时必须如何改变,以便所述图像记录(B)符合标准,优选其中根据所调整的图像记录(B)确定:在初始图像记录(B)时应如何实现所述患者(P)的定位,尤其是定位和/或等中心化,以便其符合所述标准。4.根据上述权利要求中任一项所述的方法,其中与图像记录(B)相关联的基本事实(G)尤其是仅包括关于以下内容的信息:进行何种设定来记录相应的所述图像记录(B)和/或对所述图像记录(B)进行何种改变,例如患者(P)的准直或定位和/或校正,尤其是在事后裁切所述图像记录(B)时,其中在进行相应的设定时优选自动地记录所述信息。5.根据上述权利要求中任一项所述的方法,其中所述机器学习算法(A

、A)是CAD算法,并且关于图像记录(B)的基本事实包括诊断和优选附加地包括关于所述图像记录(B)的后处理的信息,尤其是关于结构的对比度、亮度、高亮的变化或像素的位置的变化的信息。6.根据上述权利要求中任一项所述的方法,所述方法设计为用于,尤其关于所述机器学习算法(A

、A)和所述训练数据集(T)的选择,训练所述机器学习算法(A

、A),以患者特定
...

【专利技术属性】
技术研发人员:丹尼尔
申请(专利权)人:西门子医疗有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1