用于量化医学图像评估的不确定性的方法、系统和装置制造方法及图纸

技术编号:36701690 阅读:26 留言:0更新日期:2023-03-01 09:18
用于量化医学图像评估的不确定性的方法、系统和不确定性量化器。一方面,本发明专利技术涉及一种用于为由机器学习系统(M)提供的对于成像数据(I)的医学评估提供不确定性预测的计算机实现的方法。该方法包括接收(1)输入数据集,该输入数据集包括已经被提供给机器学习系统(M)的成像数据(I)和非成像数据,每个非成像数据被表示为具有某种程度的噪声的信号(S),所述噪声被量化为不确定性,特别是偶然不确定性;提供(2)信息融合算法;以及将接收的输入数据集应用(3)于提供的信息融合算法,同时基于提供的输入数据集,通过信息融合算法对不确定性的传播进行建模,以预测由机器学习系统(M)提供的作为结果(r)的医学评估的不确定性。的作为结果(r)的医学评估的不确定性。的作为结果(r)的医学评估的不确定性。

【技术实现步骤摘要】
用于量化医学图像评估的不确定性的方法、系统和装置


[0001]本专利技术涉及医学图像处理,并且特别地涉及医学健康相关数据、特别是医学成像数据中不确定性的处理。

技术介绍

[0002]通常,确实存在用于采集医学图像的几个不同的成像模式,除其他事物之外尤其像射线照相术、计算机断层摄影(CT)、磁共振成像(MRI)。成像程序可以特别适于对特定器官或身体部分进行成像,以便发现和/或评估临床异常和/或疾病和/或损伤。例如,为了对肺部恶性肿瘤或肺炎进行分类,通常执行计算机断层摄影(CT)扫描或胸部射线照相(CXR)。
[0003]采集的医学图像可以受制于用于医学评估的自动化程序,例如用于发起进一步测量和/或采集进一步传感器数据和/或发起临床程序。用于评估医学图像的自动化程序是机器学习。机器学习系统可以例如被配置用于在健康组织和病变(或异常)之间进行分类。通常,机器学习系统可以被配置用于评估所提供的医学图像。
[0004]然而,医学图像的计算机实现和自动评估受制于不确定性,特别是偶然不确定性。偶然不确定性也称为统计不确定性,并且代表每次运行相同实验时不同的未知量。偶然(Aleatoric)源自拉丁语“alea”或“dice”,指代一种碰运气的游戏。偶然不确定性要与认知不确定性进行区分,认知不确定性是一种系统性不确定性,并且是由于系统原则上可以知道或计算但实际上无法知道或计算的事情。这可能是因为测量不准确,或者测量中或测量信号中存在噪声。
[0005]例如,胸部射线照相术(CXR)图像的评估特别是在门诊环境中是固有的模糊任务。内部研究揭示,评级者间的一致水平对于例如肺结节的检测为60

70%,并且对于实变/气体空间不透明的检测为50

60%。该不一致水平通常可以归因于在决策异常区域是指示异常A(例如,肺结节/肿块)还是异常B(例如,实变)中缺乏清楚性。当前仅基于CXR评估以及评价研究的机器学习系统被设计为强制做出该决策,而在临床实践中,放射科医师将不做出这样的决策,并且将在报告中记录这两个类之间的不确定性(最有可能要求使用另一个CXR或CT扫描进行随访以获得清楚的答案)。此外,用于CXR评估的机器学习系统通常不使用任何辅助非成像信息来引导该决策(在异常A/B之间)。这与放射科医师不同,放射科医师例如将利用所讨论的患者发烧的事实来引导对异常B/实变的决策,该异常B/实变是肺炎/感染的结果,这进而解释了发烧。这导致在这样的模糊情况下表现得糟糕/出乎意料的系统,从而实现有限的性能并直接影响用户的信任。
[0006]尽管比CXR更准确地获得相关信息(例如,用于随后或稍后的鉴别诊断),但在高分辨率胸部CT中可能存在类似的模糊性。放射科医师通常参考来自电子健康记录(EHR)的附加信息,包括但不限于:安排检查的原因、患者疾病和体检的历史、血清学结果、来自实验室诊断学诊断的生物标志物等,以获得清楚性。当前通常发生的场景是将易患诸如间质性肺病(ILD)的呼吸系统疾病的患者中的新冠肺炎(CoVID

19)与具有潜在肺部恶性肿瘤的患者进行区别。

技术实现思路

[0007]基于此,本专利技术的目的是提供用于基于成像数据改进机器学习系统结果的表达性和/或鲁棒性的手段,和/或使成像数据与非成像数据的组合成为可能,以改进从成像数据推断的陈述。
[0008]该目的通过所附专利权利要求实现,特别是通过计算机实现的方法和不确定性量化器、医学系统和计算机程序产品实现。
[0009]在第一方面,本专利技术涉及一种用于为由机器学习系统发布或提供的对于成像数据的医学评估、特别是自动(计算)医学评估提供不确定性预测的计算机实现的方法。该方法包括以下方法步骤:

接收输入数据集,该输入数据集包括已经被提供给机器学习系统的成像数据和非成像数据,每个非成像数据被表示为具有某种程度的噪声的信号,该噪声被量化为不确定性,特别是偶然不确定性和/或认知不确定性;

在存储装置中提供信息融合算法;

将接收的输入数据集应用于提供的信息融合算法(即,利用接收的输入数据集执行信息融合算法),同时基于提供的输入数据集,通过信息融合算法对不确定性的传播进行建模,以预测由机器学习系统提供的作为结果的医学评估的不确定性。
[0010]术语“非成像数据”指代数字格式或表示形式的医学或保健数据,其不包括从成像模态采集的图像数据。非成像数据可以反映非成像知识。一些非成像数据需要在进一步处理之前进行结构化。如稍后将更详细解释的,本专利技术尤其建议使用图神经网络进行数据处理。在这方面,特定的非成像数据需要在传递到图神经网络之前被结构化,例如EHR文本。因此,可以对非成像数据执行预处理。预处理可以包括在存储器中以可处理的格式(例如,标准化和规范化以在图神经网络和/或信息融合模型中被处理)使数据重新结构化。因此,预处理数据的存储不同于原始非成像数据(也称为信号)的存储。
[0011]在这方面,“噪声”涉及不包括有效载荷信号的信号或数据部分。噪声可以量化为不确定性,特别是偶然或认知不确定性。虽然随机不确定性是最常见的,但是也可以处理分布不确定性和其他类型的不确定性。在优选实施例中,可以使用深度表示学习,例如变分自动编码器VAE,并将其应用于例如经由变分自动编码器将信息编码为紧凑表示和/或对一些收集的输入数据进行去噪。关于变分自动编码器的更多细节,参考Kingma, D. P., & Welling, M. (2013),Auto

encoding variational bayes,arXiv preprint arXiv:1312.6114。
[0012]输入数据是数字数据,或借助于转换器从模拟信号变换为数字信号。输入数据可以包括数字信号或更复杂的数据集,例如信号随时间的发展。输入数据可以包括源自不同成像模态的成像数据和非成像数据,非成像数据例如是像生物标志物、实验室值、电子保健记录(EHR)、测量信号,比如生理信号,像血压、体温、心率等。
[0013]信息融合算法是一种用于组合以不同格式提供的不同数据集(包括例如成像数据和非成像数据)的算法。信息融合模型不需要是“深度的”,但是可以是“深度的”。信息融合模型可以是通过互信息标准优化的深度融合模型。信息融合算法可以是或者可以使用(应用)信息融合模型和/或图神经网络,其被优化用于最大化非成像数据中的熵。通常,为了改进不确定性预测的质量,使用多于一个的非成像信号。优选地,使用信息融合模型,其中不
确定性的传播通过该模型传播。替代地或附加地,可以使用图神经网络。在仍另一实施例中,可以仅使用图神经网络(没有信息融合模型),其中图神经网络包含成像数据和非成像数据这两者。
[0014]信息融合的结果是对于医学评估的估计或预测的不确定性。不确定性可以以量化的形式来表示。不确定性可以基于预配置的度量。不确定性可以作为百分比提供。
[0015]机器学习系统用于通过考虑成本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于为由机器学习系统(M)提供的对于成像数据(I)的医学评估提供不确定性预测的计算机实现的方法,包括以下方法步骤:

接收(1)输入数据集,所述输入数据集包括已经被提供给机器学习系统(M)的成像数据(I)和非成像数据,每个非成像数据被表示为具有某种程度的噪声的信号(S),所述噪声被量化为不确定性,特别是偶然不确定性;

提供了(2)信息融合算法;

将接收的输入数据集应用(3)于提供的信息融合算法,同时基于提供的输入数据集,通过信息融合算法对不确定性的传播进行建模,以预测由机器学习系统(M)提供的作为结果(r)的医学评估的不确定性。2.根据权利要求1所述的方法,其中,所述信息融合算法使用信息融合模型和/或图神经网络,它们被优化用于使非成像数据中的熵最大化。3.根据前一权利要求所述的方法,其中,通过贪心算法来优化信息融合模型和/或图神经网络的熵,特别是冯诺依曼熵。4.根据前述权利要求中任一项所述的方法,其中,所述方法进一步包括:

应用(5)选择算法来选择所提供的输入数据的子集,这通过使用强化学习模型来最小化成本函数和/或减少不确定性。5.根据前述权利要求中任一项所述的方法,其中,输入数据源(S,DB)集的输入数据可以存在或不存在,并且其中,所述方法提供了不存在的输入数据源(S,DB)中的哪一个将降低不确定性和/或最小化成本函数的引导决策。6.根据前述权利要求中任一项所述的方法,其中提供输入数据源(S,DB)集的输入数据可以包括从成像模态和/或从医学数据库(DB)测量和/或采集数据。7.根据权利要求4至6所述的方法,其中,强化学习模型基于决策过程,特别是非马尔可夫决策过程,其中S标示状态空间,A标示动作空间,T标示随机转变过程,R标示奖励函数,并且标示折扣因子,其中动作表示提供附加输入数据源(S,DB)。8.根据前一权利要求所述的方法,其中,所述奖励函数被定义为最小化成本和/或最小化预测的不确定性。9.根据前述权利要求中任一项所述的方法,其中,所述非成像数据包括生物标志物、临床记录、图像注释、医学报告口述、测量、实验室值、诊断代码、来自EHR数据库的数据和/或患者记忆数据。10.根据权利要求4至9中任一项所述的方法,其中,包...

【专利技术属性】
技术研发人员:FC
申请(专利权)人:西门子医疗有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1