用于从具有标签噪声的数据中学习的方法技术

技术编号：26651296 阅读：20 留言：0更新日期：2020-12-09 00:52

本公开涉及一种用于从具有标签噪声的数据中学习的方法。本发明专利技术提供了一种用于对医学输入数据执行至少一个推理任务(T1、T2)的方法和系统。该系统包括：计算装置(50)，被配置成实现人工神经网络ANN(200)；其中，ANN(200)被配置成接收医学输入数据(4)作为ANN(200)的输入并且基于医学输入数据(4)执行至少一个推理任务(T1、T2)；并且其中，ANN(200)包括输出层(290)，该输出层(290)针对至少一个推理任务(T1、T2)中的至少一个推理任务(T1、T2)具有多个输出节点(291、……、299)，其中，多个输出节点中的每个输出节点(291、……、299)对应于多个预定义分位数中的一个分位数。

全部详细技术资料下载

【技术实现步骤摘要】
用于从具有标签噪声的数据中学习的方法
在人工智能的领域中，特别是在机器学习的领域中，标签作为用于监督学习的基础发挥着重要作用。标签将训练数据集的训练示例与相应的基础事实相关联。然后，当将训练示例中的一个作为输入时，与用于相同训练示例的基础事实(或标签)相比，可以训练人工神经网络以使其预测(或：推理)的误差最小化。
技术介绍
标记的训练数据是机器学习中重要且有价值的资源，而且缺乏足够的训练数据通常是针对特定机器学习项目的主要障碍之一。另一方面，获得标记的训练数据通常相当昂贵，因为例如针对图像分类，必须采用人类标记者来标记图像。尽管一些图像分类任务对人类而言相对容易，但是在标记时例如由于粗心、缺乏专注、缺乏知识可能发生错误。其他图像分类任务特别地在医学领域中的图像分类任务非常复杂并且高度依赖于例如医师的经验而且有时是直觉。关于此点，标签噪声是普遍问题。标签噪声意味着针对某个训练示例的标记在整个训练数据集上可能不一致，或者针对不同训练示例的标签可能相互矛盾或排斥。这使得难以使用具有高标签噪声的训练数据集用于训练人工神经网络，因为相应的成本或损失函数将在一些情况下惩罚正确的推理和/或奖励错误的推理。例如，放射科医师可以为给定的图像集合提供标签(例如，分割掩模、得分、边界方程等)。由于他们的经验不同、问题难度、缺乏注意力或其他随机影响，两个评估者(rater)的观点可能会不同(“评估者间的可变性”)，因此对相同图像(或：训练示例)进行了不同地标记，导致标签噪声。另一示例是如果单个评估者对相似的示例进行了不同地标...

【技术保护点】
1.一种用于对医学输入数据执行至少一个推理任务(T1，T2)的系统(100)，包括：/n计算装置(50)，被配置成实现人工神经网络ANN(200)；/n其中，所述ANN(200)被配置成接收医学输入数据(4)作为所述ANN(200)的输入并且基于所述医学输入数据(4)执行至少一个推理任务(T1，T2)；并且/n其中，所述ANN(200)包括输出层(290)，所述输出层(290)针对所述至少一个推理任务(T1，T2)中的至少一个推理任务(T1，T2)具有多个输出节点(291，……，299)，其中，所述多个输出节点(291，……，299)中的每个输出节点(291，……，299)对应于多个预定义分位数中的一个分位数。/n

【技术特征摘要】
20190607 EP 19178958.51.一种用于对医学输入数据执行至少一个推理任务(T1，T2)的系统(100)，包括：
计算装置(50)，被配置成实现人工神经网络ANN(200)；
其中，所述ANN(200)被配置成接收医学输入数据(4)作为所述ANN(200)的输入并且基于所述医学输入数据(4)执行至少一个推理任务(T1，T2)；并且
其中，所述ANN(200)包括输出层(290)，所述输出层(290)针对所述至少一个推理任务(T1，T2)中的至少一个推理任务(T1，T2)具有多个输出节点(291，……，299)，其中，所述多个输出节点(291，……，299)中的每个输出节点(291，……，299)对应于多个预定义分位数中的一个分位数。

2.根据权利要求1所述的系统(100)，其中，所述输出层(290)包括与针对每个推理任务(T1，T2)的所述多个预定义分位数中的每个分位数对应的一个相应的输出节点(291，……，299)。

3.根据权利要求1或2所述的系统(100)，其中，所述人工神经网络ANN(200)被配置成接收医学成像数据(4)作为所述医学输入数据，并且其中，至少一个推理任务(T1，T2)包括将所述医学成像数据(4)的特征分类成多个类中的至少一个类。

4.根据权利要求1至3中任一项所述的系统(100)，其中，所述分位数是百分位数。

5.根据权利要求1至4中任一项所述的系统(100)，
其中，所述系统(100)和/或所述ANN(200)被配置成输出至少一个输出图像(5)，并且其中，在所述至少一个输出图像(5)中不同地指示与针对相同推理任务(T1，T2)的不同分位数对应的输出节点(291，……，299)的输出值(1，2，3)。

6.一种用于对医学输入数据(4)执行至少一个推理任务(T1，T2)的计算机实现的方法，所述方法至少包括以下步骤：
将医学输入数据(4)输入(S10)至人工神经网络ANN(200)中，其中，所述ANN(200)被配置成接收医学输入数据作为所述ANN(200)的输入并且基于所述医学输入数据(4)执行至少一个推理任务(T1，T2)；
通过所述ANN(200)处理(S20)所述医学输入数据(4)；以及
通过所述人工神经网络针对所述至少一个推理任务(T1，T2)中的至少一个推理任务(T1，T2)输出(S30)与多个预定义分位数中的每个分位数对应的输出值(1，2，3)。

7.根据权利要求6所述的方法，其...

【专利技术属性】
技术研发人员：马丁·克劳斯，弗罗林克里斯蒂安·盖苏，
申请(专利权)人：西门子医疗有限公司，
类型：发明
国别省市：德国;DE

全部详细技术资料下载我是这个专利的主人