用于从具有标签噪声的数据中学习的方法技术

技术编号:26651296 阅读:20 留言:0更新日期:2020-12-09 00:52
本公开涉及一种用于从具有标签噪声的数据中学习的方法。本发明专利技术提供了一种用于对医学输入数据执行至少一个推理任务(T1、T2)的方法和系统。该系统包括:计算装置(50),被配置成实现人工神经网络ANN(200);其中,ANN(200)被配置成接收医学输入数据(4)作为ANN(200)的输入并且基于医学输入数据(4)执行至少一个推理任务(T1、T2);并且其中,ANN(200)包括输出层(290),该输出层(290)针对至少一个推理任务(T1、T2)中的至少一个推理任务(T1、T2)具有多个输出节点(291、……、299),其中,多个输出节点中的每个输出节点(291、……、299)对应于多个预定义分位数中的一个分位数。

【技术实现步骤摘要】
用于从具有标签噪声的数据中学习的方法
在人工智能的领域中,特别是在机器学习的领域中,标签作为用于监督学习的基础发挥着重要作用。标签将训练数据集的训练示例与相应的基础事实相关联。然后,当将训练示例中的一个作为输入时,与用于相同训练示例的基础事实(或标签)相比,可以训练人工神经网络以使其预测(或:推理)的误差最小化。
技术介绍
标记的训练数据是机器学习中重要且有价值的资源,而且缺乏足够的训练数据通常是针对特定机器学习项目的主要障碍之一。另一方面,获得标记的训练数据通常相当昂贵,因为例如针对图像分类,必须采用人类标记者来标记图像。尽管一些图像分类任务对人类而言相对容易,但是在标记时例如由于粗心、缺乏专注、缺乏知识可能发生错误。其他图像分类任务特别地在医学领域中的图像分类任务非常复杂并且高度依赖于例如医师的经验而且有时是直觉。关于此点,标签噪声是普遍问题。标签噪声意味着针对某个训练示例的标记在整个训练数据集上可能不一致,或者针对不同训练示例的标签可能相互矛盾或排斥。这使得难以使用具有高标签噪声的训练数据集用于训练人工神经网络,因为相应的成本或损失函数将在一些情况下惩罚正确的推理和/或奖励错误的推理。例如,放射科医师可以为给定的图像集合提供标签(例如,分割掩模、得分、边界方程等)。由于他们的经验不同、问题难度、缺乏注意力或其他随机影响,两个评估者(rater)的观点可能会不同(“评估者间的可变性”),因此对相同图像(或:训练示例)进行了不同地标记,导致标签噪声。另一示例是如果单个评估者对相似的示例进行了不同地标记,或者在不同的时间点处对一个且相同的示例进行了不同地标记(“评估者内部可变性”)。通常,针对较难的问题,特别是针对给定问题的较难的示例,标签噪声量会增加。在最普通的情况下,无论其来源,标签噪声都可以被视为数据的标签的不确定性或不一致性。当从不一致和/或冲突的标签中学习时,常规的机器学习系统、模型和算法可能会受到负面影响,并且因此可能产生难以解释或具有较低信任等级的次优结果。可以例如,在由Wang等人的科学出版物:“Multiclasslearningwithpartiallycorruptedlabels”,IEEEtransactionsonneuralnetworksandlearningsystems29.6(2018):2568-2580中找到现有技术中解决标签噪声的一种尝试。另外,常规的机器学习系统、模型和算法通常提供针对推理任务的答案,但是不能使他们的用户知道如何获得这些答案或者系统对这些答案的信心如何。这对系统的可用性产生了负面影响,或者在最坏的情况下消除了系统的可用性,这是因为在许多情况下,期望拥有合理的答案或至少使用户明白该答案有多准确的答案。
技术实现思路
因此,本专利技术的目的之一是提供一种用于对医学输入数据执行至少一个推理任务的系统,该系统对噪声输入数据具有更强的鲁棒性并且对其针对推理任务的结果给出更多的洞察,以及提供一种对应的方法和一种用于训练例如系统的方法。因此,根据本专利技术的第一方面,提供了一种用于对医学输入数据执行至少一个推理任务的系统,包括:计算装置,被配置成实现人工神经网络ANN;其中,ANN被配置成接收医学输入数据作为ANN的输入并且基于医学输入数据执行至少一个推理任务;并且其中,ANN包括输出层,该输出层针对至少一个推理任务中的至少一个推理任务具有多个输出节点,其中,所述多个输出节点中的每个输出节点对应于多个预定义分位数中的一个分位数(针对相应的推理任务)。为了便于理解,在本文中,当我们讨论分位数(或百分位数)时,我们谈论抽象数量本身,而不是其值。该值本身将主要被指定为“对应于分位数的输出值”,或者替选地被指定为“分位数的值”。例如,可以说,针对某个推理任务,提供了对应于第30个百分位数的输出节点,并且可以说,对应于该第30个百分位数的输出节点的输出值为0.2,这意味着分布的30%小于或等于0.2。因此,我们的术语与其他术语例如“该分布的第30个百分位数为0.2”)略有不同。当本文中指代不同的分位数(例如,“第一分位数”、“第二分位数”)时,应当将其理解为是指相同类型的分位数,即,全部是x分位数,x是自然数。例如,两个2分位数、三个3分位数、四个4分位数、……、100分位数(“百分位数”)等。通常,人工神经网络可以被配置成接收张量作为输入并且输出至少一个张量作为至少一个推理任务的结果。张量可以特别地是矩阵或向量。替选地或附加地,人工神经网络可以被配置成接收图像作为输入并且输出至少一个图像作为至少一个推理任务的结果。替选地或附加地,人工神经网络可以被配置成接收图像作为输入并且输出至少一个类作为至少一个推理任务的结果(即,至少一个推理任务可以是分类任务)。在统计学和概率学中,分位数是将概率分布的范围划分成具有相等概率的连续区间或者以相同方式对样本中的观测结果(observation)进行划分的切点。分位数的一个示例是百分位数(100分位数)。百分位数(或百分位)是统计学中使用的度量,其指示下述值:一组观测结果中的给定百分比的观测结果落入该值以下。例如,第20个百分位数是下述值(或得分):可以找到20%的观测结果低于该值。通常将第0个百分位数定义为分布的最低值,而将第100个百分位数定义为分布的最高值。公知的分位数是中位数,其也可以被指定为2分位数或第50个百分位数。中位数是用于分布的值,其将分布分为两个大小相等的组,或者换句话说:中位数被定义成使得分布的值的一半比中位数小而一半比中位数大。类似地,同样适用于其他分位数和百分位数。例如,第20个百分位数(或:第一个5分位数)是这样的值:其被定义成使得分布的值的20%比所述值小。通过提供与分位数有关的输出,向本专利技术的系统的用户提供关于系统的内部状态的附加信息,在此意义上,用户更好地理解以哪种确定程度输出输出结果之一。例如,常规系统可以接收医学扫描图像作为输入,并且可以在通过人工神经网络分类之后输出作为肿瘤的扫描图像内的对象。这是一种类型的输出结果。其他输出结果可以例如包括给出肿瘤的边界框的坐标、边界框的尺寸等的向量。利用本专利技术,现在多个推理任务中的每一个(例如,针对每个所分类和/或所检测的对象的对象分类标签)不仅由单个输出节点表示或解决(solve),而且由多个输出节点表示或解决,输出节点的数目与多个预定义分位数相同。例如,如果第15个、第30个、第50个、第70个和第85个百分位数是预定义分位数,则五个输出节点将表示所选择的推理任务中的每一个。替代如在常规系统中简单地接收单个值作为推理任务的结果(例如,平均值),本文中描述的系统的用户获得对应于预定义分位数的每一个的输出节点的输出,并且可以因此更好地判断结果的含义和可靠性以及人工神经网络的内部状态。本专利技术的关键优点之一是可以通过基于噪声目标和自定义损失函数的学习来处理标签中的不确定性。然后,经训练的模型输出可以被解释为对应于一组虚拟本文档来自技高网
...

【技术保护点】
1.一种用于对医学输入数据执行至少一个推理任务(T1,T2)的系统(100),包括:/n计算装置(50),被配置成实现人工神经网络ANN(200);/n其中,所述ANN(200)被配置成接收医学输入数据(4)作为所述ANN(200)的输入并且基于所述医学输入数据(4)执行至少一个推理任务(T1,T2);并且/n其中,所述ANN(200)包括输出层(290),所述输出层(290)针对所述至少一个推理任务(T1,T2)中的至少一个推理任务(T1,T2)具有多个输出节点(291,……,299),其中,所述多个输出节点(291,……,299)中的每个输出节点(291,……,299)对应于多个预定义分位数中的一个分位数。/n

【技术特征摘要】
20190607 EP 19178958.51.一种用于对医学输入数据执行至少一个推理任务(T1,T2)的系统(100),包括:
计算装置(50),被配置成实现人工神经网络ANN(200);
其中,所述ANN(200)被配置成接收医学输入数据(4)作为所述ANN(200)的输入并且基于所述医学输入数据(4)执行至少一个推理任务(T1,T2);并且
其中,所述ANN(200)包括输出层(290),所述输出层(290)针对所述至少一个推理任务(T1,T2)中的至少一个推理任务(T1,T2)具有多个输出节点(291,……,299),其中,所述多个输出节点(291,……,299)中的每个输出节点(291,……,299)对应于多个预定义分位数中的一个分位数。


2.根据权利要求1所述的系统(100),其中,所述输出层(290)包括与针对每个推理任务(T1,T2)的所述多个预定义分位数中的每个分位数对应的一个相应的输出节点(291,……,299)。


3.根据权利要求1或2所述的系统(100),其中,所述人工神经网络ANN(200)被配置成接收医学成像数据(4)作为所述医学输入数据,并且其中,至少一个推理任务(T1,T2)包括将所述医学成像数据(4)的特征分类成多个类中的至少一个类。


4.根据权利要求1至3中任一项所述的系统(100),其中,所述分位数是百分位数。


5.根据权利要求1至4中任一项所述的系统(100),
其中,所述系统(100)和/或所述ANN(200)被配置成输出至少一个输出图像(5),并且其中,在所述至少一个输出图像(5)中不同地指示与针对相同推理任务(T1,T2)的不同分位数对应的输出节点(291,……,299)的输出值(1,2,3)。


6.一种用于对医学输入数据(4)执行至少一个推理任务(T1,T2)的计算机实现的方法,所述方法至少包括以下步骤:
将医学输入数据(4)输入(S10)至人工神经网络ANN(200)中,其中,所述ANN(200)被配置成接收医学输入数据作为所述ANN(200)的输入并且基于所述医学输入数据(4)执行至少一个推理任务(T1,T2);
通过所述ANN(200)处理(S20)所述医学输入数据(4);以及
通过所述人工神经网络针对所述至少一个推理任务(T1,T2)中的至少一个推理任务(T1,T2)输出(S30)与多个预定义分位数中的每个分位数对应的输出值(1,2,3)。


7.根据权利要求6所述的方法,其...

【专利技术属性】
技术研发人员:马丁·克劳斯弗罗林克里斯蒂安·盖苏
申请(专利权)人:西门子医疗有限公司
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1