当前位置: 首页 > 专利查询>西门子公司专利>正文

使用多个实例学习来训练标志检测器的方法和系统技术方案

技术编号:7316974 阅读:192 留言:0更新日期:2012-05-04 04:25
公开使用多个实例学习来训练标志检测器的方法、系统和装置。包括多个训练袋的训练数据被接收。该多个训练袋包括多个正向训练袋,每个包括多个正向的经注释的实例,以及多个负向训练袋,每个都包括至少一个负向的经注释的实例。基于正向训练袋和负向训练袋通过训练第一弱分类器来初始化分类函数。使用分类函数评估所有训练实例。对多个剩余分类器中的每一个,基于在每个正向袋中由分类函数评估的每个实例的空间上下文信息计算成本值梯度。基于成本值梯度计算与每个剩余弱分类器相关的梯度值。选择多个剩余弱分类器中的一个弱分类器。选定的弱分类器具有最低的相关梯度值。确定与选定的弱分类器相关的权重参数。将选定的弱分类器加入分类函数。

【技术实现步骤摘要】

本专利技术涉及使用具有噪声注释的训练数据来训练标志检测器(landmark detector)0
技术介绍
在对象检测中,比如标志检测,最大的障碍之一是获取精确的注释。标志被定义为清楚并且独特的用于其它任务比如图像配准的解剖学结构。某些组成标志的解剖学结构包括肺尖、肝顶,和气管的分叉。获取注释往往是一个非常繁琐和/或容易出错的任务。通常情况下,为了方便精确的标志检测,需要大量的精确的经注释的训练数据。对标志检测器的训练在精确地发现医疗图像和医疗体积中的解剖学标志的位置中是重要的。要适当地训练标志检测器以精确地检测标志,标志位置在训练数据内的精确注释是必要的。例如,一个领域的专家可以通过准确地指示训练数据图像和体积中的基础真实位置(ground truth position)来提供准确注释。另一方面,初学的注释者可以提供可以在与基础真实位置的容忍距离内的噪声注释。因此,使用来自专家与初学注释者的注释训练数据的混合物在训练标志检测器期间,可能存在提供正向训练样本的精确注释,和其中正确训练样本被实际上定位的情况下只提供粗略指示的噪声注释的混合物。
技术实现思路
多实例学习(MIL)是与标准的有监督的学习方法相比可以被更好装配以处理噪声注释的学习框架。然而,为了使用MIL训练分类器来精确并高效地检测物体或者标志,本专利技术认识到仍然需要大量的训练数据并且大量的不精确注释可能仍然会导致高误差率。此外,如果训练数据图像本身不是最佳质量的,比如当图像模糊时,真正物体位置可能仍然很难检测。在本专利技术的一个实施例中,标志检测器可以通过使用多实例学习被训练。包括多个训练袋的训练数据被接收。该多个训练袋包括多个正向训练袋(positive training bag),每个都包括多个正向的经注释的实例,以及多个负向训练袋,每个都包括至少一个负向的经注释的实例。基于正向训练袋和负向训练袋通过训练第一弱分类器来初始化分类函数。使用分类函数评估所有的训练实例。对多个剩余分类器中的每一个,基于在每个正向袋中由分类函数评估的每个实例的空间上下文信息计算成本值梯度。基于成本值梯度计算与每个剩余弱分类器相关的梯度值。选择多个剩余弱分类器中的一个弱分类器。选定的弱分类器具有最低的相关梯度值。确定与选定的弱分类器相关的权重参数。将选定的弱分类器加入分类函数。在一个实施例中,计算成本值梯度是基于空间上下文信息。空间上下文信息可以在训练袋级别上,通过确定每个训练袋的展开来计算空间上下文信息。每个袋的展开可以通过相对各自的训练袋中的多个实例归一化每个训练的分数来确定。空间上下文信息还可以在实例级上并使用秩条件秩选择滤波器来计算。训练袋级别上和实例级别上的空间上下文信息可以被结合。在一个实施例中,通过计算数据项和空间调整项(spatial regularization term)并使用二者得到成本值梯度来计算成本值梯度。数据项使用平滑最大值函数来计算。 空间调整项通过计算每个训练袋的全变差调整值来计算。在一个实施例中,在将每个选定的弱分类器加入到分类函数之后修剪(priming) 操作被执行。本专利技术的这些以及其他优点对参考下文详细说明和附图的本领域技术人员来说是显而易见的。附图说明图1示出了根据本专利技术的一个实施例的训练标志检测器的方法;图2示出了根据本专利技术的一个实施例的用于训练标志检测器的经注释的训练图像;图3示出了传统的多实例学习和增强(boosting)算法与根据本专利技术的实施例的训练标志检测器的方法相比较的实验结果;图4示出了使用不同的多实例学习算法的距离误差的图,该算法包括根据本专利技术的一个实施例的训练标志检测器的方法;图5示出了根据使用本专利技术实施的实验得到的真正向(true positive)与假正向 (false positive)比率;图6描绘了基于使用本专利技术实施的实验对测试数据的检测结果的可视化;图7示出了根据本专利技术的一个实施例的训练标志检测器的又另一个方法;图8描绘了根据本专利技术的一个实施例,来自两个分数图的两个级别集的外围级别;图9描绘了根据本专利技术的一个实施例的示出用于检测气管分叉的真正向比率和假正向的接收机操作特性曲线;图10描绘了用于比较MILBoost和根据本专利技术的一个实施例的训练标志检测器的方法的两个分数图;图11描绘了根据本专利技术的一个实施例的示出用于检测肝尖的真正向比率和假正向的接收机操作特性曲线;图12是能够实现本专利技术的计算机的高层次结构框图。 具体实施例方式本专利技术提供了一种用于使用多实例学习来训练标志检测器以便精确地检测医学图像和体积(比如二维荧光检查图像和三维计算机断层造影(CT)体积)的方法和系统。 在医学图像中,标志通常位于空间上彼此分开以及来自标记检测器的响应应该在空间上群集。因此,本专利技术使用训练数据中实例的空间结构来解决上述使用含有噪声注释的训练数据来训练检测器的问题。此处描述的本专利技术的实施例给出了对在结合空间上下文信息同时使用多实例学习来训练标志检测器的方法的理解。数字图像通常是由一个或多个对象(或形状)的数字表示组成。这里,对象的数字表示通常在识别和操作对象方面被描述。该操作是在计算机系统的内存或其他电路/硬件中完成的虚拟操作。因此,应该理解的是,本专利技术的实施例可以在计算机系统内使用该计算机系统内存储的数据被执行。图1示出了根据本专利技术的一个实施例的训练标志检测器的方法。在步骤102中, 多个经注释的训练数据被接收。该多个经注释的训练数据包括包含多个正向注释实例的多个正向袋,以及包含至少一个负向注释实例的多个负向袋。在有监督的学习中,训练数据以 Ixi, IJ的形式被提供,其中Xi e Rd是每个实例(表示注释)的特征向量而Ii是二进制标签,指示是正向的(Ii = 1)或是负向的(Ii = 0)。在多实例学习中,训练数据被提供为袋,其中每个袋i具有叫个实例权利要求1.一种用于训练标志检测器的方法,包括接收包含多个训练袋的训练数据,该多个训练袋包括多个正向训练袋,每个正向训练袋包括多个正向的经注释的实例;以及多个负向训练袋,每个负向训练袋包括至少一个负向的经注释的实例;基于正向训练袋和负向训练袋,通过训练第一弱分类器来初始化分类函数; 使用分类函数评估所有的训练实例; 对多个剩余弱分类器中的每一个基于在每个正向袋中由分类函数评估的每个实例的空间上下文信息,计算成本值梯度;基于成本值梯度计算与每个弱分类器相关的梯度值; 选择多个剩余弱分类器中具有最低的相关梯度值的弱分类器; 确定与选定的弱分类器相关的权重参数;以及将选定的弱分类器加入分类函数中。2.根据权利要求1所述的方法,还包括使用空间上下文信息训练该多个弱分类器的第二个弱分类器; 迭代地训练剩余的多个弱分类器直到所有的多个弱分类器都被训练;以及输出分类函数。3.根据权利要求1所述的方法,其中基于在每个正向袋中由分类函数评估的每个实例的空间上下文信息,计算成本值梯度包括基于训练袋级别上的空间上下文信息来计算成本值梯度。4.根据权利要求3所述的方法,其中基于训练袋级别上的空间上下文信息来计算成本值梯度包括通过确定每个训练袋的展开来计算空间上下文信息。5.根据权利要求4所述的方法,其中确定每个训练袋的展开包括 相对各个训练袋中的多个实例归一化每个训练袋的分数。6.本文档来自技高网...

【技术保护点】

【技术特征摘要】
...

【专利技术属性】
技术研发人员:D·刘S·K·周P·斯沃博达D·科马尼丘C·铁真
申请(专利权)人:西门子公司西门子公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术