自动删除系列波谱中的异常值的方法技术

技术编号:2849528 阅读:231 留言:0更新日期:2012-04-11 18:40
处理系列波谱具体是NMR波谱的方法,包括下列步骤:a)选择主波谱范围;b)记录所述主波谱范围内的多个主波谱;c)获得所述主波谱范围内的基准主波谱;d)对每一个所述主波谱进行所述主波谱除以所述基准主波谱的分格除法以获得对应的系列谱商;e)对至少一个所述主波谱计算来自对应系列谱商的相关系列统计量;和f)对至少一个所述系列统计量进行异常值检测测试。

【技术实现步骤摘要】

根据权利要求1的前言,本专利技术涉及处理系列波谱的方法,尤其是处理NMR波谱的方法。
技术介绍
混合物的分析和比较是分析化学的重要课题,尤其是在环境科学、生物学、食品工业和过程化学中。例如,在代谢组学领域中,利用确定的波谱方法例如液相色谱/质谱法(LC-MS)或核磁共振(NMR)波谱法获得的波谱来表征动物和人的生物流体(biofluids)。通常需要分析和比较整组波谱,例如由一系列样品获得的众多单个波谱。为了区分与样品总浓度变化相关的效应(例如通过稀释样品,改变样品的全部被分析物)及影响样品组成的效应(混合物中组分的相对浓度),需要使用所谓的归一化方法。在不同的实验条件下获得各种样品的数据时,也需要归一化。至今,在代谢组学研究中-例如研究尿样-的常用方法是使给定NMR波谱中的信号归一化,从而获得所述波谱的恒定总积分。这意味着系列波谱中每一个NMR波谱按比例绘制成相同的曲线下预定面积。潜在的假设是每一个波谱的积分主要是总尿浓度的函数。假设由于代谢组响应引起的各个被分析物浓度的变化相对于总尿浓度的变化而言相对较小,则总尿浓度的变化分别影响全部波谱和波谱的所述预定面积。但是,代谢组研究中的动物可以排泄极大量的物质例如糖类,其可以在波谱中占主要地位并因此实质性地影响归一化。另外,随尿一起排泄的药物相关化合物也可以通过它们的相应峰的积分来影响归一化,并且因此对波谱的总积分有显著贡献。在比较混合物的其它分析应用中出现同样的问题,其中相对高浓度的未知污染物的出现可显著影响波谱的总积分或者波谱的所述预定面积。在US 2003/0111596 A1中公开了利用质谱法研究化学混合物组分的定量方法。如具体在所述文件的0040段中所述,该已知方法基于 a)从多个化学样品获得一组样品波谱,每一个波谱包含具有峰强度的峰;b)选择基准波谱;c)至于所要归一化的所述样品波谱的每一个,对所有峰或对峰总数的一部分计算样品波谱和基准波谱之间的强度比;d)用从所述强度比计算得到的归一化系数乘以样品波谱。上述方法基于这样的事实,即在许多实际环境下,所述强度比的大多数将基本相等,代表在样品和基准波谱之间浓度不变化的组分。然后利用非参数测量由所述强度比计算归一化系数。优选地,归一化系数选择为所述强度比的中值。如在US 2003/0111596 A1的0031段中进一步指出的,该已知归一化方法可应用于产生含信号(或峰)的波谱的任何类型的波谱方法或波谱测量方法中,所述信号(或峰)的强度或面积与组分浓度成比例。具体地,它因此可应用于NMR波谱学。然而,在US 2003/0111596 A1中公开的方法没有解决识别和消除所谓“异常值”的问题,这些异常值尤其可以是来自人为因素或人为扭曲的单个信号,但也可以是具有某种偏差的整个波谱,例如由于在采集期间的技术故障。这种问题在大量波谱的定量分析中是特别重要的,例如在代谢组研究中。
技术实现思路
本专利技术的主要目的是克服现有定量处理波谱、尤其是处理NMR波谱方法的局限和缺点。通过本专利技术的方法来实现上述和其它目的。根据权利要求1,提供处理系列波谱、尤其是处理NMR波谱的方法,包括下列步骤a)选择主波谱范围;b)在所述主波谱范围内记录多个主波谱;c)在所述主波谱范围内获得基准主波谱;d)对每一个所述主波谱进行主波谱除以所述基准主波谱的分格除法(bin-wisedivision)以获得对应的系列谱商(spectral quotients); e)对至少一个所述主波谱计算得自对应的系列谱商的相关系列统计量;和f)对至少一个所述系列统计量进行异常值检测测试。虽然本专利技术方法适用于NMR波谱并通过在NMR波谱中的应用来举例说明,但是它还可应用于产生包含信号(或峰)的波谱的其它类型波谱,所述信号(或峰)的强度或面积与组分浓度成比例,例如质谱或各种类型的光谱。在本
技术实现思路
中,视情况而定,术语“波谱范围”将用作波谱中的单一区域或多个不连接的区域。具体地,感兴趣的波谱范围可以是多个波谱区域,每一个波谱区域含有一定数量的信号峰。如本专利技术的某些实施方案所采用的,定语“主要的”在本文中用来与“辅助的”进行对比。具体地,“主波谱范围”将被用于表示含有某些样品的一个或多个相关信号峰的波谱范围。应该注意,通常在含有所述主波谱范围和辅助波谱范围(如果可应用的话)的整个波谱范围中获得波谱;而且,整个波谱范围可含有不用于进一步分析的其它波谱范围。例如,代谢组研究中的1H NMR波谱通常记录-8-+14ppm范围的总波谱范围,从中选择分别由1-4.5和6-9.5ppm的两个区域构成主波谱范围。如今基本上在所有波谱学应用中,获得的是数字化形式的波谱数据。例如,通常一维NMR波谱可以作为系列强度值而获得,每一个强度值与特定波谱频道(spectral channel)或“格”(bin)相关。因此,术语“格”也可以指强度值的总和。因而,第二波谱除以第一波谱的“分格除法”在本文中应理解为采用第一波谱的某些格中强度值,用第二波谱的相同格中的强度值除以它,将除法结果分配到所得的系列谱商的相同格中并对感兴趣的波谱范围中所有格重复该程序。应该理解,如果可得的波谱是非数字化的,即模拟态,则根据本专利技术仍然可以实施分格除法。这仅仅需要利用现有信号处理技术中已知的适当分格(binning)程序首先将所有模拟波谱转换成数字形式。术语“统计量”是指任意数,其大小表示所关心的某些量的量值,例如关联强度、偏差量、差值大小和分布形状。例子包括平均值、方差、相关系数等。术语“异常值”是指任意实体(entity)-具体是信号峰、包含几个单峰或者甚至是整组波谱的其谱图或部分谱图-其对于给定变量的分值基本偏离预定数值范围。因此,“异常值检测测试”应该理解为目的在于测定一个给定实体相对于给定测试标准是否应该被认为是异常值的任意类型的程序。根据本专利技术的方法可以容易地在波谱数据的自动处理中实施。如下文将进一步举例说明的,将用于处理系列NMR波谱的实际类型的异常值检测测试可适用于所关心的任何应用。本方法可以嵌入整个程序中,其中例如证实为异常值的谱图应该在进一步的分析中被放弃。有利的实施方案限定在从属权利要求中。通常,将选择对应于主波谱的系列统计量,以便充分描述谱商分布的位置和形状。因此,有利的是利用至少一个位置量和至少一个宽度量。在根据权利要求2的实施方案中,对应于主波谱的系列统计量包含其谱商的中值和通过其谱商的第三四分位数减去其谱商的第一四分位数而获得的四分位数间差值。已知这些统计量是相对稳定的。但是,其它的选择也是可以的可以利用众数或均值作为位置量,也可以利用其它四分位数间差值作为宽度量。在根据权利要求3的实施方案中,所述异常值检测测试包含测定所述四分位数间差值是否超出了预定的阈值宽度。该四分位数之间的差值大表示谱商的宽分布,并因此意味着横切瞬时波谱的强度相对于基准波谱表现出实质性差异并且不仅仅是简单的比例缩放行为。根据权利要求4,阈值宽度由得自整组主波谱的所述四分位数间差值分布来确定。换言之,首先获得在给定系列的全部波谱中发现的四分位数间差值的总印象(impression)从而随后限定用于异常值检测测试的阈值宽度。在根据权利要求5的实施方案中,所述异常值检测测试包含确定谱商的所述中值与一常本文档来自技高网
...

【技术保护点】
处理系列波谱具体是NMR波谱的方法,包括下列步骤:a)选择主波谱范围;b)记录所述主波谱范围内的多个主波谱;c)获得所述主波谱范围内的基准主波谱;d)对每一个所述主波谱进行所述主波谱除以所述基准主波谱的分格除 法以获得对应的系列谱商;和e)对至少一个所述主波谱计算来自对应系列谱商的相关系列统计量;其特征在于,该方法还包括以下步骤:f)对至少一个所述系列统计量进行异常值检测测试。

【技术特征摘要】
EP 2005-3-24 05006476.51.处理系列波谱具体是NMR波谱的方法,包括下列步骤a)选择主波谱范围;b)记录所述主波谱范围内的多个主波谱;c)获得所述主波谱范围内的基准主波谱;d)对每一个所述主波谱进行所述主波谱除以所述基准主波谱的分格除法以获得对应的系列谱商;和e)对至少一个所述主波谱计算来自对应系列谱商的相关系列统计量;其特征在于,该方法还包括以下步骤f)对至少一个所述系列统计量进行异常值检测测试。2.根据权利要求1所述的方法,其中对应于主波谱的系列统计量包含其谱商的中值和由其谱商的第三四分位数减去其谱商的第一四分位数而得到的四分位数间差值。3.根据权利要求2所述的方法,其中所述异常值检测测试包括确定所述四分位数间差值是否超出预定的阈值宽度。4.根据权利要求3所述的方法,其中所述阈值宽度由取自整个系列主波谱的所述四分位数间差值的分布来确定。5.根据权利要求2所述的方法,其中所述异常值检测测试包括确定所述谱商的中值与一常数的差是否大于预定的阈值商偏差。6.根据权利要求5所述的方法,其中所述阈值商偏差由取自整个系列主波谱的所述谱商中值的分布来确定。7.根据权利要求1所述的方法,还包括下列步骤a)选择与所述主波谱范围不重叠的辅助波谱范围;b)记录与所述主波谱范围中的每一个所述主波谱相关的所述辅助波谱范围中的辅助波谱;c)...

【专利技术属性】
技术研发人员:弗兰克迪特勒阿尔弗雷德罗斯格茨施洛特贝克汉斯森
申请(专利权)人:F霍夫曼拉罗奇股份有限公司
类型:发明
国别省市:CH[瑞士]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利