分析选定的多组分样品的方法技术

技术编号:2595110 阅读:219 留言:0更新日期:2012-04-11 18:40
本申请描述了一种由二维(2D)分离数据(GC-MS)对复杂的多组分混合物的化学或生物学性质(诸如毒性、致突变性)进行预测的方法。利用自动曲线解析程序(GENTLE)把数据解析成各个组分的谱峰(C)和谱项(S)。随后将已解析的峰值进行积分,并且把特征面积、分离参数和缔合谱图合并成一个预测值矩阵(X),这个矩阵可用作多元回归模型的输入项。利用部分最小二乘法(PLS)将一组测试集的2D分离数据与已测过的性质联系起来。随后,就可以用回归模型预测其他样品的性质。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种对数据、特别是对从包含多个组分的系统(例如含有多个未经鉴定的化合物的组合物)中得到的数据进行分析的方法,以及用于实施这种分析的程序和计算机。在环境监测和医疗诊断分析中,分析人员可得到含有多个未经鉴定的化学或生物组分的样品(例如体液、废液或废气样品),比方说包含几百种化合物,分析人员需要确定出抽样分析的物质是否会造成环境危险或含有病状迹象。目前使用的一种典型技术是所谓的埃米斯(Ames)测试,这种技术是使一种细菌的选定突变菌株暴露在样品中,并通过测定细菌的突变程度来评估环境样品的毒性(致突变性),其中细菌由于发生突变,因此具有自然(野生)菌株中存在而选定的突变系中缺乏的特性。我们可以看到,这样的测试仅仅表明特定的样品具有毒性,而并没有指出产生毒性的特定化合物或一组化合物,也没有给出预测其他样品毒性的基准。同样,大多数诊断分析仅仅检测出一种单一化合物的存在或过量,但却没有指出还可表征特定病状或其他病状的其他化合物的存在或过量。可以用色谱技术(例如用液相色谱或气相色谱)分离多组分混合物中的各个组分,也可以用光谱技术(例如质谱、IR、UV、拉曼、ESR和NMR光谱)来测定各个组分的光谱特征;然而,色谱分离一般无法分离出由几百种化合物组成的混合物中的每一种组分,而且色谱分离很昂贵、耗时,一般来说,对一个多组分样品的所有馏分或组分进行毒性分离或其他检测是不切实际的。因此,人们需要一种对多组分混合物进行分析的方法,这种方法能够整体预测混合物的效应(例如毒性),而且可以集中并有可能鉴定出对这种效应起主要作用的组分。现在,我们已经找到了这样的方法,它能够实现这样的功能,即对大多数相似的样品来说,我们可以得到样品效应的数据,也可以得到样品的分离馏分(例如样品的色谱分离馏分)的特征光谱数据。因此,从一方面来看,本专利技术提供了一种用于,以便预测样品的某种本征值(property value),这种方法包括i)确定多个相似的多组分样品的所述本征值;ii)对每一种所述相似样品来说,a)沿一个分离量度(dimension)分离样品的组分,b)在沿以所述分离量度的多个位置上对样品的多个部分进行采样,c)确定每一部分的图形,该图形表征该部分的单一或多组分的性质,d)为所述分离量度的各个部分选择几组所述图形(pattern),并且从其中确定所述部分的各个组分的特征图形和分离量度分布曲线;iii)将沿分离量度的确定图形与其分布曲线的位置进行比较,由此可以鉴定出所述相似样品中的类似组分;iv)将所述相似样品中的组分的所述本征值和所确定的分布曲线强度进行比较,由此产生一个预测样品的所述本征值的模型;v)对所述的选定样品来说,A)沿一个分离量度分离其组分,B)在沿所述分离量度的多个位置上对样品的多个部分进行采样,C)确定每一部分的图形,该图形可以表征该部分的单一或者多组分的性质,D)为所述分离量度的各个部分选择几组所述图形,并且从其中确定出这些部分的各个组分的特征图形和分离量度分布曲线,E)将所述模型施加到所述选定样品中各个组分的已确定分布曲线的强度上,由此对所述选定样品的所述本征值进行估算。“本征(property)”指的是任何能够被指定数值的性质;然而它也可能是例如零或者一,其中间级度(gradation)是不可能或不需要的,例如生或死、感染或未感染等等。本专利技术的方法涉及到根据对相似样品的分析来构建一种预测模型,对于这样的相似样品来说,其本征值已经确定,然后将这种模型施加到无需确定本征的样品的分析结果中。由于相似性意味着样品是相同的类型,或具有相同或相似类型的来源,例如,样品都是来自于相同工艺或操作的废气或废液,或者是从相同物种的成员中的相同体液、组织、渗出液等中取得,例如血液、血清、血浆、尿液、粘液、唾液、粪便、汗液、体内气体等等。因此,“相似”的样品将共同含有“选定”样品中存在的多个、优选的是全部或绝大部分组分。本专利技术的方法涉及对多组分样品的各个组分进行分离。这样的分离可以是但并不需要是完全的,而目每个取样部分(例如对于质谱分析来说)可以因此含有一种或多种成分。所以,如果借助于气相或液相色谱法进行分离,那么同样的组分可存在于沿分离量度(例如洗脱时间)的几个相邻部分中。因此,在用气相色谱-质谱(GC-MS)法时,这种方法涉及对相邻部分的质谱图谱的研究,以便鉴定出各个组分的MS特征峰,并且计算出各个组分沿洗脱时间的GC分布曲线。如果需要的话,可以排除分离量度的无用部分的数据,这样,需要确定分布曲线的组分可以仅仅需要包括所存在的全部组分的一个子集。那些已确定的分布曲线的强度(例如,峰高、峰的面积或简单的是/否的值)可用于预测模型的构建和应用。通过对不同样品的数据进行比较可精确制定出预测模型,这样就可以识别出在分布曲线(例如保留时间或调整保留时间)和图形(例如质谱)方面相同或非常相似的类似组分。对许多样品的分析来说,一个供应商可以向用户提供预先计算好的预测模型,因此,从这一方面来看,本专利技术提供了一种用于预测多组分样品的本征值的预测模型的产生方法,这种方法包括i)确定出多个相似的多组分样品的所述本征值;ii)对每一种所述的相似样品来说,a)沿一分离量度分离它的组分,b)在沿所述分离量度的多个位置上对样品的多个部分进行采样,c)确定每一部分的图形,该图形表征该部分的单一或多组分的性质,d)为所述分离量度的各个部分选择几组所述图形,并且从其中确定所述部分的各个组分的特征图形和分离量度分布曲线;iii)将沿分离量度的确定图形与其分布曲线的位置进行比较,由此鉴定出所述相似样品中的类似组分;iv)将所述相似样品中各个组分的所述本征值和确定的分布曲线强度进行比较,由此产生一个预测样品的所述本征值的模型。从另一方面看,本专利技术提供了一种对选定多组分样品进行分析的方法,以预测它的本征值。这种方法包括A)沿一分离量度分离样品的组分,B)在沿所述分离量度的多个位置上对样品的多个部分进行采样,C)确定每一部分的图形,该图形表征该部分的单一或多组分的性质,D)为所述分离量度的各个部分选择几组所述图形,并且从其中确定出该部分的各个组分的特征图形和分离量度分布曲线,E)将所述模型施加到所述选定样品中各个组分的已确定分布曲线的强度上,由此对所述选定样品的所述本征值进行估算。同时,正如下面将要进一步讨论的,本专利技术的方法可以更广泛地应用于多组分样品,以下将进一步详细描述的这个方法,涉及到利用产生各个部分的色谱分离和产生图形的光谱分析对包含大量化合物的样品进行分析,以得到定量性质例如物理、化学性质,特别是生物学性质(例如毒性、致突变性、病状、基因型、治疗效果等等)。虽然如上所述,我们可以使用许多不同的光谱分析方法,但光谱的波峰(或波谷)尖锐的技术是特别优选的,例如NMR,尤其是质谱(MS)。同样,优选的是采用液相色谱或更好的气相色谱进行分离。可以利用能产生样品的色谱分离光谱数据的设备,例如GC-MS设备。因此,用于按照本专利技术的分析方法的起始数据可以认为是一个二维矩阵(即色谱部分的数据和每一个色谱部分的光谱数据),再加上用于产生预测模型的每一样品的确定本征值和用于产生选定样品的预测值的二维矩阵(即色谱部分的数据和每一个色谱部分的光谱数据)。同样,色谱本文档来自技高网...

【技术保护点】
一种分析选定的多组分样品的方法,以预测其本征值,该方法包括:i)确定多个类似的多组分样品的所述本征值;ii)对每一种所述的相似样品来说,a)沿一分离量度分离样品的组分,b)在沿所述分离量度的多个位置上对样品的多个部分进行采样 ,c)确定每一部分的图形,该图形表征该部分的单一或多组分的性质,d)为所述分离量度的各个部分选择多组所述图形,并且从其中确定出所述部分的各个组分的特征图形和分离量度分布曲线;iii)将沿分离量度所确定的图形与其分布曲线的位置进行 比较,由此鉴定出所述相似样品中的类似组分;iv)将所述类似样品中的各个组分的所述本征值与已确定的分布曲线强度进行比较,由此产生一个预测样品的所述本征值的模型;v)对所述的选定样品来说,A)沿一分离量度分离样品的组分,B)在沿 所述分离量度的多个位置上对样品的多个部分进行采样,C)确定每一部分的图形,该图形表征该部分的单一或多组分的性质,D)为所述分离量度的各个部分选择多组所述图形,并且从其中确定出这些部分的各个组分的特征图形和分离量度分布曲线,E)将 所述模型施加到所述选定样品中的各个组分的已确定分布曲线的强度上,由此对所述选定样品的所述本征值进行估算。...

【技术特征摘要】
...

【专利技术属性】
技术研发人员:奥拉夫夸尔海姆比约格龙
申请(专利权)人:模式识别系统控股有限公司
类型:发明
国别省市:NO[挪威]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利