分析数据处理方法以及装置制造方法及图纸

技术编号:9741829 阅读:149 留言:0更新日期:2014-03-07 04:39
将用LC/MS、GC/MS等收集到的针对多个样本的数据以无信息缺失且负荷轻的方式转换为二维表的形式,使得能够进行准确的比较分析。如果获取多个样本的LC/MS测量数据并分别制作出提取离子色谱图(XIC)(S1、S2),则进行时间轴调整以校正保持时间偏差(S3),之后,通过时间轴调整来进行校正在数据开头部、末尾部产生的数据缺失的处理(S5)。具体地说,针对存在数据缺失的保持时间范围删除全部样本的数据,使数据开头和末尾一致。之后,针对每个XIC制作排列信号强度值而得到的一维表,然后将一个样本的多个XIC的一维表按m/z的顺序相连接来制作长的一维表(S6),通过将多个样本的一维表在其它维度方向上进行排列来制作二维表(S7)。

【技术实现步骤摘要】
【国外来华专利技术】分析数据处理方法以及装置
本专利技术涉及一种对利用广义的色谱分析装置收集到的数据进行处理的数据处理方法以及装置,该色谱分析装置将液相色谱、气相色谱、毛细管电泳等样本成分在时间方向上进行分离,特别是涉及一种适于对利用结合以下两种方法的分析装置收集到的数据进行处理的数据处理方法以及装置,即在以时间为分离要素的一维方向上分离样本中的成分的方法,以及质量分析、红外光谱测量、紫外可视光谱测量等获取针对样本通过时间以外的分离要素在一维以上的方向上分离得到的信号强度的检测方法。
技术介绍
在将液相色谱(LC)、气相色谱(GC)、毛细管电泳(CE)等成分分离方法与质量分析(MS)方法相结合的LC/MS、GC/MS、CE/MS等所进行的分析中,能够在对样本中包含的多种成分在时间上进行分离之后按每种成分获取质量分析数据。因此,能够高效地分析混合有各种化合物的样本,近年来被应用于广泛的领域。另一方面,测量得到的数据的量相当多。特别是在进行如比较多个相似的样本的分析结果这样的评价的情况下,每个样本都能够获得大量的质量分析数据,因此处理对象整体的数据量庞大,难以进行全面的分析。作为解决该难题的一种分析方法,以往使用了能够比较简便地分析大量数据的判别分析、主成分分析以及聚类分析等多变量分析。例如在非专利文献1、专利文献1等中公开了对针对多个样本所得到的质谱数据进行主成分分析并用评分图(scoreplot)和负荷图(loadingplot)示出其结果的例子。另外,作为用于如上述那样对质量分析数据进行多变量分析的通用的软件,例如众所周知的有瑞典的Umetrics公司开发的SIMCA-P+、美国Infometrix公司开发的Pirouette等,这些软件能够容易地得到。但是,需要预先将分析对象的测量数据(如果是LC/MS,则为质谱数据、色谱数据)整理成表格形式、即一维或者二维(纵×横)配置的数值数据,以将测量数据读入上述那样的多变量分析用的软件来进行处理。以往,一般在使用了红外光谱测量装置(IR)、核磁共振装置(NMR)等的分析中,经常对从多个样本收集到的数据进行多变量分析并进行评价。这是由于与LC/MS、GC/MS相比在IR、NMR中通过对样本进行测量而得到的数据简单。即,利用IR、NMR得到的简单的分析结果是一个图表,也就是说,能够表示为针对某个物理量(如果在IR中则为波长,如果在NMR中则为化学位移)的信号强度这样的一维上的数值数据。因而,在对多个样本的分析结果进行比较的情况下,能够将分配给各样本的序号等数值设为一个维度方向的变量,将上述物理量设为其它维度方向的变量,以在该二维表中用数值记载信号强度的形式将测量数据整理到一个表中。与此相对地,利用LC/MS、GC/MS等得到的测量数据是分别在时间和质量电荷比(m/z)这两个独立的分离要素的方向上分离得到的信号强度,其自身为二维上的数据。因而,在对多个样本的分析结果进行比较的情况下,需要将上述二维上的数据一维化,将针对多个样本的测量数据整理到一个表中。用于将时间方向和质量电荷比方向这样的二维上的数据一维化的最简单的方法是以下方法:从多个质量电荷比中选择特定的一个质量电荷比、或者在质量电荷比方向上对所有的信号强度进行累计。这意味着将质量电荷比方向的变量实质固定为一个、即去除质量电荷比方向这一维度。另外,从多个质量电荷比中选择特定的一个质量电荷比相当于从LC/MS(或者GC/MS)的数据中选择一个提取离子色谱图(ExtractedIonChromatogram=XIC),在整个质量电荷比范围内在质量电荷比方向上对信号强度进行累计相当于根据LC/MS的数据求出一个总离子电流色谱图(TotalIonCurrentChromatogram=TIC)。通过这样的方法,能够减轻取决于后述那样的用于一维化的数据处理运算时的内部参数的不确定性,处理也简单,因此硬件的负荷变轻,处理所需的时间也变短,因此吞吐量高。然而,在TIC中质量电荷比方向的信息全部丢失,在XIC中虽然保存了一个质量电荷比信息,但是针对其它质量电荷比的信息全部丢失,可以说所有质量电荷比方向的一维信息实质上均已缺失。这样,在二维上的数据的其中一个维度方向上的信息缺失的情况下,存在以下问题:如果缺失的该信息中包含附加有多个样本间的差异这一特征的重要信息,则即使进行多变量分析也不能得到用于评价多个样本的相似性、差异性的恰当的结果,不能准确地进行样本的比较。对此,在非专利文献2、3中公开了以下例子:对通过LC/MS收集到的数据执行峰值检测和选择、噪声去除、强度计算(标准化(normalize)等)等复杂的数据处理运算来删除或者合并不需要的数据,由此将二维上的数据一维化,将针对多个样本分别得到的测量数据导入二维表中,对其进行主成分分析。另外,在由加拿大的PhenomenomeDiscoveriesInc.提供的作为代谢学(metabolomics)分析软件的ProfilerTM中搭载有如下功能:通过进行包括峰值提取(peakpicking)、平滑化、校正(calibration)等的数据转换处理,将利用能够进行MSn分析的LC/MS收集到的数据整理成二维表的形式。然而,如果想要进行像这样复杂的数据处理运算,则硬件的负荷加重,因此需要准备高性能的CPU、大容量的RAM,处理的吞吐量也下降。另外,当进行上述那样的数据处理运算时使用预先准备的运算参数,但有时由于该参数导致多变量分析结果产生大的差异。另外,在进行了峰值提取等的情况下,由于在该处理过程中发生原始信息的丢失,因此有时不能将样本的差异准确地反映到多变量分析结果中。由此,存在尽管进行了复杂的数据处理也不能够准确地进行样本的比较的情况。另外,在LC、GC之类的成分分离方法中,同一物质的洗脱时间易于随着测量条件(分离条件)、装置状态发生变动。即使使测量条件完全相同,当实际执行多次测量时也经常发生同一物质的洗脱时间变动这样的情况。当比较针对不同的样本的测量结果时,如果存在上述那样的洗脱时间的偏差则不能进行恰当的比较处理,因此一般进行色谱数据的时间轴调整以使同一物质的洗脱时间一致。通过使调整对象的色谱数据在时间轴方向上移动或者将时间轴放大和缩小来进行时间轴调整。当伴随这样的调整而色谱数据开头部分、末端部分发生偏移时,数据发生缺失。图9是示意性地示出该数据缺失的示意图。图9的(a)是A1、A2这两个色谱数据的开头部和末端部一致的状态,在这种情况下不存在数据缺失。图9的(b)是由于使其中一个数据移动而在开头部不存在与A1对应的A2、在末端部不存在与A2对应的A1的状态。图9的(c)是由于将其中一个数据的时间轴放大、将另一个数据的时间轴缩小而在开头部、末端部均不存在与A1对应的A2的状态。如果在发生这种数据缺失的状态下仍执行多变量分析处理等,则有可能误识别为在数据的开头部、末尾部样本间存在差异。专利文献1:日本特开2009-25056号公报非专利文献1:米久保、其他两位、《最新的飞行时间质谱仪LCTPremierTM的特征和对食品代谢的应用(最新の飛行時間型質量分析計LCTPremierTMの特徴と食品メタボロームへの応用)》、色谱法(Chromatography)、色谱法科学会、第27卷、本文档来自技高网...
分析数据处理方法以及装置

【技术保护点】
一种分析数据处理方法,用于处理针对一个样本得到的多个色谱数据或者针对多个样本分别得到的多个色谱数据,其特征在于,包括以下步骤:a)时间轴调整步骤,针对上述多个色谱数据中的作为比较分析对象的多个色谱数据调整时间轴,使得同一成分的出现时间一致;b)数据整形步骤,在完成时间轴调整的作为比较分析对象的多个色谱数据的开头部以及末尾部存在对应于同一时间的数据缺失的色谱数据的情况下,针对该作为比较分析对象的多个色谱数据删除存在数据缺失的时间范围的数据;以及c)表制作步骤,针对通过上述数据整形步骤实施了开头部以及末尾部的处理后的作为比较分析对象的多个色谱数据以如下方式制作二维表:使各色谱数据的数据值按时间顺序纵向或者横向地排列,在与该时间顺序方向正交的横向或者纵向上排列比较分析对象的色谱数据。

【技术特征摘要】
【国外来华专利技术】1.一种分析数据处理方法,用于处理针对一个样本得到的多个色谱数据或者针对多个样本分别得到的多个色谱数据,其特征在于,包括以下步骤:a)时间轴调整步骤,针对上述多个色谱数据中的作为比较分析对象的多个色谱数据调整时间轴,使得同一成分的出现时间一致;b)数据整形步骤,在完成时间轴调整的作为比较分析对象的多个色谱数据的开头部以及末尾部存在对应于同一时间的数据缺失的色谱数据的情况下,针对该作为比较分析对象的多个色谱数据删除存在数据缺失的时间范围的数据;以及c)表制作步骤,针对通过上述数据整形步骤实施了开头部以及末尾部的处理后的作为比较分析对象的多个色谱数据以如下方式制作二维表:将按各色谱数据的每个质量电荷比获得的、与时间的变化相对应的信号强度值在一维方向上排列来得到一维表,通过按质量电荷比的顺序将该一维表相连接来制作各比较分析对象的一维表,通过在其它维度方向上按各比较分析对象排列上述一维表来制作二维表。2.一种分析数据处理方法,用于处理针对一个样本得到的多个色谱数据或者针对多个样本分别得到的多个色谱数据,其特征在于,包括以下步骤:a)时间轴调整步骤,针对上述多个色谱数据中的作为比较分析对象的多个色谱数据调整时间轴,使得同一成分的出现时间一致;b)数据整形步骤,在完成时间轴调整的作为比较分析对象的多个色谱数据的开头部以及末尾部存在对应于同一时间的数据缺失的色谱数据的情况下,针对该作为比较分析对象的多个色谱数据使存在数据缺失的时间范围的数据无效;以及c)表制作步骤,针对通过上述数据整形步骤实施了开头部以及末尾部的处理后的作为比较分析对象的多个色谱数据以如下方式制作二维表:将按各色谱数据的每个质量电荷比获得的、与时间的变化相对应的信号强度值在一维方向上排列来得到一维表,通过按质量电荷比的顺序将该一维表相连接来制作各比较分析对象的一维表,通过在其它维度方向上按各比较分析对象排列上述一维表来制作二维表。3.一种分析数据处理方法,用于处理针对一个样本得到的多个色谱数据或者针对多个样本分别得到的多个色谱数据,其特征在于,包括以下步骤:a)时间轴调整步骤,针对上述多个色谱数据中的作为比较分析对象的多个色谱数据调整时间轴,使得同一成分的出现时间一致;b)数据整形步骤,在完成时间轴调整的作为比较分析对象的多个色谱数据的开头部以及末尾部存在对应于同一时间的数据缺失的色谱数据的情况下,执行以下处理:利用与数据缺失部相同的时间范围且数据没有缺失的其它色谱数据来补充上述缺失部的数据;以及c)表制作步骤,针对通过上述数据整形步骤实施了开头部以及末尾部的处理后的作为比较分析对象的多个色谱数据以如下方式制作二维表:将按各色谱数据的每个质量电荷比获得的、与时间的变化相对应的信号强度值在一维方向上排列来得到一维表,通过按质量电荷比的顺序将该一维表相连接来制作各比较分析对象的一维表,通过在其它维度方向上按各比较分析对象排列上述一维表来制作二维表。4.根据权利要求1至3中的任一项所述的分析数据处理方法,其特征在于,该分析数据处理方法用于处理使用分析装置收集到的针对多个样本的色谱数据,该分析装置具备色谱分离单元和检测器,其中,该色谱分离单元将样本中含有的多个成分在时间方向上进行分离,该检测器针对被该色谱分离单元在时间方向上进行了成分分离的样本分别获取除时间以外的其它参数的维度方向的信号强度,在该数据处理方法中,针对不同的样本,将质量电荷比下的色谱数据作为比较分析对象实...

【专利技术属性】
技术研发人员:山口真一
申请(专利权)人:株式会社岛津制作所
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1