用于确定样品中存在的组分的光谱装置和方法制造方法及图纸

技术编号:33102468 阅读:35 留言:0更新日期:2022-04-16 23:43
一种根据从样品获得的光谱数据确定样品中存在的组分的方法,该方法包括:解析该光谱数据的多个模型中的每一个,该多个模型包括具有从预定的组分参考光谱集中选择的不同数量的组分参考光谱的模型;基于模型选择标准选择该多个模型之一,并基于所选择的模型确定该样品中存在的一个或多个组分。该模型选择标准包括每个模型的度量,该度量平衡该模型对该光谱数据的拟合质量上的改善与根据该模型中使用的组分参考光谱的数量确定的复杂性惩罚。的组分参考光谱的数量确定的复杂性惩罚。的组分参考光谱的数量确定的复杂性惩罚。

【技术实现步骤摘要】
【国外来华专利技术】用于确定样品中存在的组分的光谱装置和方法


[0001]本专利技术涉及用于确定样品中存在的组分的光谱装置和方法。本专利技术在拉曼光谱法中尤其有用,尽管本专利技术也可以用于其他形式的光谱法,例如,使用窄线光致发光、荧光、阴极发光、UV可见光(UV Vis)、核磁共振(NMR)、中红外光(mid

IR)或近红外光(NIR)。

技术介绍

[0002]拉曼效应是样品对光的非弹性散射。在拉曼光谱法中,样品被单色激光照射,并且之后散射光被例如单色仪中的色散设备(诸如衍射光栅)色散成拉曼光谱,以生成被称为拉曼光谱的光谱。拉曼光谱由诸如电荷耦合器件(CCD)等检测器检测。拉曼光谱装置的示例从美国专利号5,442,438和5,510,894中得知,这些美国专利通过引用并入本文。
[0003]不同的化合物具有不同特性的拉曼光谱。因此,拉曼效应可以用于分析存在的化合物。
[0004]一种这样的用于分析拉曼光谱的技术是经典最小二乘法(CLS)。该标准技术根据I个已知组分参考光谱的集L来分析未知样品的光谱数据S,这两者各自具有N
p
个数据点(两者可能都经过预处理)。通过最小化来自重建模型的光谱数据的平方偏差之和来确定每个组分参考光谱的组分浓度a
i

[0005][0006]其中,n表示光谱频率索引。这产生了一系列线性方程,直接通过矩阵求逆来求解这些方程,以便获得组分浓度a
i

[0007]CLS通常会产生这样的解,其中所有组分的计算浓度都为非零,即使对于那些不存在于样品中的组分也如此,即,过拟合。通常,这是由于光谱数据中存在的噪声以及参考光谱与数据之间的差异造成的,而这些情况可能例如是由于例如样品环境条件或光谱仪性能的漂移导致的。当样品中的所有组分都以高浓度存在时,只需比较计算出的组分浓度即可很容易地区分存在的组分与不存在的组分。然而,当某些组分以痕量存在时,区分真正存在的组分与那些由于噪声等而具有低a
i
值的组分就变得困难。
[0008]WO 2012/156667描述了一种根据从样品获得的光谱数据确定样品中存在的组分的方法。该方法包括分别针对来自预定的组分参考光谱集的候选组分参考光谱来解析光谱数据的模型,以及基于拟合优度的度量来确定样品中是否存在组分。
[0009]这种方法的问题在于,将另外的组分光谱添加到模型中的截止指标是试探性的,因此仍可能导致模型对光谱数据的过拟合、或者欠拟合(可能性较小)。

技术实现思路

[0010]根据本专利技术的第一方面,提供了一种根据从样品获得的光谱数据确定样品中存在的组分的方法。该方法可以包括解析该光谱数据的多个模型中的每一个,该多个模型包括
具有从预定的组分参考光谱集中选择的不同数量的组分参考光谱的模型;基于模型选择标准选择该多个模型之一,并基于所选择的模型确定该样品中存在的一个或多个组分。该模型选择标准可以包括每个模型的(数值)度量,该度量平衡模型对光谱数据的拟合质量(该拟合质量诸如使用似然函数来测量)上的改善与根据模型中使用的组分参考光谱的数量确定的复杂性惩罚。模型选择标准可以是贝叶斯信息标准(BIC)或赤池信息标准(AIC)。模型选择标准可以包括选择多个模型中的具有度量极值(例如,在BIC或AIC的情况下,具有最小值)的一个模型。
[0011]以此方式,避免了由于模型对光谱数据的过拟合而导致标识出样品中额外的组分,或由于模型对光谱数据的欠拟合而导致将样品中的组分排除在外。
[0012]解析每个模型可以包括组分光谱对光谱数据的最小二乘拟合,诸如具有等式(1)或(2)所描述的形式的模型。该模型可以包括用于对支撑样品的空白和/或背景辐射进行建模的附加项。背景辐射可以使用多项式,特别是样条来建模,如WO 2012/150434、WO 2014/064447和未公布的申请GB 1817028.2中所述的,这些专利通过引用并入本文。
[0013]该多个模型可以包括第一模型集,每个第一模型具有从该预定的组分参考光谱集中选择的第一数量的组分参考光谱,但是这些组分参考光谱的组合不同。该方法可以包括根据品质因数(诸如该模型选择标准或另一模型选择标准)确定最佳第一模型。该另一模型选择标准可以包括每个模型的(数值)度量,该度量平衡模型对光谱数据的拟合质量(该拟合质量诸如使用似然函数来测量)上的改善与根据模型中使用的组分参考光谱的数量确定的复杂性惩罚。该另一模型选择标准可以是贝叶斯信息标准(BIC)或赤池信息标准(AIC)。
[0014]该多个模型可以包括第二模型集,每个第二模型具有从该预定的组分参考光谱集中选择的第二数量(不同于第一数量)的组分参考光谱,但是这些组分参考光谱的组合不同。该方法可以包括根据品质因数确定最佳第二模型。该方法可以包括基于模型选择标准在最佳第一模型与最佳第二模型之间进行选择。
[0015]该方法可以包括:使用当前的组分参考光谱集来解析当前模型,基于该模型选择标准确定当前模型的当前度量,解析多个另外的模型,其中,每个另外的模型使用另一组分参考光谱集,该另一组分参考光谱集包括移除了这些组分参考光谱中的不同组分参考光谱或添加了预定的组分参考光谱中的不同剩余组分参考光谱的当前的组分参考光谱集,基于该模型选择标准确定这些另外的模型中的每个模型的另外的度量,以及将这些另外的度量与当前度量进行比较,并且如果最佳另外的模型的另外的度量优于当前度量,则选择那个最佳另外的模型作为(新的)当前模型。可以(例如在迭代过程中)重复该方法,直到没有任何另外的度量优于当前度量为止。在每次迭代中逐渐移除组分参考光谱的情况下,第一次迭代时的当前的组分参考光谱集可以是所有预定的组分参考光谱或者使用搜索算法找到的组分参考光谱集。在每次迭代中逐渐添加组分参考光谱的情况下,第一次迭代时的当前的组分参考光谱集可以是空集。
[0016]该搜索算法可以包括:分别针对来自预定的组分参考光谱集中的候选组分参考光谱解析光谱数据的模型,以及基于品质因数选择这些候选组分参考光谱中的要包括在当前的组分参考光谱集中以进行初始迭代的候选组分参考光谱。品质因数可以是拟合优度的度量、模型选择标准(诸如贝叶斯信息标准(BIC)或赤池信息标准(AIC))、或例如使用去摆动方法来最小化已解析模型与光谱数据之间的连续残差之间的差异的度量。
[0017]该方法可以包括对样品执行光谱分析(诸如拉曼光谱法)以获得光谱数据。该方法可以包括基于在所选择的模型(在该方法被迭代地应用的情况下,基于最后一次迭代中的所选择的模型)中使用的组分参考光谱来标识样品中存在的一个或多个组分。该方法可以包括基于被标识为存在于样品中的组分来控制过程和/或执行对样品的后续处理。例如,该过程可以是制造过程。该样品可以是一个或多个所制造的产品的样品,并且一个或多个所标识的组分可以用于确定所制造的产品是否满足所要求的规格。如果未满足所要求的规格,则可能需要调整过程,使得按照所要求的规格来制造产品。该样品可以是组织样品并且该过程可以是对提供该本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种根据从样品获得的光谱数据确定样品中存在的组分的方法,所述方法包括:解析所述光谱数据的多个模型中的每一个,所述多个模型包括具有从预定的组分参考光谱集中选择的不同数量的组分参考光谱的模型;基于模型选择标准来选择所述多个模型之一,并基于所选择的模型确定所述样品中存在的一个或多个组分,其中,所述模型选择标准包括每个模型的度量,所述度量平衡所述模型对所述光谱数据的拟合质量上的改善与根据所述模型中使用的组分参考光谱的数量确定的复杂性惩罚。2.根据权利要求1所述的方法,其中,所述模型选择标准是贝叶斯信息标准(BIC)。3.根据权利要求1或权利要求2所述的方法,其中,所述模型选择标准包括选择所述多个模型中的具有所述度量的极值的一个模型。4.根据前述权利要求中任一项所述的方法,其中,解析每个模型包括所述组分光谱对所述光谱数据的最小二乘拟合。5.根据前述权利要求中任一项所述的方法,其中,所述多个模型包括第一模型集和第二模型集,每个第一模型具有从所述预定的组分参考光谱集中选择的第一数量的组分参考光谱,但是该组分参考光谱的组合不同,每个第二模型具有从所述预定的组分参考光谱集中选择的第二数量的组分参考光谱,但是该组分参考光谱的组合不同,所述方法包括根据品质因数确定最佳第一模型和最佳第二模型,并基于所述模型选择标准在所述最佳第一模型与所述最佳第二模型之间进行选择。6.根据前述权利要求中任一项所述的方法,包括:使用当前的组分参考光谱集来解析当前模型,基于所述模型选择标准来确定所述当前模型的当前度量,解...

【专利技术属性】
技术研发人员:伊恩
申请(专利权)人:瑞尼斯豪公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1