用于化学分析的光谱数据处理制造技术

技术编号:38626723 阅读:27 留言:0更新日期:2023-08-31 18:27
一种用于操作光谱数据处理系统的方法。所述方法包括接收与至少部分地使用机器学习处理模型处理化学样品的光谱数据相关联的用户输入。所述机器学习处理模型被布置在所述光谱数据处理系统的机器学习控制器中。所述方法还包括基于所述接收到的用户输入来训练所述机器学习处理模型。器学习处理模型。器学习处理模型。

【技术实现步骤摘要】
【国外来华专利技术】用于化学分析的光谱数据处理


[0001]本专利技术涉及用于化学分析的光谱数据的处理。所述处理至少部分地基于(多种)基于机器学习的方法。

技术介绍

[0002]化学分析涉及对化学样品中的物质的化学成分和结构进行分析,并且它可能涉及使用化学分析设备进行定性分析和/或定量分析。
[0003]气相色谱

质谱仪是已知的化学分析设备。它将气相色谱仪和质谱仪相结合,并且用于鉴定针对不同应用(药物测试、食品安全相关测试、环境相关测试等)获得的化学样品中的不同物质。
[0004]当前可用的气相色谱

质谱仪通常与分析器(例如,计算系统)连接,所述分析器被布置成分析由气相色谱

质谱仪生成的光谱信号。分析器可以运行软件包或应用程序,诸如现有的AMDIS

NIST软件,其使得用户能够分析、查看、调整或编辑光谱数据,以用于对样品执行定性和/或定量分析。在该过程中,输出的质量、定性和/或定量分析结果在很大程度上取决于用户在解释或以其他方式处理数据方面的专业知识和经验。而且,由于实验是独立执行的,因此习惯做法或偏好是独立处理相关联的数据处理。

技术实现思路

[0005]在第一方面,提供了一种用于操作光谱数据处理系统的方法。所述方法包括:接收与至少部分地使用机器学习处理模型处理化学样品的光谱数据相关联的用户输入;以及存储所述用户输入,以用于基于所述接收到的用户输入来训练所述机器学习处理模型。所述机器学习处理模型被布置在所述光谱数据处理系统的机器学习控制器中。对所述光谱数据的处理可以完全基于所述机器学习处理模型,或者可替代地,部分地基于所述机器学习处理模型并且部分地基于以下中的一个或多个:其它机器学习处理模型或非机器学习处理。所述机器学习控制器可以由一个或多个处理器形成,可选地具有一个或多个存储器或存储设备。所述方法是一种计算机实现的方法。所述机器学习处理模型可以被充分地预训练以适合于特定任务(例如,所述模型可以为该特定任务提供一定的准确性)。或者,所述机器学习处理模型可以是用于基线回测的未经训练的或训练不足的模型。非机器学习处理可以包括对光谱数据的各种信号处理,诸如滤波、分割、阈值化、求平均、平滑化、填充、变换、缩放等。
[0006]在一个实施方案中,所述方法进一步包括基于所述接收到的用户输入来训练所述机器学习处理模型。在一个例子中,所述接收到的用户输入被直接用于训练所述机器学习处理模型。在另一个例子中,与所述接收到的用户输入相关联的数据用于训练所述机器学习处理模型。
[0007]在一个实施方案中,所述方法进一步包括:在接收所述用户输入之前:至少部分地使用所述机器学习处理模型来处理所述光谱数据以提供处理结果。所述处理可以包括使用
所述机器学习处理模型执行以下中的一个或多个或全部:光谱信号分割;光谱峰值检测;光谱峰值去卷积;以及化学组分相关信息确定。可以基于所述光谱信号分割、光谱峰值检测和/或光谱峰值去卷积来执行所述化学组分相关信息确定。所述化学组分相关信息确定可以确定所述化学样品中的仅一种、仅一些或所有化学组分。在一个例子中,基于所述机器学习处理模型来执行所有四个示例性操作。在一个例子中,基于所述机器学习处理模型来执行这些示例性操作中的仅一个或仅一些。所述化学组分相关信息确定可以包括以下中的一个或多个:化学组分类别鉴定;化学组分类型鉴定;化学组分鉴定;以及化学组分浓度确定。
[0008]在一个实施方案中,所述方法进一步包括:在接收所述用户输入之前:提供对所述光谱数据的处理的处理结果。在一个例子中,所述处理结果可以被提供给输出设备,诸如显示器,以呈现给用户。在一个实施方案中,提供所述处理结果包括提供以下中的至少一个:所述光谱数据的至少一部分的图形表示;以及与所述化学样品中包含的至少一种(一种或一些或所有)化学组分相关联的信息。所述图形表示可以是绘图、光谱、表格、热图等的形式。与所述化学组分相关联的信息可以包括所述至少一种化学组分的身份和/或所述至少一种化学组分中的每一种组分的浓度。
[0009]在一个实施方案中,所述方法进一步包括:在所述处理之前:从多个机器学习处理模型中选择所述机器学习处理模型。所述多个机器学习处理模型可以全部布置在所述机器学习控制器中。所述多个机器学习处理模型中的相应一个中的每个可以与相应类型或类别的化学样品、相应的化学分析系统、相应的地理位置、相应的用户(公司、个人等)相关联,并且所述选择可以是基于这些特性。
[0010]在一个实施方案中,所述用户输入表示对所述处理结果的正反馈。在一个例子中,基于所述接收到的用户输入(表示正反馈)对所述机器学习处理模型的训练包括基于所述光谱数据和所述处理结果对所述机器学习处理模型进行训练。在一个例子中,与所述接收到的用户输入(表示正反馈)相关联的数据被保留、加权或以其他方式用于所述机器学习处理模型的后续训练中。以这种方式,可以通过学习如用户所指示的正确的内容来增强所述机器学习处理模型。
[0011]在一个实施方案中,所述用户输入表示对所述处理结果的负反馈。在一个例子中,所述用户输入与对所述光谱数据的调整和/或对所述处理结果的调整相关联。例如,所述用户输入可以包括以下中的一个或多个:调整后的峰值开始时间;调整后的峰值结束时间;调整后的峰值基线;调整后的背景去除;调整后的保留时间;所述化学样品中化学组分的调整后的身份;以及所述化学样品中化学组分的调整后的浓度。在所述用户输入与对所述光谱数据的调整相关联的一个例子中,所述方法进一步包括至少部分地使用所述机器学习处理模型来处理所述调整后的光谱数据以确定更新的处理结果。基于所述接收到的用户输入(表示负反馈)来训练所述机器学习处理模型可以包括:基于所述调整后的光谱数据和所述更新的处理结果来训练所述机器学习处理模型;基于所述光谱数据(例如,如果没有调整的话)和所述调整后的身份或浓度来训练所述机器学习处理模型。以这种方式,可以通过学习最初是不正确的并且随后由用户调整为正确的内容来改进所述机器学习处理模型。
[0012]在一个实施方案中,所述机器学习处理模型包括人工神经网络,诸如深度神经网络。可以使用其他基于机器学习的模型、递归模型或非递归模型。这些可以包括例如递归神经网络、长短期记忆模型、马尔可夫过程、强化学习、门控递归单元模型、深度神经网络、卷
积神经网络(例如,Unet)、支持向量机、主成分分析、逻辑回归、决策树/森林,集成方法(组合模型)、回归(贝叶斯/多项式/回归)、随机梯度下降、线性判别分析、最近邻分类或回归、朴素贝叶斯,仅举几例。
[0013]在一个实施方案中,所述方法进一步包括:在所述处理之前:确定所述光谱数据的格式,并且如果确定所述光谱数据的格式是专有格式,则将所述光谱数据的格式从所述专有格式转换为开放格式。确定所述光谱数据的格式可以包括确定所述光谱数据的格式是否为可识别的。可以预先确定可接受的或可识别的专有格式。
[0014]在一个实施方案中,所述方法进一步包括:接收一个或多个另外的用本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于操作光谱数据处理系统的方法,所述方法包括:接收与至少部分地使用机器学习处理模型处理化学样品的光谱数据相关联的用户输入,所述机器学习处理模型被布置在所述光谱数据处理系统的机器学习控制器中;以及存储所述接收到的用户输入,以用于基于所述接收到的用户输入来训练所述机器学习处理模型。2.根据权利要求1所述的方法,其进一步包括:基于所述接收到的用户输入来训练所述机器学习处理模型。3.根据权利要求1或2所述的方法,其进一步包括:在接收所述用户输入之前:至少部分地使用所述机器学习处理模型来处理所述光谱数据以提供处理结果,其中,所述处理包括使用所述机器学习处理模型来执行以下中的一个或多个:光谱信号分割;光谱峰值检测;光谱峰值去卷积;以及化学组分相关信息确定。4.根据权利要求3所述的方法,其中,基于所述光谱信号分割、所述光谱峰值检测和/或所述光谱峰值去卷积来执行所述化学组分相关信息确定。5.根据权利要求3或4所述的方法,其中,所述化学组分相关信息确定包括以下中的一个或多个:化学组分类别鉴定;化学组分类型鉴定;化学组分鉴定;以及化学组分浓度确定。6.根据权利要求1至5中任一项所述的方法,其进一步包括:在接收所述用户输入之前:提供对所述光谱数据的处理的处理结果,其中,提供所述处理结果包括提供以下中的至少一个:所述光谱数据的至少一部分的图形表示;以及与所述化学样品中包含的至少一种化学组分相关联的信息。7.根据权利要求6所述的方法,其中,与所述至少一种化学组分相关联的信息包括:所述至少一种化学组分的身份和/或所述至少一种化学组分中的每一种组分的浓度。8.根据权利要求3至7中任一项所述的方法,其进一步包括:在所述处理之前:从布置在所述机器学习控制器中的多个机器学习处理模型中选择所述机器学习处理模型,其中,所述多个机器学习处理模型中的每个相应的机器学习处理模型与相应类型或类别的化学样品相关联,并且所述选择是基于所述化学样品的类型或类别。9.根据权利要求3至8中任一项所述的方法,其中,所述用户输入表示对所述处理结果的正反馈。10.根据权利要求9所述的方法,其进一步包括基于所述接收到的用户输入来训练所述机器学习处理模型,所述训练包括:基于所述光谱数据和所述处理结果来训练所述机器学习处理模型。
11.根据权利要求3至10中任一项所述的方法,其中,所述用户输入表示对所述处理结果的负反馈。12.根据权利要求11所述的方法,其中,所述用户输入与对所述光谱数据的调整和/或对所述处理结果的调整相关联,其中,所述用户输入包括以下中的一个或多个:调整后的峰值开始时间;调整后的峰值结束时间;调整后的峰值基线;调整后的背景去除;调整后的保留时间;所述化学样品中的化学组分的调整后的身份;以及所述化学样品中的化学组分的调整后的浓度。13.根据权利要求11所述的方法,其中,所述用户输入与对所述光谱数据的调整相关联,并且所述方法进一步包括:至少部分地使用所述机器学习处理模型来处理所述调整后的光谱数据,以确定更新的处理结果;并且其中,所述基于所述接收到的用户输入来训练所述机器学习处理模型包括:基于调整后的光谱数据和更新后的处理结果来训练所述机器学习处理模型。14.根据权利要求1至13中任一项所述的方法,其中,所述机器学习处理模型包括人工神经网络。15.根据权利要求3至14中任一项所述的方法,其进一步包括:在所述处理之前:确定所述光谱数据的格式;以及如果确定所述光谱数据的格式是专有格式,则将所述光谱数据的格式从所述专有格式转换为开放格式。16.根据权利要求1至15中任一项所述的方法,其进一步包括:接收一个或多个另外的用户输入,每个用户输入与使用所述机器学习处理模型对相应化学样品的相应光谱数据的相应处理相关联;存储所述一个或多个接收到的另外的用户输入,以用于基于所述一个或多个接收到的另外的用户输入来训练所述机器学习处理模型;基于所述一个或多个接收到的另外的用户输入来训练所述机器学习处理模型;其中,训练所述机器学习处理模型包括:周期性地训练所述机器学习处理模型;或者在已经接收到预定数量的用户输入之后,训练所述机器学习处理模型。17.根据权利要求1至16中任一项所述的方法,其中,所述光谱数据是色谱图或质谱的数据,并且其中,所述光谱数据处理系统与化学分析系统相关联。18.根据权利要求17所述的方法,其中,所述化学分析系统包括气相色谱仪或液相色谱仪,并且所述光谱数据包括化学样品的色谱图的数据;或者其中,所...

【专利技术属性】
技术研发人员:T
申请(专利权)人:安捷伦科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1