【技术实现步骤摘要】
【国外来华专利技术】通过向量比较来识别感兴趣的样本的方法、介质和系统
[0001]相关申请的交叉引用
[0002]本申请要求于2020年10月13日提交的美国临时专利申请63/091,069号的权益。该申请的全部公开内容据此以引用方式并入本文。
技术介绍
[0003]质谱(MS)设备和液相色谱
‑
质谱(LCMS)设备用于分析化学样本以研究该样本的特性、质量或结构。还存在用于样本分析的其他类型的装置,包括红外光谱仪和气体光谱仪。尽管IS装置和GS装置可能能够提供比MS装置更详细的信息,但它们也往往更复杂、更昂贵并且难以操作。因此,它们可能需要显著更多的时间来精确地分析样本。
技术实现思路
[0004]示例性实施方案提供了用于将感兴趣的样本与已知化合物的库进行比较以快速确定样本与库中的化合物的相似程度的方法、介质和系统。
[0005]根据第一实施方案,系统在质谱(MS)装置处接收感兴趣的样本用于分析。可以使用该MS装置分析感兴趣的样本,其中分析涉及生成该感兴趣的样本的多个光谱。可将该多个光谱分解成分箱(例如,基于光谱强度值)。
[0006]系统可以访问样本库,该样本库包括已知化合物的离子化信息。对于该样本库中的每种已知化合物,可以检索该化合物的多个关键峰值。可以将相应化合物的关键峰值与来自感兴趣的样本的一组光谱分箱进行比较。这可涉及将相应化合物的关键峰值和该组光谱分箱表示为向量,计算与该向量之间的角度差相对应的相似度值,以及将该相似度值与相似度阈值进行比较。
[0007]在一些实施方案中,光谱 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种方法,包括:在质谱(MS)装置处接收感兴趣的样本用于分析;分析所述感兴趣的样本,所述分析包括生成所述感兴趣的样本的多个光谱;将所述多个光谱分解成分箱;访问样本库,所述样本库包括已知化合物的离子化信息;对于所述样本库中的每种已知化合物,检索所述化合物的多个关键峰值;将相应化合物的所述关键峰值与来自所述感兴趣的样本的一组分箱进行比较,所述比较包括:将所述相应化合物的所述关键峰值和所述一组分箱表示为向量,计算与所述向量之间的角度差相对应的相似度值,以及将所述相似度值与相似度阈值进行比较;当所述相似度值超过所述相似度阈值时,识别出所述感兴趣的样本与所述相应化合物相似;以及响应于所述识别,输出所述感兴趣的样本与所述相应化合物相似的指示。2.根据权利要求1所述的方法,其中将所述多个光谱分解成分箱包括识别所述多个光谱中的峰值并且生成对应于所述峰值的分箱。3.根据权利要求1所述的方法,其中所述多个光谱由四个光谱组成。4.根据权利要求1所述的方法,还包括接收用户定义的分箱数量作为输入以供与所述关键峰值比较。5.根据权利要求1所述的方法,还包括接收用户定义的值作为输入以用于所述相似度阈值。6.根据权利要求1所述的方法,其中所述向量之间的所述角度差被表示为余弦相似度值。7.根据权利要求1所述的方法,还包括基于与每个分箱相关联的光谱强度值或质量中的一者或多者对所述分箱进行加权。8.根据权利要求7所述的方法,还包括接收用户定义的分箱权重作为输入。9.根据权利要求1所述的方法,还包括对来自所述多个光谱中的一个光谱的分箱比对来自所述多个光谱中的其他光谱的分箱更高地加权。10.根据权利要求1所述的方法,还包括:针对所述分箱中的每个分箱,计算所述分箱的强度与具有最高强度值的分箱的强度之间的比率;以及从分析中滤除比率低于强度比率阈值的分箱。11.根据权利要求10所述的方法,还包括接收用户定义的值作为输入以用于所述强度比率阈值。12.一种非暂态计算机可读存储介质,所述计算机可读存储介质包括指令,所述指令在被计算机执行时使得所述计算机执行下述操作:在质谱(MS)装置处接收感兴趣的样本用于分析;分析所述感兴趣的样本,所述分析包括生成所述感兴趣的样本的多个光谱;将所述多个光谱分解成分箱;
访问样本库,所述样本库包括已知化合物的离子化信息;对于所述样本库中的每种已知化合物,检索所述化合物的多个关键峰值;将所述相应化合物的所述关键峰值与来自所述感兴趣的样本的一组分箱进行比较,所述比较包括:将所述相应化合物的所述关键峰值和所述一组分箱表示为向量,计算与所述向量之间的角度差相对应的相似度值,以及将所述相似度值与相似度阈值进行比较;当所述相似度值超过所述相似度阈值时,识别出所述感兴趣的样本与所述相应化合物相似;以及响应于所述识别,输出所述感兴趣的样本与所述相应化合物相似的指示。13.根据权利要求12所述的计算机可读存储介质,其中将所述多个光谱分解成分箱包括指令,所述指令将所述计算机配置为识别所述多个光谱中的峰值并且生成对应于所述峰值的分箱。14.根据权利要求12所述的计算机可读存储介质,其中所述多个光谱由四个光谱组成。15.根据权利要求12所述的计算机可读存储介质,其中所述指令将所述计算机进一步配置为接收用户定义的分箱数量作为输入以供与所述关键峰值比较。16.根据权利要求12所述的计算机可读存储介质,其中所述指令将所述计算机进一步配置为接收用户定义的值作为输入以用于所述相似度阈值。17.根据权利要...
【专利技术属性】
技术研发人员:N,
申请(专利权)人:沃特世科技爱尔兰有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。