一种基于液质联用仪和AI算法的生物分析中消除基质效应的方法技术

技术编号:28296168 阅读:17 留言:0更新日期:2021-04-30 16:20
本发明专利技术公开了一种基于液质联用仪和AI算法的生物分析中消除基质效应的方法,包括以下步骤:S1、建立多种生物样品的基质效应值数据库;S2、构建神经网络模型;S3、接收训练数据和测试数据;S4、训练神经网络模型;S5、确定经训练的神经网络模型的针对测试数据的损失函数;S6、调整初始正则化参数;S7、再训练神经网络模型;S8、提取待测生物样品中的特征数据;S9、特征数据进行比对;S10、获得基质效应值,分析结果进行修正。本发明专利技术可最大限度地消除基质效应,对生物分析结果进行修正,避免了不同样品基质引起的偏差,保证了结果的准确性,同时降低了检测成本,降低了检测时间,提高了检测效率,更为简单快捷,节约人力和物质成本。

【技术实现步骤摘要】
一种基于液质联用仪和AI算法的生物分析中消除基质效应的方法
本专利技术涉及液质联用仪生物分析
,具体为一种基于液质联用仪和AI算法的生物分析中消除基质效应的方法。
技术介绍
基质是指样品中除被分析物以外的一切组分,这些组分能明显降低或增强目标离子的生成速率与离子强度,从而严重影响检测结果的准确性。这种离子抑制或离子增强的效应便称为基质效应。液相色谱-串联质谱(LC-MS/MS)联用检测技术中,与目标物共流出的干扰物在离子源离子化时影响了分析物,从而产生了基质效应。主要包括:1.由于离子化时,带电液滴的表面大小和额外电量的数量(10-5mol/L)都是有限的,所以干扰物会与目标物竞争这有限的表面和电量导致目标物离子化不完全;(2)干扰物的存在会改变分析物粘度、表面张力等物化性质而影响目标物的离子化;(3)基质中一些非挥发性物质会与目标化合物形成络合物或沉积物导致无法成功生成气态离子。基质效应按照影响效果可分为三类:ME<0,意味基质的存在抑制了分析物的响应值;ME=0,表明基质的存在对该分析物的响应值无影响;ME>0,意味着基质的存在增强了分析物的响应。基质效应按绝对值大小可以分为三个等级:∣ME∣≥50%,称为强基质效应;20%≤∣ME∣<50%,称为中等强度基质效应;0%≤∣ME∣<20%,称为弱基质效应。近几年,基质效应的消除和弥补方法得到广泛的研究,,通常以空白基质配制标准曲线,以消除基质效应的影响。但由于不同样品的基质效应各不相同,有的甚至呈相反的作用。在实际操作中,不可能针对每一个样品都以相应的基质配制一条标准曲线进行校准。
技术实现思路
本专利技术的目的在于提供一种基于液质联用仪和AI算法的生物分析中消除基质效应的方法,可最大限度地消除基质效应,对生物分析结果进行修正,避免了不同样品基质引起的偏差,保证了结果的准确性,同时降低了检测成本,降低了检测时间,提高了检测效率,更为简单快捷,节约人力和物质成本,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种基于液质联用仪和AI算法的生物分析中消除基质效应的方法,包括以下步骤:S1、取多种生物样品,按规定方法进行提取、净化、浓缩后,以特定纯溶剂复溶,再取不同基质条件、不同浓度、不同进样体积这三个变量变化下的仪器响应值,采用小体积进样,并计算得到各个条件下的多种生物样品的基质效应值,建立多种生物样品的基质效应值数据库,将不同生物样品的基质效应值分类存储;S2、将不同生物样品的基质效应值作为输入,其中一个特定进样体积的基质效应值作为输出,构建神经网络模型;S3、通过神经网络模型接收第一组生物样品注释图像的训练数据,同时接收第二组生物样品注释图像的测试数据;S4、使用训练数据基于初始正则化参数来训练神经网络模型;S5、迭代地执行以下步骤:使用测试数据来测试经训练的神经网络模型,以确定经训练的神经网络模型的针对测试数据的损失函数;S6、基于神经网络模型的针对训练数据的损失函数和神经网络模型的损失函数来调整初始正则化参数;S7、使用训练数据基于经调整的正则化参数来再训练神经网络模型;其中,所述迭代的步骤被执行直至确定针对训练数据的损失函数和针对测试数据的损失函数都已经收敛到稳定状态;S8、将待测生物样品同样分别进样进行液相串联质谱检测,提取待测生物样品中的特征数据;S9、将待测生物样品中的特征数据与多种生物样品的基质效应值数据库中的每一个生物样品的特征数据进行比对,分析待测生物样品的特征数据与多种生物样品的基质效应值数据库中的特征数据的相似性;S10、将待测生物样品的特征数据匹配到多种生物样品的基质效应值数据库中的特征数据,通过神经网络模型获得基质效应值,最后通过生物样品的基质效应值对分析结果进行修正。优选的,所述S1中采用小体积进样时当样品为弱基质效应生物样品时,进样体积小于5μL,当样品为中等强度基质效应生物样品时,进样体积小于等于2μL,当样品为强基质效应生物样品时,先通过一定程度的基质稀释,再采用小体积进样。优选的,所述S1中仪器中质谱的扫描模式为多反应监测扫描模式;离子模式为电喷雾正离子源ESI+;质谱的参数如下:池加速电压为4V,驻留时间为20ms;干燥气温度为325℃;干燥气流速为8L/min;雾化器压力为35psi;鞘气温度为375℃;鞘气流速为11L/min;毛细管电压为4000V;光电倍增管电压为300V;液相色谱柱为50mm×2.1mm,1.8μm粒径,流速为0.3mL/min,运行时间为8min,柱温为35℃;液相色谱流动相A为纯水,流动相B为甲醇;梯度洗脱程序为,起始时间,流动相A:B的体积比为90:10,维持0.2min;在0.2-5min内,体积比由90:10线性变化至10:90,并维持该体积至6min,6.1min时,体积比迅速变回起始体积比90:10。优选的,所述生物样品的提取和净化的方法为:将生物样品放至离心管中加入提取剂,再在匀浆机上匀质后加入NaCl和无水MgSO4,然后震荡离心,取上层清液干燥后加入流动相A和B的混合液溶解,最后将溶液过尼龙膜后进样。优选的,所述正则化参数包括以下中的至少一项:与所述神经网络模型中的神经元相关的dropout参数或与所述神经网络模型中的神经元之间的连接相关的dropconnect参数。优选的,所述S7中当神经网络模型的损失函数在随后的迭代之间改变小于限定量时,所述神经网络模型的针对训练数据的损失函数被认为已经收敛到稳定状态。优选的,所述S7中再训练神经网络模型包括基于前次迭代期间的神经网络模型的一个或多个层中的神经元的权重来设置神经元的权重。优选的,所述S8中提取待测生物样品中的特征数据的具体方法包括:S81、对待测生物样品进行检测跟踪,得到待测生物样品中精确特征点;S82、根据精确特征点,插值获得其他选取的生物样品特征点;S83、计算得到特征点i的Gabor特征将所有特征点的Gabor特征组成一个特征数据集,如下:其中,N为选取的特征点个数。优选的,所述S9的具体方法包括:S91、选取多种生物样品的基质效应值数据库中的一个基质效应值k的特征模板库,如下:S92、从特征模板库中选取特征模板,如下:其中,M为生物样品的特征模板个数,i为生物样品特征;计算待测生物样品的特征与之间的相似度Skji;S93、计算待测生物样品与特征模板的相似度,公式如下:其中,N为选取的待测生物样品的特征点个数;S94、计算待测生物样品与其中一个生物样品的基质效应值k的相似度为S95、重复步骤S91-S94,获得待测生物样品与多种生物样品的基质效应值数据库中所有K个生物样品的相似度,取其中最大者得到其对应的基质效应值k′。...

【技术保护点】
1.一种基于液质联用仪和AI算法的生物分析中消除基质效应的方法,其特征在于,包括以下步骤:/nS1、取多种生物样品,按规定方法进行提取、净化、浓缩后,以特定纯溶剂复溶,再取不同基质条件、不同浓度、不同进样体积这三个变量变化下的仪器响应值,采用小体积进样,并计算得到各个条件下的多种生物样品的基质效应值,建立多种生物样品的基质效应值数据库,将不同生物样品的基质效应值分类存储;/nS2、将不同生物样品的基质效应值作为输入,其中一个特定进样体积的基质效应值作为输出,构建神经网络模型;/nS3、通过神经网络模型接收第一组生物样品注释图像的训练数据,同时接收第二组生物样品注释图像的测试数据;/nS4、使用训练数据基于初始正则化参数来训练神经网络模型;/nS5、迭代地执行以下步骤:/n使用测试数据来测试经训练的神经网络模型,以确定经训练的神经网络模型的针对测试数据的损失函数;/nS6、基于神经网络模型的针对训练数据的损失函数和神经网络模型的损失函数来调整初始正则化参数;/nS7、使用训练数据基于经调整的正则化参数来再训练神经网络模型;/n其中,所述迭代的步骤被执行直至确定针对训练数据的损失函数和针对测试数据的损失函数都已经收敛到稳定状态;/nS8、将待测生物样品同样分别进样进行液相串联质谱检测,提取待测生物样品中的特征数据;/nS9、将待测生物样品中的特征数据与多种生物样品的基质效应值数据库中的每一个生物样品的特征数据进行比对,分析待测生物样品的特征数据与多种生物样品的基质效应值数据库中的特征数据的相似性;/nS10、将待测生物样品的特征数据匹配到多种生物样品的基质效应值数据库中的特征数据,通过神经网络模型获得基质效应值,最后通过生物样品的基质效应值对分析结果进行修正。/n...

【技术特征摘要】
1.一种基于液质联用仪和AI算法的生物分析中消除基质效应的方法,其特征在于,包括以下步骤:
S1、取多种生物样品,按规定方法进行提取、净化、浓缩后,以特定纯溶剂复溶,再取不同基质条件、不同浓度、不同进样体积这三个变量变化下的仪器响应值,采用小体积进样,并计算得到各个条件下的多种生物样品的基质效应值,建立多种生物样品的基质效应值数据库,将不同生物样品的基质效应值分类存储;
S2、将不同生物样品的基质效应值作为输入,其中一个特定进样体积的基质效应值作为输出,构建神经网络模型;
S3、通过神经网络模型接收第一组生物样品注释图像的训练数据,同时接收第二组生物样品注释图像的测试数据;
S4、使用训练数据基于初始正则化参数来训练神经网络模型;
S5、迭代地执行以下步骤:
使用测试数据来测试经训练的神经网络模型,以确定经训练的神经网络模型的针对测试数据的损失函数;
S6、基于神经网络模型的针对训练数据的损失函数和神经网络模型的损失函数来调整初始正则化参数;
S7、使用训练数据基于经调整的正则化参数来再训练神经网络模型;
其中,所述迭代的步骤被执行直至确定针对训练数据的损失函数和针对测试数据的损失函数都已经收敛到稳定状态;
S8、将待测生物样品同样分别进样进行液相串联质谱检测,提取待测生物样品中的特征数据;
S9、将待测生物样品中的特征数据与多种生物样品的基质效应值数据库中的每一个生物样品的特征数据进行比对,分析待测生物样品的特征数据与多种生物样品的基质效应值数据库中的特征数据的相似性;
S10、将待测生物样品的特征数据匹配到多种生物样品的基质效应值数据库中的特征数据,通过神经网络模型获得基质效应值,最后通过生物样品的基质效应值对分析结果进行修正。


2.根据权利要求1所述的一种基于液质联用仪和AI算法的生物分析中消除基质效应的方法,其特征在于:所述S1中采用小体积进样时当样品为弱基质效应生物样品时,进样体积小于5μL,当样品为中等强度基质效应生物样品时,进样体积小于等于2μL,当样品为强基质效应生物样品时,先通过一定程度的基质稀释,再采用小体积进样。


3.根据权利要求2所述的一种基于液质联用仪和AI算法的生物分析中消除基质效应的方法,其特征在于:所述S1中仪器中质谱的扫描模式为多反应监测扫描模式;离子模式为电喷雾正离子源ESI+;质谱的参数如下:池加速电压为4V,驻留时间为20ms;干燥气温度为325℃;干燥气流速为8L/min;雾化器压力为35psi;鞘气温度为375℃;鞘气流速为11L/min;毛细管电压为4000V;光电倍增管电压为300V;
液相色谱柱为50mm×2.1mm,1.8μm粒径,流速为0.3mL/min,运行时间为8min,柱温为35℃;液相色谱流动相A为纯水,流动相B为甲醇;梯度洗脱程序为,起始时间,流动相A:B的体积比为90:10,维持0.2min;在0.2-5min内,体积比由90:10线性变化至10:90,并维持该体积至6min,6.1min时,体积比迅速变回起始体...

【专利技术属性】
技术研发人员:李雪寒
申请(专利权)人:南京希麦迪医药科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1