一种基于Hopfield模型的三重四极杆质谱仪谱图分类方法技术

技术编号:31316688 阅读:15 留言:0更新日期:2021-12-12 23:55
本发明专利技术提供了一种基于Hopfield模型的三重四极杆质谱仪谱图分类方法,包括如下步骤:S1、基于各类目标峰特征信息,改进Hopfield模型;S2、提取目标峰最高点左右两侧一定距离范围内的点,经归一化处理后作为改进后的Hopfield模型的初始状态向量;S3、基于先验训练集合生成Hopfield模型的吸引子和吸引盆,当待识别峰的数据落入相应吸引子的吸引盆中时,随着递归计算将最终收敛到吸引子,而这个吸引子就是所谓的类型标识。将Hopfield模型应用于三重四极杆质谱仪的谱图分类应用中,这是一种非线性递归神经网络,同支持向量机等方法相比,计算复杂度低,无需特别关注目标峰的特征,易于实现。同时本专利中Hopfield模型神经元数目可以灵活调整,从而应对不同步长的扫描场景。景。景。

【技术实现步骤摘要】
一种基于Hopfield模型的三重四极杆质谱仪谱图分类方法


[0001]本专利技术属于质谱仪
,尤其是涉及一种基于Hopfield模型的三重四极杆质谱仪谱图分类方法。

技术介绍

[0002]质谱仪是目前化合物定性与定量分析的重要工具,其种类众多,广泛应用于学校实验室、医院、研究院和制药公司等。三重四极杆质谱仪也是其中一种,三重四极杆质谱仪提供了串级功能,加强了质谱的定性能力。除此之外,其定量能力佳,MRM信噪比高,除一般子离子扫描功能外,子离子扫描、母离子扫描、中性丢失(Neutral loss)等模式。三重四极杆质谱仪功能强大,然而参数众多,调谐难度大,尤其在自动调谐中,需要识别和区分目标峰和杂峰,这也成为了自动调谐中的难点之一。
[0003]以AB SCIEX公司的API 4000型三重四极杆质谱仪为例,通常要求单位质量分辨为:0.6~0.8amu(FWHM)。图1是分辨为0.7amu(FWHM)的质谱图,这是调谐完成后的正确谱图。
[0004]然而在调谐液中存在许多其他的化合物,这就导致存在其他种类的质谱图。图1中8个质量段的谱图各异,调谐的过程恰好是:从众多的谱峰中识别出这8个目标峰(也称特征峰),再由这8个目标峰校对质量轴和分辨率。可见调谐的焦点在于如何识别这8个目标峰。人工调谐时,要想识别出目标峰往往需要丰富的实验经验,容易出错。如果出错往往会导致实验结果异常,更有甚者,造成一定损失。

技术实现思路

[0005]有鉴于此,为克服上述缺陷,本专利技术旨在提出一种基于Hopfield模型的三重四极杆质谱仪谱图分类方法。
[0006]为达到上述目的,本专利技术的技术方案是这样实现的:
[0007]一种基于Hopfield模型的三重四极杆质谱仪谱图分类方法,括如下步骤:
[0008]S1、基于各类目标峰特征信息,改进Hopfield模型;
[0009]S2、提取目标峰最高点左右两侧一定距离范围内的点,经归一化处理后作为改进后的Hopfield模型的初始状态向量;
[0010]S3、基于先验训练集合生成Hopfield模型的吸引子和吸引盆,当待识别峰的数据落入相应吸引子的吸引盆中时,随着递归计算将最终收敛到吸引子,该吸引子就是待测峰的类型标识。
[0011]进一步的,步骤S1中,设先验训练集合为包含各类目标峰特征信息的N维向量集合,改进后的Hopfield模型的权重矩阵元素计算公式为:
[0012][0013]其中ξ
u,i
为先验训练集合中第u个训练向量的第j个元素,w
ji
为改进后的Hopfield模型权重矩阵的第j行,第i列的元素,N为训练向量ξ
u
的长度。
[0014]进一步的,
[0015]Hopfield模型的激活函数为:
[0016][0017]其中,a
i
被称为神经元i的增益,默认的a
i
=1,x则是神经元i在当前时刻的输出,v称之为中间变量,是激活函数的输入,中间变量的计算公式如下所示:
[0018][0019]其中,v
j
作为神经元j激活函数的输入(即中间变量),w
ji
为改进后的Hopfield模型权重矩阵的第j行,第i列的元素,x
i
为上一时刻状态向量的第i个元素,默认偏置参数b
j
=0,Hopfield模型的训练集合为
[0020]权重计算公式的矩阵形式为:
[0021][0022]其中,表示以作为主对角线元素的对角方阵。W为改进后Hopfield模型的权重矩阵,N为训练向量ξ
u
的长度。
[0023]进一步的,步骤S2的具体方法如下:
[0024]提取峰最高点左右两侧2.5u范围内的点作为模型的初始状态向量,此时该向量的长度为51。
[0025]相对于现有技术,本专利技术所述的基于Hopfield模型的三重四极杆质谱仪谱图分类方法具有以下优势:
[0026](1)本专利技术基于Hopfield模型的三重四极杆质谱仪谱图分类方法,将Hopfield模型应用于三重四极杆质谱仪的谱图分类应用中,这是一种非线性递归神经网络,同支持向量机等方法相比,计算复杂度低,无需特别关注目标峰的特征,易于实现;同时本专利中Hopfield模型神经元数目可以灵活调整,从而应对不同步长的扫描场景。
[0027](2)结合连续Hopfield模型对离散Hopfield模型进行改进,将激活函数设定为双曲面正切函数,这使得模型实现成为可能,同时,这样做也降低了模型的计算复杂度。
附图说明
[0028]构成本专利技术的一部分的附图用来提供对本专利技术的进一步理解,本专利技术的示意性实
施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:
[0029]图1为本专利技术实施例所述的分辨是0.7amu(FWHM)的质谱图示意图;
[0030]图2为本专利技术实施例所述的提取待识别质谱峰数据示意图;
[0031]图3为本专利技术实施例所述的Hopfield模型框图;
[0032]图4为本专利技术实施例所述的吸引子和吸引盆示意图。
具体实施方式
[0033]需要说明的是,在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。
[0034]下面将参考附图并结合实施例来详细说明本专利技术。
[0035]本专利提出了一种三重四极杆质谱仪的质谱峰分类方法。该方法主要基于改进型的Hopfield模型实现。这种谱图分类方法可以识别调谐过程中各种类型的峰,从而正确寻找到目标峰,以便能够校对质量轴和分辨率;另一方面,该方法也可以用来判断目标化合物扫描时的峰形是否合理。该方法的初始输入为提取待识别峰的数据,经过非线性递归计算后,最终收敛到由先验知识定义的类型标识,基于此可以标记出待识别峰的类型标识。提取待识别质谱峰数据示意图如图2所示。
[0036]在扫描步长等于0.1u且半峰宽达到0.7u附近时,提取峰最高点左右两侧2.5u范围内的点作为模型的初始状态向量,此时该向量的长度为51。选择以2.5u作为选取半径的理由在于至少能够覆盖两个副峰,使得该目标峰包含足够多的特征信息。由此确定了模型状态向量的长度N=51,从待识别谱峰中提取的向量作为模型的初始状态向量,记作x(0)=[x1(0),

,x
N
(0)]T
,模型的第n时刻的状态记作x(n)=[x1(n),

,x
N
(n)]T

[0037]Hopfield模型框图如图3所示。Hopfield模型是一种非线性递归神经网络。
[0038]其中激活函数是非线性的,在本专利中,Hopfield模型的激活函数的形式为:
[0039][0040]其中,a
i
被称为神经元i的增益,默认的a本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于Hopfield模型的三重四极杆质谱仪谱图分类方法,其特征在于,包括如下步骤:S1、基于各类目标峰特征信息,改进Hopfield模型;S2、提取目标峰最高点左右两侧一定距离范围内的点,经归一化处理后作为改进后的Hopfield模型的初始状态向量;S3、基于先验训练集合生成Hopfield模型的吸引子和吸引盆,当待识别峰的数据落入相应吸引子的吸引盆中时,随着递归计算将最终收敛到吸引子,该吸引子就是待测峰的类型标识。2.根据权利要求1所述的基于Hopfield模型的三重四极杆质谱仪谱图分类方法,其特征在于:步骤S1中,设先验训练集合为包含各类目标峰特征信息的N维向量集合,改进后的Hopfield模型的权重矩阵元素计算公式为:其中ξ
u,i
为先验训练集合中第u个训练向量的第j个元素,w
ji
为改进后的Hopfield模型权重矩阵的第j行,第i列的元素,N为训练向量ξ
u
的长度。3.根据权利要求2所述的基于Hopfield模型的三重四极杆质谱仪谱图分类方...

【专利技术属性】
技术研发人员:李亮王晶李振冯新用刘广才贾明正凌星程文播
申请(专利权)人:天津国科医工科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1