基于振荡信号的质谱图全局峰信息特征描述方法和装置制造方法及图纸

技术编号:38760881 阅读:12 留言:0更新日期:2023-09-10 10:33
本发明专利技术实施例公开了一种基于振荡信号的质谱图全局峰信息特征描述方法和装置,该方法包括:获取目标质谱图,并对目标质谱图进行平滑处理;使用对称零面积法对纯净质谱图进行寻峰操作,截取峰区间的谱图数据,并将谱图数据拼接成第一峰谱图数据;从目标质谱图中截取并拼接得到第二峰谱图数据;使用RDT算法提取第二峰谱图数据的随机减量质谱信号;使用PCA算法对随机减量质谱信号进行处理,得到主成分质谱信号;使用Prony算法对所述主成分质谱信号进行信号辨识,得到振荡衰减因子向量;构建目标质谱图的全局峰内在描述特征向量。本发明专利技术实施例可以解决原始质谱图中离散峰信息数据不容易用独立特征描述的问题。容易用独立特征描述的问题。容易用独立特征描述的问题。

【技术实现步骤摘要】
基于振荡信号的质谱图全局峰信息特征描述方法和装置


[0001]本专利技术实施例涉及质谱图数据处理
,具体涉及一种基于振荡信号的质谱图全局峰信息特征描述方法和装置。

技术介绍

[0002]现在特征构造方法多是将质谱图中某几个离子特征进行加权、SVD(Single Value Decomposition奇异值分解)压缩等方法从数学角度来进行的。而在对质谱图数据集进行数据挖掘时,现有的质谱特征描述方法多是基于方差、均值和相关性系数等数学统计量构造的,以统计信息作为特征进行学习时,缺少能够适合描述质谱图信息的特征维度,都不能很好地表征地质谱图中离子峰的峰形状。

技术实现思路

[0003]为了克服现有技术的不足,本专利技术实施例的目的在于提供一种基于振荡信号的质谱图全局峰信息特征描述方法和装置,其可以解决原始质谱图中离散峰信息数据不容易用独立特征描述的问题。
[0004]为解决所述问题,本专利技术实施例第一方面公开一种基于振荡信号的质谱图全局峰信息特征描述方法,包括:
[0005]获取目标质谱图,并对所述目标质谱图进行平滑处理,得到平滑后的纯净质谱图;
[0006]使用对称零面积法对所述纯净质谱图进行寻峰操作,截取峰区间的谱图数据,并将所述谱图数据拼接成第一峰谱图数据;
[0007]对照所述纯净质谱图的峰区间,从所述目标质谱图中截取并拼接得到对应于所述第一峰谱图数据的第二峰谱图数据;
[0008]使用极值触发条件的RDT算法提取所述第二峰谱图数据的随机减量质谱信号;
[0009]使用PCA算法对所述随机减量质谱信号进行处理,得到主成分质谱信号;
[0010]使用Prony算法对所述主成分质谱信号进行信号辨识,得到振荡衰减因子向量,所述振荡衰减因子向量包括主成分质谱信号的振荡幅值、频率、相位和衰减因子;
[0011]基于所述主成分质谱信号或振荡衰减因子向量构建所述目标质谱图的全局峰内在描述特征向量。
[0012]在本专利技术实施例第一方面中,作为一种优选的实施方式,对所述目标质谱图进行平滑处理,得到平滑后的纯净质谱图,包括:
[0013]使用N阶的SG平滑算法处理所述目标质谱图,得到平滑后的纯净质谱图。
[0014]在本专利技术实施例第一方面中,作为一种优选的实施方式,使用N阶的SG平滑算法处理所述目标质谱图,得到平滑后的纯净质谱图,之后还包括:
[0015]以所述纯净质谱图作为纯净信号,以所述目标质谱图作为采样信号,计算所述目标质谱图的信噪比SNR和均方根误差RMSE,如果信噪比SNR小于或等于信噪比阈值σ,且均方根误差RMSE在[β,γ]之间,则进行所述寻峰操作,其中,β和γ分别为均方根误差RMSE的阈
值下限和阈值上限;
[0016]否则,比对当前运行次数num和使用N阶的SG平滑算法处理目标质谱图的最大次数iterMax,num的初始值为1,当前运行次数num小于最大次数iterMax时,则将N的大小减1,num的大小加1,并重新执行使用N阶的SG平滑算法处理目标质谱图,如果当前运行次数num大于或等于最大次数iterMax时,则进行所述寻峰操作。
[0017]在本专利技术实施例第一方面中,作为一种优选的实施方式,使用对称零面积法对所述纯净质谱图进行寻峰操作,截取峰区间的谱图数据,并将所述谱图数据拼接成第一峰谱图数据,包括:
[0018]使用对称零面积法对所述纯净质谱图进行寻峰操作,记录峰起始点的横坐标Start和峰终点的横坐标End;
[0019]比对RDT最小模态周期T和(Start+End)/n,选取二者的较小值作为截取长度L,其中,n为截取峰间隔的比例,所述RDT最小模态周期T以及截取峰间隔的比例n均为预设值;
[0020]判断目标峰与其相邻的在后峰之间的峰间隔S与截取长度L的关系;
[0021]当S≥L时,从所述目标峰起向所述在后峰截取长度为L的谱图数据,作为所述目标峰的峰间隔谱图数据;
[0022]当L/8<S<L时,截取所述目标峰和在后峰之间所有的谱图数据,作为所述目标峰的峰间隔谱图数据;
[0023]当S≤L/8时,不截取所述目标峰的峰间隔谱图数据;
[0024]将所有峰对应的峰间隔谱图数据进行拼接,得到所述第一峰谱图数据。
[0025]在本专利技术实施例第一方面中,作为一种优选的实施方式,对照所述纯净质谱图的峰区间,从所述目标质谱图中截取并拼接得到对应于所述第一峰谱图数据的第二峰谱图数据,包括:
[0026]根据所述第一峰谱图数据对应的纯净质谱图的横坐标,对所述目标质谱图的峰谱图数据进行截取并拼接,得到所述第二峰谱图数据。
[0027]在本专利技术实施例第一方面中,作为一种优选的实施方式,使用极值触发条件的RDT算法提取所述第二峰谱图数据的随机减量质谱信号,包括:
[0028]通过N+5阶SG平滑算法对所述第二峰谱图数据进行平滑处理,得到纯净峰谱图数据;
[0029]使用极值触发条件的RDT算法提取所述纯净峰谱图数据的随机减量质谱信号。
[0030]在本专利技术实施例第一方面中,作为一种优选的实施方式,使用PCA算法对所述随机减量质谱信号进行处理,得到主成分质谱信号,包括:
[0031]使用PCA算法提取所述随机减量质谱信号中的前80%

95%的主成分质谱信号,作为所述主成分质谱信号。
[0032]在本专利技术实施例第一方面中,作为一种优选的实施方式,使用Prony算法对所述主成分质谱信号进行信号辨识,得到振荡衰减因子向量,包括:
[0033]采用Prony算法对所述主成分质谱信号进行信号辨识,得到主成分质谱信号的振荡幅值、相位、频率和衰减因子,其中,所述Prony算法采用误差平方和最小为模型参数估计原则;
[0034]基于所述主成分质谱信号的振荡幅值、相位、频率和衰减因子构建多组振荡衰减
因子向量,振荡衰减因子向量的表达形式为:
[0035]P
i
=(A
i

i
,f
i

i
)
[0036]其中,P
i
为第i个振荡衰减因子向量;A
i
、θ
i
、f
i
和α
i
分别为第i个振荡衰减因子向量对应的振荡幅值、相位、频率和衰减因子;
[0037]基于所述主成分质谱信号或振荡衰减因子向量构建所述目标质谱图的全局峰内在描述特征向量,包括:
[0038]选取所述振荡衰减因子向量中的一个或多个参数构建所述目标质谱图的全局峰内在描述特征向量,或者,选取所述主成分质谱信号中的一个或多个参数作为所述目标质谱图的全局峰内在描述特征向量。
[0039]本专利技术实施例第二方面公开了一种基于振荡信号的质谱图全局峰信息特征描述装置,包括:
[0040]第一处理单元,用于获取目标本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于振荡信号的质谱图全局峰信息特征描述方法,其特征在于,其包括:获取目标质谱图,并对所述目标质谱图进行平滑处理,得到平滑后的纯净质谱图;使用对称零面积法对所述纯净质谱图进行寻峰操作,截取峰区间的谱图数据,并将所述谱图数据拼接成第一峰谱图数据;对照所述纯净质谱图的峰区间,从所述目标质谱图中截取并拼接得到对应于所述第一峰谱图数据的第二峰谱图数据;使用极值触发条件的RDT算法提取所述第二峰谱图数据的随机减量质谱信号;使用PCA算法对所述随机减量质谱信号进行处理,得到主成分质谱信号;使用Prony算法对所述主成分质谱信号进行信号辨识,得到振荡衰减因子向量,所述振荡衰减因子向量包括主成分质谱信号的振荡幅值、频率、相位和衰减因子;基于所述主成分质谱信号或振荡衰减因子向量构建所述目标质谱图的全局峰内在描述特征向量。2.根据权利要求1所述的基于振荡信号的质谱图全局峰信息特征描述方法,其特征在于,对所述目标质谱图进行平滑处理,得到平滑后的纯净质谱图,包括:使用N阶的SG平滑算法处理所述目标质谱图,得到平滑后的纯净质谱图。3.根据权利要求2所述的基于振荡信号的质谱图全局峰信息特征描述方法,其特征在于,使用N阶的SG平滑算法处理所述目标质谱图,得到平滑后的纯净质谱图,之后还包括:以所述纯净质谱图作为纯净信号,以所述目标质谱图作为采样信号,计算所述目标质谱图的信噪比SNR和均方根误差RMSE,如果信噪比SNR小于或等于信噪比阈值σ,且均方根误差RMSE在[β,γ]之间,则进行所述寻峰操作,其中,β和γ分别为均方根误差RMSE的阈值下限和阈值上限;否则,比对当前运行次数num和使用N阶的SG平滑算法处理目标质谱图的最大次数iterMax,num的初始值为1,当前运行次数num小于最大次数iterMax时,则将N的大小减1,num的大小加1,并重新执行使用N阶的SG平滑算法处理目标质谱图,如果当前运行次数num大于或等于最大次数iterMax时,则进行所述寻峰操作。4.根据权利要求1所述的基于振荡信号的质谱图全局峰信息特征描述方法,其特征在于,使用对称零面积法对所述纯净质谱图进行寻峰操作,截取峰区间的谱图数据,并将所述谱图数据拼接成第一峰谱图数据,包括:使用对称零面积法对所述纯净质谱图进行寻峰操作,记录峰起始点的横坐标Start和峰终点的横坐标End;比对RDT最小模态周期T和(Start+End)/n,选取二者的较小值作为截取长度L,其中,n为截取峰间隔的比例,所述RDT最小模态周期T以及截取峰间隔的比例n均为预设值;判断目标峰与其相邻的在后峰之间的峰间隔S与截取长度L的关系;当S≥L时,从所述目标峰起向所述在后峰截取长度为L的谱图数据,作为所述目标峰的峰间隔谱图数据;当L/8<S<L时,截取所述目标峰和在后峰之间所有的谱图数据,作为所述目标峰的峰间隔谱图数据;当S≤L/8时,不截取所述目标峰的峰间隔谱图数据;将所有峰对应的峰间隔谱图数据进行拼接,得到所述第一峰谱图数据。
5.根据权利要求4所述的基于振荡信号的质谱图全...

【专利技术属性】
技术研发人员:陈林
申请(专利权)人:广东省麦思科学仪器创新研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1