质谱谱图解析方法、装置及智能终端制造方法及图纸

技术编号:35267982 阅读:14 留言:0更新日期:2022-10-19 10:33
本申请涉及蛋白质解谱分析的领域,尤其是涉及一种质谱谱图解析方法、装置及智能终端,质谱谱图解析方法包括:获取目标谱图,其中,目标谱图用于反映蛋白质肽段的质谱数据;基于目标谱图的质荷比,确定目标谱图的谱图特征;将目标谱图的谱图特征输入预设的解谱模型,得到目标谱图的解析类别,其中,解析类别用于反映目标谱图对应的肽段序列。基于目标谱图的质荷比得到谱图特征,并将谱图特征输入解谱模型中,通过解谱模型得到解析分类。本申请具有能够有效、准确、快速地分析出目标谱图所对应的蛋白质的肽段序列的特点。蛋白质的肽段序列的特点。蛋白质的肽段序列的特点。

【技术实现步骤摘要】
质谱谱图解析方法、装置及智能终端


[0001]本申请涉及蛋白质解谱分析的领域,尤其是涉及一种质谱谱图解析方法、装置及智能终端。

技术介绍

[0002]人类基因组中包含了关于人类发展和进化的所有信息,揭示了基因编码蛋白质的真理。在后基因组计划的时期,生物学的研究逐渐从基因组研究转变到蛋白质组研究上。蛋白质几乎涉及细胞功能的各个方面,蛋白质的表征目前已经成为现代生物学的重要组成部分,它激发了一门新学科:蛋白质组学。质谱技术是目前研究蛋白质的主要技术,拥有高精度、高速度等特点。质谱技术的进步为蛋白质鉴定提供了以前所未有的速度、灵敏度和准确性识别,为蛋白质组学的研究与发展提供了优势。
[0003]目前应用比较广泛的蛋白质组质谱技术几乎都是利用计算机软件算法进行质谱谱图解析,但是普遍存在计算成本高昂、分析时间过长的问题。

技术实现思路

[0004]本申请目的一是提供一种质谱谱图解析方法,具有分析时间短的特点。
[0005]本申请的上述专利技术目的一是通过以下技术方案得以实现的:一种质谱谱图解析方法,包括:获取目标谱图,其中,所述目标谱图用于反映蛋白质肽段的质谱数据;基于所述目标谱图的质荷比,确定所述目标谱图的谱图特征;将所述目标谱图的谱图特征输入预设的解谱模型,得到所述目标谱图的解析类别,其中,所述解析类别用于反映所述目标谱图对应的肽段序列。
[0006]通过采用上述技术方案,基于目标谱图的质荷比得到谱图特征,并将谱图特征输入解谱模型中,通过解谱模型得到解析分类,从而可有效、准确、快速地分析出目标谱图所对应的蛋白质的肽段序列。
[0007]可选的,所述基于所述目标谱图的质荷比,确定所述目标谱图的谱图特征,包括:基于所述质荷比的强度值,对所述目标谱图的所有所述质荷比进行筛选,得到特征数量个特征质荷比;基于所述目标谱图的所有所述特征质荷比,得到所述目标谱图的谱图特征。
[0008]通过采用上述技术方案,对应于不同的蛋白质肽段的目标谱图,在质荷比上具有较大的差异,利用指定数量的质荷比得到谱图特征,使得谱图特征相对于目标谱图具有较强的代表性,提高检测分析的准确率。
[0009]可选的,所述解谱模型的输出包括由所述谱图特征压缩得到的特征矩阵,以及所述特征矩阵所对应的所述解析类别;所述特征矩阵的长度为7。
[0010]通过采用上述技术方案,谱图特征压缩后的特征损失,并且提高蛋白质谱图的利用率。
[0011]可选的,所述解谱模型包括4层用于压缩所述谱图特征以得到所述特征矩阵的平均值下采样层;所述基于所述质荷比的强度值,对所述目标谱图的所有所述质荷比进行筛选,得到特征数量个特征质荷比,包括:基于所述质荷比的强度值,对所述目标谱图的所有所述质荷比进行筛选,得到112个特征质荷比。
[0012]通过采用上述技术方案,使得解谱模型对于目标谱图的适用范围较广,提高质谱数据的利用率。
[0013]可选的,所述解谱模型利用以下方式进行训练:获取模型训练数据集,其中,所述模型训练数据集包含训练谱图、对应于所述训练谱图的谱图特征,以及对应标注于所述训练谱图的肽段标签;将所述训练谱图的谱图特征输入所述解谱模型,得到所述训练谱图的训练类别;基于所述训练谱图的肽段标签和所述训练谱图的训练类别,训练所述解谱模型。
[0014]通过采用上述技术方案,将预先标注好的肽段标签作为真实结果,将解谱模型输出的训练类别作为实际结果,利用肽段标签和训练类别对解谱模型进行训练,使得解谱模型的分析结果更加准确、更接近真实值。
[0015]可选的,所述获取模型训练数据集,包括:获取质谱原始数据集和解谱数据集,其中,所述质谱原始数据集包含原始谱图,所述解谱数据集包含对应于所述原始谱图的解谱结果;对所述质谱原始数据集中的所述原始谱图进行筛选,得到过滤谱图;移除所述质谱原始数据集中的所述过滤谱图,得到质谱训练数据集;获取所述质谱训练数据集的谱图特征;基于所述解谱数据集,对所述质谱训练数据集中所述中的所有原始谱图进行标注,得到所述质谱训练数据集的肽段标签。
[0016]通过采用上述技术方案,对解谱模型的训练数据进行筛选,预先排除掉部分有效信息较少、可信度不足的数据,提高训练后的模型效果,使得训练完成的解谱模型的分析结果更加准确。
[0017]可选的,所述对所述质谱原始数据集中的所述原始谱图进行筛选,得到过滤谱图,包括:基于所述原始谱图的解谱结果,筛选所述解谱结果为反库的所述原始谱图,得到过滤谱图;和/或,基于所述原始谱图的解谱结果,筛选所述解谱结果为空的所述原始谱图,得到过滤谱图;和/或,基于所述原始谱图的解谱结果,筛选所述解谱结果的评分小于评分阈值的所述原始谱图,得到过滤谱图;和/或,基于所述原始谱图的质荷比的数量,筛选所述质荷比的数量小于特征阈值的所述原始图像,得到过滤谱图,其中,所述特征阈值小于等于所述谱图特征包含的所述质荷比的数量;和/或,基于所述原始谱图的母离子化合价,对所述质谱原始数据集中的所述原始
谱图进行分组,得到化合价分类组别;筛选谱图数量小于化合价图数阈值的所述化合价分类组别,得到过滤谱图;和/或,基于所述解谱结果中的肽段序列,对所述质谱原始数据集中的所述原始谱图进行分组,得到肽段分类组别;筛选谱图数量小于肽段图数阈值的所述肽段分类组别,得到过滤谱图。
[0018]通过采用上述技术方案,解谱结果为反库、解谱结果为空或解谱结果评分小于评分阈值的原始谱图,均为可信度过低的原始谱图,将这部分原始谱图作为过滤谱图后续进行排除,可以对模型的训练进行优化。若原始谱图的质荷比数量小于特征阈值,则此原始谱图并不能提取出或者筛选出足够数量的质荷比作为谱图特征参与后续的计算,因此需要将这部分原始谱图作为过滤谱图后续进行排除。若化合价分类组别中的原始谱图的数量小于化合价图数阈值,则说明此化合价分类组别中的数据量过少;肽段分类组别中的原始谱图的数量小于肽段图数阈值,则说明此肽段分类组别中的数据量过少。当化合价分类组别中的数据量过少或者肽段分类组别中的数据量过少的情况发生时,会导致训练过程中模型难以收敛,因此需要排过滤这部分数据,使得模型训练可以快速收敛。
[0019]本专利技术的主要专利技术目的二还提出一种质谱谱图解析装置。
[0020]一种质谱谱图解析装置,包括:谱图获取模块,用于获取目标谱图,其中,所述目标谱图对应于蛋白质的肽段;特征提取模块,用于基于所述目标谱图的质荷比,确定所述目标谱图的谱图特征;模型解析模块,用于将所述目标谱图的谱图特征输入预设的所述解谱模型,得到所述目标谱图的解析类别,其中,所述解析类别用于反映所述目标谱图对应的肽段序列。
[0021]本专利技术的主要专利技术目的三还提出一种智能终端。
[0022]一种智能终端,包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行如上述任一技术方案的质谱谱图解析方法的计算机程序。
[0023]本专利技术的主要专利技术目的四还提出一种计算机可读存储介质。
[0024]一种计算机可读存储介质,存储有能够本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种质谱谱图解析方法,其特征在于,包括:获取目标谱图,其中,所述目标谱图用于反映蛋白质肽段的质谱数据;基于所述目标谱图的质荷比,确定所述目标谱图的谱图特征;将所述目标谱图的谱图特征输入预设的解谱模型,得到所述目标谱图的解析类别,其中,所述解析类别用于反映所述目标谱图对应的肽段序列。2.根据权利要求1所述的质谱谱图解析方法,其特征在于,所述基于所述目标谱图的质荷比,确定所述目标谱图的谱图特征,包括:基于所述质荷比的强度值,对所述目标谱图的所有所述质荷比进行筛选,得到特征数量个特征质荷比;基于所述目标谱图的所有所述特征质荷比,得到所述目标谱图的谱图特征。3.根据权利要求2所述的质谱谱图解析方法,其特征在于,所述解谱模型的输出包括由所述谱图特征压缩得到的特征矩阵,以及所述特征矩阵所对应的所述解析类别;所述特征矩阵的长度为7。4.根据权利要求3所述的质谱谱图解析方法,其特征在于,所述解谱模型包括4层用于压缩所述谱图特征以得到所述特征矩阵的平均值下采样层;所述基于所述质荷比的强度值,对所述目标谱图的所有所述质荷比进行筛选,得到特征数量个特征质荷比,包括:基于所述质荷比的强度值,对所述目标谱图的所有所述质荷比进行筛选,得到112个特征质荷比。5.根据权利要求1所述的质谱谱图解析方法,其特征在于,所述解谱模型利用以下方式进行训练:获取模型训练数据集,其中,所述模型训练数据集包含训练谱图、对应于所述训练谱图的谱图特征,以及对应标注于所述训练谱图的肽段标签;将所述训练谱图的谱图特征输入所述解谱模型,得到所述训练谱图的训练类别;基于所述训练谱图的肽段标签和所述训练谱图的训练类别,训练所述解谱模型。6.根据权利要求5所述的质谱谱图解析方法,其特征在于,所述获取模型训练数据集,包括:获取质谱原始数据集和解谱数据集,其中,所述质谱原始数据集包含原始谱图,所述解谱数据集包含对应于所述原始谱图的解谱结果;对所述质谱原始数据集中的所述原始谱图进行筛选,得到过滤谱图;移除所述质谱原始数据集中的所述过滤谱...

【专利技术属性】
技术研发人员:魏千洲张弓余卓
申请(专利权)人:深圳承启生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1