当前位置: 首页 > 专利查询>五邑大学专利>正文

一种基于CNN-Attention-GNN模型的多肽结构鉴定方法及其应用技术

技术编号:41965301 阅读:29 留言:0更新日期:2024-07-10 16:47
本发明专利技术公开了一种基于CNN‑Attention‑GNN模型的多肽结构鉴定方法及其应用,方法包括:对收集的多肽质谱信息进行预处理,建立标准化多肽数据集;设计并训练基于CNN‑Attention‑GNN架构模型,模型包括:肽离子峰鉴定层用于识别质谱峰中的碎片离子;节点嵌入层则通过卷积神经网络和自注意力机制进行特征提取,以捕捉有意义的信息;图神经网络层负责捕捉质谱峰中碎片离子之间的复杂关系,以提升模型推断的准确性;输出层通过Softmax和全连接层等操作生成最终的多肽序列;最后,将待测质谱数据输入训练好的模型,生成预测结果。本发明专利技术通过结合CNN网络、自注意力机制、图神经网络以及多肽谱峰间的相关联系,为生物领域的研究和生物活性肽的发展提供坚实基础。

【技术实现步骤摘要】

本专利技术属于质谱鉴定分析领域,特别涉及一种基于cnn-attention-gnn模型的多肽结构鉴定方法及其应用。


技术介绍

1、生物活性肽在人体中具有多种功能,不仅作为信号因子调节生理过程,还能作为外源性补充剂或药物,应用于营养或膳食补充,以及疾病治疗等领域。它们通常具有易吸收、活性强、无毒副作用等特点,因而受到国内外科研界的广泛关注。在生物活性肽研究中,结构鉴定是关键步骤之一,对多肽作为药物、信号因子、功能性食品成分等方面的研究起到至关重要的作用。然而,如何构建高效、准确的多肽结构鉴定方法与工具,仍然是这一领域的主要挑战之一。

2、现有的多肽结构鉴定方法包括序列搜库和从头测序等,这些方法在特异性多肽和蛋白质结构鉴定方面非常有效。但对于生命体中的游离多肽信号因子或代谢标记物,以及食源性蛋白质的酶解或发酵产物中的游离活性肽,特异性通常较弱,且原料蛋白的序列往往未知,使得序列搜库法难以使用。与此相比,从头测序方法主要依赖于质谱仪器的质荷比分析,但忽视了丰度信息,这可能导致鉴定结果不够准确。此外,这些方法通常缺乏物种相关性,在缺乏离子簇的情况下,谱本文档来自技高网...

【技术保护点】

1.一种基于CNN-Attention-GNN模型的多肽结构鉴定方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于CNN-Attention-GNN模型的多肽结构鉴定方法,其特征在于,所述S1的预处理包括:对质谱数据进行鉴定分析,将鉴定所得多肽序列与二级谱图进行关联匹配,获得匹配结果。

3.根据权利要求1所述的基于CNN-Attention-GNN模型的多肽结构鉴定方法,其特征在于,所述S1中的标准数据集构建方法:提取所述预处理后每个鉴定结果中的多肽二级质谱图的离子信息构建多肽的标准化信息单元,所述标准化信息单元由N个离子数据组成,所有标准化信息单元构...

【技术特征摘要】

1.一种基于cnn-attention-gnn模型的多肽结构鉴定方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于cnn-attention-gnn模型的多肽结构鉴定方法,其特征在于,所述s1的预处理包括:对质谱数据进行鉴定分析,将鉴定所得多肽序列与二级谱图进行关联匹配,获得匹配结果。

3.根据权利要求1所述的基于cnn-attention-gnn模型的多肽结构鉴定方法,其特征在于,所述s1中的标准数据集构建方法:提取所述预处理后每个鉴定结果中的多肽二级质谱图的离子信息构建多肽的标准化信息单元,所述标准化信息单元由n个离子数据组成,所有标准化信息单元构建成标准数据集。

4.根据权利要求1所述的基于cnn-...

【专利技术属性】
技术研发人员:徐巨才刘洋陈雅君李武梁姚顺李谆谆黄峻洪岑幸仪
申请(专利权)人:五邑大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1