一种修饰位点识别方法、系统、装置及存储介质制造方法及图纸

技术编号:33429323 阅读:14 留言:0更新日期:2022-05-19 00:20
本发明专利技术公开了一种修饰位点识别方法、系统、装置及存储介质,该方法包括:获取蛋白质乙酰化修饰位点和对应的蛋白质乙酰化氨基酸序列片段;对蛋白质乙酰化氨基酸序列片段中的氨基酸进行二维矩阵转换;对蛋白质乙酰化二维矩阵特征进行连续小波变换操作;将尺度矩阵输入至深度卷积神经网络模型,输出蛋白质乙酰化位点的识别结果。该系统包括:序列获取模块、矩阵特征获取模块、尺度矩阵获取模块和识别模块。通过使用本发明专利技术,可在蛋白质组尺度识别蛋白质乙酰化修饰位点,具有准确、快速、成本低等优点。本发明专利技术作为一种修饰位点识别方法、系统、装置及存储介质,可广泛应用于蛋白质翻译后修饰位点识别领域。位点识别领域。位点识别领域。

【技术实现步骤摘要】
一种修饰位点识别方法、系统、装置及存储介质


[0001]本专利技术涉及蛋白质翻译后修饰位点识别领域,尤其涉及一种修饰位点识别方法、系统、装置及存储介质。

技术介绍

[0002]蛋白质乙酰化是蛋白质翻译后修饰的一种,是指在赖氨酸乙酰基转移酶/赖氨酸去乙酰基转移酶的作用下向蛋白质中的赖氨酸残基添加/去除乙酰基的动态过程。研究表明,蛋白质乙酰化修饰参与代谢、转录激活、亚细胞定位、蛋白质稳定、应激反应等多种生物反应过程,与癌症、糖尿病、心血管疾病和神经退行性疾病等复杂、重大疾病的发生和发展密切相关。因此,识别蛋白质乙酰化修饰位点不仅有助于进一步阐明蛋白质乙酰化的作用机制、蛋白质翻译后修饰与功能之间的关系,而且对于疾病相关蛋白质的识别,以及相关药物研发具有重要的研究意义和应用价值。随着后基因组时代的到来,以及各种测序技术的飞速发展,目前已经识别,并产生了大量的蛋白质序列数据。尽管高分辨率质谱仪器能够识别潜在的蛋白质乙酰化修饰位点。但是由于其具有费时、费力、花费高缺点,并不能满足大规模蛋白质组学研究的需求。

技术实现思路

[0003]为了解决上述技术问题,本专利技术的目的是提供一种修饰位点识别方法、系统、装置及存储介质,可在蛋白质组尺度识别蛋白质乙酰化修饰位点,具有准确、快速、成本低等优点。
[0004]本专利技术所采用的第一技术方案是:一种修饰位点识别方法,包括以下步骤:
[0005]获取蛋白质乙酰化修饰位点和对应的蛋白质乙酰化氨基酸序列片段;
[0006]对蛋白质乙酰化氨基酸序列片段中的氨基酸进行二维矩阵转换,得到蛋白质乙酰化二维矩阵特征;
[0007]基于小波变换函数,对蛋白质乙酰化二维矩阵特征进行连续小波变换操作,得到尺度矩阵;
[0008]将尺度矩阵输入至深度卷积神经网络模型,输出蛋白质乙酰化位点的识别结果。
[0009]进一步,所述获取蛋白质乙酰化修饰位点和对应的蛋白质乙酰化氨基酸序列片段这一步骤,其具体包括:
[0010]获取蛋白质蛋白质乙酰化修饰位点;
[0011]以蛋白质乙酰化修饰位点为中心,截取上游和下游分别包含10个氨基酸残基的序列片段,得到对应的蛋白质乙酰化氨基酸序列片段。
[0012]进一步,所述对蛋白质乙酰化氨基酸序列片段中的氨基酸进行二维矩阵转换,得到蛋白质乙酰化二维矩阵特征这一步骤,其具体包括:
[0013]将20种天然氨基酸残基分别定义为大小为7
×
5的二维特征矩阵,得到定义矩阵;
[0014]根据定义矩阵,将对应的蛋白质乙酰化氨基酸序列片段转化为蛋白质乙酰化二维
矩阵特征。
[0015]进一步,所述基于小波变换函数,对蛋白质乙酰化二维矩阵特征进行连续小波变换操作,得到尺度矩阵这一步骤,其具体包括:
[0016]预设小波变换函数和尺度;
[0017]根据小波变换函数和蛋白质乙酰化二维矩阵特征的行特征,依次改变小波变换尺度并进行连续小波变换,得到每一个尺度下对应的变换系数;
[0018]以每一个尺度下对应的变换系数为行向量,构建尺度矩阵。
[0019]进一步,所述深度卷积神经网络模型的构建步骤具体包括:
[0020]收集蛋白质乙酰化位点数据信息并采用预定义的氨基酸二维特征矩阵、小波变换函数和尺度进程处理,得到第一训练尺度矩阵;
[0021]根据收集的蛋白质乙酰化位点数据信息,得到非蛋白质乙酰化修饰位点序列;
[0022]对于非蛋白质乙酰化修饰位点序列,采用预定义的氨基酸二维特征矩阵、小波变换函数和尺度进程处理,得到第二训练尺度矩阵;
[0023]以第一训练尺度矩阵作为输入数据正样本、第二训练尺度矩阵作为输入数据负样本;
[0024]抽取预设比例的输入数据正样本、对应的输出数据正样本标记、输入数据负样本和对应的输出数据负样本标记,作为训练集对所述深度卷积神经网络模型进行训练;
[0025]抽取预设比例的输入数据正样本、对应的输出数据正样本标记、输入数据负样本和对应的输出数据负样本标记,作为测试集对所述深度卷积神经网络模型进行测试。
[0026]进一步,所述根据收集的蛋白质乙酰化位点数据信息,得到非蛋白质乙酰化修饰位点序列这一步骤,其具体包括:
[0027]根据收集的蛋白质乙酰化位点数据信息,对在包含蛋白质乙酰化修饰位点的蛋白质中进行查找,得到没有注释为乙酰化位点的赖氨酸残基;
[0028]以没有注释为乙酰化位点的赖氨酸残基为中心,截取上游和下游分别包含10个氨基酸残基的序列片段,得到非蛋白质乙酰化修饰位点序列。
[0029]本专利技术所采用的第二技术方案是:一种修饰位点识别系统,包括:
[0030]序列获取模块,用于获取蛋白质乙酰化修饰位点和对应的蛋白质乙酰化氨基酸序列片段;
[0031]矩阵特征获取模块,用于对蛋白质乙酰化氨基酸序列片段中的氨基酸进行二维矩阵转换,得到蛋白质乙酰化二维矩阵特征;
[0032]尺度矩阵获取模块,基于小波变换函数,对蛋白质乙酰化二维矩阵特征进行连续小波变换操作,得到尺度矩阵;
[0033]识别模块,用于将尺度矩阵输入至深度卷积神经网络模型,输出蛋白质乙酰化位点的识别结果。
[0034]本专利技术所采用的第三技术方案是:一种修饰位点识别装置,包括:
[0035]至少一个处理器;
[0036]至少一个存储器,用于存储至少一个程序;
[0037]当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如上所述一种修饰位点识别方法。
[0038]本专利技术所采用的第四技术方案是:一种存储介质,其中存储有处理器可执行的指令,其特征在于:所述处理器可执行的指令在由处理器执行时用于实现如上所述一种修饰位点识别方法。
[0039]本专利技术方法、系统、装置及存储介质的有益效果是:本专利技术基于深度学习理论,采用数据处理方法构建理论模型,能够在蛋白质组尺度快速、准确、高效地识别蛋白质乙酰化修饰位点,从而有助于蛋白质乙酰化修饰机理的研究和疾病相关蛋白质翻译后修饰位点的识别。
附图说明
[0040]图1是本专利技术一种修饰位点识别方法的步骤流程图;
[0041]图2是本专利技术一种修饰位点识别系统的结构框图。
具体实施方式
[0042]下面结合附图和具体实施例对本专利技术做进一步的详细说明。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
[0043]如图1所示,本专利技术提供了一种修饰位点识别方法,该方法包括以下步骤:
[0044]S1、获取蛋白质乙酰化修饰位点和对应的蛋白质乙酰化氨基酸序列片段;
[0045]S1.1、获取蛋白质蛋白质乙酰化修饰位点;
[0046]S1.2、以蛋白质乙酰化修饰位点为中心,截取上游和下游分别包含10个氨基酸残基的序列片段本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种修饰位点识别方法,其特征在于,包括以下步骤:获取蛋白质乙酰化修饰位点和对应的蛋白质乙酰化氨基酸序列片段;对蛋白质乙酰化氨基酸序列片段中的氨基酸进行二维矩阵转换,得到蛋白质乙酰化二维矩阵特征;基于小波变换函数,对蛋白质乙酰化二维矩阵特征进行连续小波变换操作,得到尺度矩阵;将尺度矩阵输入至深度卷积神经网络模型,输出蛋白质乙酰化位点的识别结果。2.根据权利要求1所述一种修饰位点识别方法,其特征在于,所述获取蛋白质乙酰化修饰位点和对应的蛋白质乙酰化氨基酸序列片段这一步骤,其具体包括:获取蛋白质蛋白质乙酰化修饰位点;以蛋白质乙酰化修饰位点为中心,截取上游和下游分别包含10个氨基酸残基的序列片段,得到对应的蛋白质乙酰化氨基酸序列片段。3.根据权利要求2所述一种修饰位点识别方法,其特征在于,所述对蛋白质乙酰化氨基酸序列片段中的氨基酸进行二维矩阵转换,得到蛋白质乙酰化二维矩阵特征这一步骤,其具体包括:将20种天然氨基酸残基分别定义为大小为7
×
5的二维特征矩阵,得到定义矩阵;根据定义矩阵,将对应的蛋白质乙酰化氨基酸序列片段转化为蛋白质乙酰化二维矩阵特征。4.根据权利要求3所述一种蛋白质乙酰化修饰位点识别方法,其特征在于,所述基于小波变换函数,对蛋白质乙酰化二维矩阵特征进行连续小波变换操作,得到尺度矩阵这一步骤,其具体包括:预设小波变换函数和尺度;根据小波变换函数和蛋白质乙酰化二维矩阵特征的行特征,依次改变小波变换尺度并进行连续小波变换,得到每一个尺度下对应的变换系数;以每一个尺度下对应的变换系数为行向量,构建尺度矩阵。5.根据权利要求4所述一种修饰位点识别方法,其特征在于,所述深度卷积神经网络模型的构建步骤具体包括:收集蛋白质乙酰化位点数据信息并采用预定义的氨基酸二维特征矩阵、小波变换函数和尺度进程处理,得到第一训练尺度矩阵;根据收集的蛋白质乙酰化位点数据信息,得到非蛋白质乙酰化修饰位点序列;对于非蛋白质乙酰化修饰位点序列,采用预定义的氨基酸二维...

【专利技术属性】
技术研发人员:李占潮杨楠翔王梦茹彭冬冬刘洁胡党中邓倩刘雨琦
申请(专利权)人:广东药科大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1