The invention discloses a method for analyzing and predicting the effect of cancer mutation on LIR motif function, which includes the following steps: (1) training prediction model by using LIR motif data; (2) scoring peptide segment data before and after cancer mutation by using model; (3) scoring peptide segment data of candidate peptide segment by model, and obtaining scoring result and the result. The data of peptide segments corresponding to candidate peptide segments belong to the relationship between Bayesian probabilities of real LIR motifs and non-real LIR motifs. Then, the corresponding peptide segments before and after cancer mutation are taken as candidate peptide segments respectively and substituted into the scoring results in step (2). The Bayesian probabilities of the corresponding peptide segments before and after cancer mutation are obtained; (4) The calculation of the Bayesian probabilities of the corresponding peptide segments before and after cancer mutation. The probability of this cancer mutation for the optional way of LIR function. By systematically studying the effect of cancer mutation on LIR motif function by using LIR motif data and the corresponding peptide segment data before and after cancer mutation, the probability of the alternative influence mode of cancer mutation on LIR function can be predicted.
【技术实现步骤摘要】
一种分析预测癌症突变影响LIR模体功能的方法
本专利技术属于自噬领域,更具体地,涉及一种分析预测癌症突变影响LIR模体功能的方法,利用该方法可以分析预测已有的癌症突变对LIR模体进而对自噬通路的影响,当然,随着未来新癌症突变的发现,该方法也可以用于判断这些新癌症突变对LIR模体进而对自噬通路的影响。
技术介绍
细胞自噬是细胞内清除损坏组件和蛋白质或在饥饿条件下通过降解自身一部分蛋白质以渡过难关的一种机制。在正常生理条件下,细胞通过自噬清除受损的细胞器或蛋白质聚集物,自噬的受阻会引起多种疾病。在自噬的核心机制中,自噬体的形成一个复杂而保守的过程,其中,LC3(酵母中ATG8的人类同源)对于自噬体的形成起着至关重要的作用,其关系到自噬体膜的弯曲、自噬底物的募集的过程,是自噬过程中唯一一直定位于自噬体膜的蛋白质。除了影响到自噬体膜的弯曲外,LC3决定了需要募集到自噬体内并降解的细胞内容物,其通过一个保守的模体,即LIR(LC3interactionregion,亦称AIM,ATG8interactionmotif)模体来识别和特异性的选择底物。研究表明,几乎所有LIR模体都符合[W/Y/F]XX[L/I/V]的序列模式。这一序列模式的改变或是周围氨基酸微环境的改变,都将有可能影响到LC3与底物的结合进而影响到细胞自噬的过程。影响LIR功能的一大因素是癌症突变。目前,主流提供癌症突变信息的数据库有TCGA,ICGC,ClinVar,COSMIC等等。对于LIR,目前尚缺乏系统性的研究。2014年,IoannaKalvari等人开发了在线服务平台iLIR并于2016 ...
【技术保护点】
1.一种分析预测癌症突变影响LIR模体功能的方法,其特征在于,包括以下步骤:(1)利用LIR模体数据训练预测模型;该模型用于以LIR模体数据作为参照物评价某一肽段数据与这些参照物之间的相似度分数;(2)利用所述步骤(1)得到的预测模型,基于生物的正常蛋白质序列和该生物的癌症突变的肽段数据,对突变前后的肽段数据与所述LIR模体数据之间的相似度分别打分;(3)利用所述步骤(1)得到的预测模型对候选肽段的肽段数据进行打分,并计算得出打分结果与该候选肽段对应的肽段数据其属于真实LIR模体或非真实LIR模体的贝叶斯概率之间的关系;接着,将癌症突变前后对应的肽段分别作为候选肽段,并将所述步骤(2)得到的对应打分结果代入,从而得到所述癌症突变前后对应的肽段它们的贝叶斯概率;(4)接着,利用所述步骤(3)得出的所述癌症突变前后对应的肽段它们的贝叶斯概率进一步计算该癌症突变对于LIR功能的若干种可选影响方式的概率,进而判断得出该癌症突变对于LIR功能的最终影响方式。
【技术特征摘要】
1.一种分析预测癌症突变影响LIR模体功能的方法,其特征在于,包括以下步骤:(1)利用LIR模体数据训练预测模型;该模型用于以LIR模体数据作为参照物评价某一肽段数据与这些参照物之间的相似度分数;(2)利用所述步骤(1)得到的预测模型,基于生物的正常蛋白质序列和该生物的癌症突变的肽段数据,对突变前后的肽段数据与所述LIR模体数据之间的相似度分别打分;(3)利用所述步骤(1)得到的预测模型对候选肽段的肽段数据进行打分,并计算得出打分结果与该候选肽段对应的肽段数据其属于真实LIR模体或非真实LIR模体的贝叶斯概率之间的关系;接着,将癌症突变前后对应的肽段分别作为候选肽段,并将所述步骤(2)得到的对应打分结果代入,从而得到所述癌症突变前后对应的肽段它们的贝叶斯概率;(4)接着,利用所述步骤(3)得出的所述癌症突变前后对应的肽段它们的贝叶斯概率进一步计算该癌症突变对于LIR功能的若干种可选影响方式的概率,进而判断得出该癌症突变对于LIR功能的最终影响方式。2.如权利要求1所述分析预测癌症突变影响LIR模体功能的方法,其特征在于,所述步骤(1)中,所述LIR模体数据为多个LIR模体数据,任意一个LIR模体数据包括14个氨基酸,这14个氨基酸由核心LIR模体的4个氨基酸、以及该核心LIR模体左侧的6个氨基酸和右侧的4个氨基酸构成。3.如权利要求1所述分析预测癌症突变影响LIR模体功能的方法,其特征在于,所述步骤(2)中,所述生物的正常蛋白质序列为人类全蛋白质序列,所述生物的癌症突变的肽段数据为人类癌症突变的肽段数据。4.如权利要求1所述分析预测癌症突变影响LIR模体功能的方法,其特征在于,所述步骤(3)是先以LIR模体数据作为阳性数据,以与所述阳性数据中任意一个LIR模体数据出现在同一条蛋白上且符合[W/Y/F]XX[L/I/V]序列模式但未被所述阳性数据涵盖的肽段数据作为阴性数据,通过对阳性数据打分所得分值、以及阴性数据打分所得分值分别进行拟合正态分布,从而分别得到阳性数据和阴性数据分值分布的概率密度函数pdf_p和pdf_n,从而进一步在所述步骤(3)中基于阳性数据分...
【专利技术属性】
技术研发人员:薛宇,邓万锟,贾大,
申请(专利权)人:华中科技大学,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。