【技术实现步骤摘要】
本专利技术涉及蛋白质信息处理,尤其是涉及一种基于机器学习的错义突变影响相分离预测方法及设备。
技术介绍
1、大约25%的疾病相关错义突变位于对应蛋白质的内在无序区域(idr),大约63%的人类蛋白质存在idr。然而,由于缺乏固定的三级结构和有限的进化保守性,研究idr的突变具有挑战性。因此,这些idr突变通常被注释为意义不明突变(vus),使得评估和预测其对疾病的功能影响变得困难。llps是一种分子分离成受限流体相的物理化学过程,idr在调节液-液相分离(llps)中发挥着至关重要的作用。。idr驱动的相分离导致形成称为凝聚物的无膜细胞器,这些凝聚物包括细胞核中的核仁和转录工厂、应激颗粒等。这些凝聚物在各种生物过程中发挥着重要作用,例如染色质调节、转录调节、突触组织和信号转导控制。研究表明,idr中的错义突变可以通过改变相分离来扰乱蛋白质功能。idr中的这些错义突变会影响idr构象、分子内相互作用和分子间蛋白质-蛋白质相互作用,导致异常的凝聚体形成。idr中的此类错义突变也可能导致自然相分离的损失或增益,从而导致错位或功能丧失。值得注意
...【技术保护点】
1.一种基于机器学习的错义突变影响相分离预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于机器学习的错义突变影响相分离预测方法,其特征在于,所述PSMutPred机器学习模型包括影响预测子模型和加强/弱化预测子模型。
3.根据权利要求2所述的基于机器学习的错义突变影响相分离预测方法,其特征在于,所述影响预测子模型和加强/弱化预测子模型均基于多个基础模型构建,基于各基础模型的平均输出值获得预测结果。
4.根据权利要求3所述的基于机器学习的错义突变影响相分离预测方法,其特征在于,所述基础模型包括随机森林分类器、支持向量回
...【技术特征摘要】
1.一种基于机器学习的错义突变影响相分离预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于机器学习的错义突变影响相分离预测方法,其特征在于,所述psmutpred机器学习模型包括影响预测子模型和加强/弱化预测子模型。
3.根据权利要求2所述的基于机器学习的错义突变影响相分离预测方法,其特征在于,所述影响预测子模型和加强/弱化预测子模型均基于多个基础模型构建,基于各基础模型的平均输出值获得预测结果。
4.根据权利要求3所述的基于机器学习的错义突变影响相分离预测方法,其特征在于,所述基础模型包括随机森林分类器、支持向量回归分类器和逻辑回归分类器中的多个。
5.根据权利要求2所述的基于机器学习的错义突变影响相分离预测方法,其特征在于,所述psmutpred机器学习模型训练时,分别对影响预测子模型和加强/弱化预测子模型进行独立训练,
6.根据权利要求5所述的基于机器学习的错义突变影响相分离预测方法,其特征在于,所述影响预测子模型训练时采用的数据集中,所述“背景”样本的数量至少为“影响”样本的数量的两倍。
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。