基于机器学习的错义突变影响相分离预测方法及设备技术

技术编号:41801600 阅读:25 留言:0更新日期:2024-06-24 20:23
本发明专利技术涉及一种基于机器学习的错义突变影响相分离预测方法及设备,所述方法包括以下步骤:获取待识别错义突变,将所述待识别错义突变转化为特征向量;将所述特征向量作为经训练的PSMutPred机器学习模型的输入,获取待识别错义突变是否影响相分离的预测结果和/或待识别错义突变对相分离影响方向的预测结果;所述特征向量包括突变位点的IDR相关特征、突变位点的预测pi‑接触频率和突变位点的理化特征。与现有技术相比,本发明专利技术具有预测准确度高、能够同时预测影响及影响趋势等优点。

【技术实现步骤摘要】

本专利技术涉及蛋白质信息处理,尤其是涉及一种基于机器学习的错义突变影响相分离预测方法及设备


技术介绍

1、大约25%的疾病相关错义突变位于对应蛋白质的内在无序区域(idr),大约63%的人类蛋白质存在idr。然而,由于缺乏固定的三级结构和有限的进化保守性,研究idr的突变具有挑战性。因此,这些idr突变通常被注释为意义不明突变(vus),使得评估和预测其对疾病的功能影响变得困难。llps是一种分子分离成受限流体相的物理化学过程,idr在调节液-液相分离(llps)中发挥着至关重要的作用。。idr驱动的相分离导致形成称为凝聚物的无膜细胞器,这些凝聚物包括细胞核中的核仁和转录工厂、应激颗粒等。这些凝聚物在各种生物过程中发挥着重要作用,例如染色质调节、转录调节、突触组织和信号转导控制。研究表明,idr中的错义突变可以通过改变相分离来扰乱蛋白质功能。idr中的这些错义突变会影响idr构象、分子内相互作用和分子间蛋白质-蛋白质相互作用,导致异常的凝聚体形成。idr中的此类错义突变也可能导致自然相分离的损失或增益,从而导致错位或功能丧失。值得注意的是,不必要的相分离本文档来自技高网...

【技术保护点】

1.一种基于机器学习的错义突变影响相分离预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于机器学习的错义突变影响相分离预测方法,其特征在于,所述PSMutPred机器学习模型包括影响预测子模型和加强/弱化预测子模型。

3.根据权利要求2所述的基于机器学习的错义突变影响相分离预测方法,其特征在于,所述影响预测子模型和加强/弱化预测子模型均基于多个基础模型构建,基于各基础模型的平均输出值获得预测结果。

4.根据权利要求3所述的基于机器学习的错义突变影响相分离预测方法,其特征在于,所述基础模型包括随机森林分类器、支持向量回归分类器和逻辑回归分...

【技术特征摘要】

1.一种基于机器学习的错义突变影响相分离预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于机器学习的错义突变影响相分离预测方法,其特征在于,所述psmutpred机器学习模型包括影响预测子模型和加强/弱化预测子模型。

3.根据权利要求2所述的基于机器学习的错义突变影响相分离预测方法,其特征在于,所述影响预测子模型和加强/弱化预测子模型均基于多个基础模型构建,基于各基础模型的平均输出值获得预测结果。

4.根据权利要求3所述的基于机器学习的错义突变影响相分离预测方法,其特征在于,所述基础模型包括随机森林分类器、支持向量回归分类器和逻辑回归分类器中的多个。

5.根据权利要求2所述的基于机器学习的错义突变影响相分离预测方法,其特征在于,所述psmutpred机器学习模型训练时,分别对影响预测子模型和加强/弱化预测子模型进行独立训练,

6.根据权利要求5所述的基于机器学习的错义突变影响相分离预测方法,其特征在于,所述影响预测子模型训练时采用的数据集中,所述“背景”样本的数量至少为“影响”样本的数量的两倍。

【专利技术属性】
技术研发人员:石毅冯莫凡陆青贺光
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1