基于蛋白质语言模型的非模式物种代谢模型自动构建方法技术

技术编号:44851569 阅读:41 留言:0更新日期:2025-04-01 19:45
一种基于蛋白质语言模型的非模式物种代谢模型自动构建方法,采用了基于预训练大模型的基因同源关系推断方法,与蛋白质序列比对方法相结合,构建得到不同物种的基因同源关系;以模式生物的GEMs为模板,基于基因同源关系与非同源基因注释结果构建非模式生物的GEMs,再经反应缺口填补(gap filling)实现代谢模型结构优化。本发明专利技术能够显著提高基因同源关系的准确性,提高非模式生物GEMs构建速度、质量以及最终模型的预测性能。

【技术实现步骤摘要】

本专利技术涉及的是一种基因工程领域的技术,具体是一种利用预训练大模型技术获取基因同源关系以自动化构建非模式物种高精度基因组尺度代谢网络模型(genome-scalemetabolic networkmodel,gems)自动构建方法。


技术介绍

1、基于基因组注释信息的细胞代谢网络模型是系统生物学和代谢工程领域的重要研究工具。目前,新测序物种模型构建中基因的同源认定基本仅通过以blast为代表的序列比对方法进行。但由于基于序列的比对方法对基因的远缘同源关系的搜索能力差,无法准确对基因功能进行注释,当前大多数自动化建模工具构建的代谢模型的质量不佳,预测精度不足,无法满足人们对代谢模型精准预测能力的需求。


技术实现思路

1、本专利技术针对现有技术无法有效识别由结构相似性带来的蛋白质同源关系,造成细胞代谢网络模型质量差、预测精度低以及构建模型所需成本高等不足,提出一种基于蛋白质语言模型的非模式物种代谢模型自动构建方法,采用blast序列比对和预训练深度学习模型相结合的方法对细胞中所有蛋白质进行同源比对,并且整合多种本文档来自技高网...

【技术保护点】

1.一种基于蛋白质语言模型的非模式物种代谢模型自动构建方法,其特征在于,采用基于预训练大模型的基因同源关系推断方法,与蛋白质序列比对方法相结合,构建得到不同物种的基因同源关系;以模式生物的GEMs为模板,基于基因同源关系与非同源基因注释结果构建非模式生物的GEMs,再经反应缺口填补(gap filling)实现代谢模型结构优化。

2.根据权利要求1所述的基于蛋白质语言模型的非模式物种代谢模型自动构建方法,其特征是,所述的传统蛋白质序列比对方法是指利用双向blast比对(BBH)对目标菌株和参考菌株的基因组进行基因同源关系比对,并基于Identity,Coverage和和是否存...

【技术特征摘要】

1.一种基于蛋白质语言模型的非模式物种代谢模型自动构建方法,其特征在于,采用基于预训练大模型的基因同源关系推断方法,与蛋白质序列比对方法相结合,构建得到不同物种的基因同源关系;以模式生物的gems为模板,基于基因同源关系与非同源基因注释结果构建非模式生物的gems,再经反应缺口填补(gap filling)实现代谢模型结构优化。

2.根据权利要求1所述的基于蛋白质语言模型的非模式物种代谢模型自动构建方法,其特征是,所述的传统蛋白质序列比对方法是指利用双向blast比对(bbh)对目标菌株和参考菌株的基因组进行基因同源关系比对,并基于identity,coverage和和是否存在双向最佳匹配来对比对结果进行筛选,得到基于序列的直系同源关系。

3.根据权利要求1所述的基于蛋白质语言模型的非模式物种代谢模型自动构建方法,其特征是,所述的基于预训练大模型的同源比对方法是指:已发表的基于esm-1b大模型的深度学习模型-plmsearch,其采用双线性映射神经网络对预训练大模型的输出进行微调,该模型在scope等公开的同源蛋白数据库上进行训练,模型接受两个蛋白质序列作为输入,输出两蛋白质之间的相似度用于评估基因同源关系的远近。

4.根据权利要求1所述的基于蛋白质语言模型的非模式物种代谢模型自动构建方法,其特征是,所述的基于预训练大模型的基因同源关系推断方法与传统的蛋白质序列比对方法相结合是指:采用plmsearch模型,进行基于序列信息的蛋白同源关系比对,并选定阈值筛选比对结果;随后对基于深度学习获取的同源关系中的蛋白进行两两之间的blast比对,筛选去除identity和coverage过低的同源关系;随后基于深度学习获取的同源关系与基于双向blast比对获得的基因同源关系整合得到完整的目标菌株相对于参考菌株的基因同源关系。

5.根据权利要求1所述的基于蛋白质语言模型的非模式物种代谢模型自动构建方法,其特征是,所述的非同源基因注释方法为整合多种蛋白功能注释工具,包括eggnog-mapper、clean、deepectransformer和基于rhea数据库蛋白序列的plmse...

【专利技术属性】
技术研发人员:鲁洪中肖陆驰韩伟赏孙浩成
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1