基于AI改进的基因设计方法及平台技术

技术编号:41755779 阅读:25 留言:0更新日期:2024-06-21 21:38
本发明专利技术公开了基于AI改进的基因设计方法及平台,属于合成生物领域,包括:分别建立基因和蛋白质的本地数据库;建立专业文献数据库;基因设计或者样品采样自动选取;将设计的基因序或选取的样品进行氨基酸序列比对,建立氨基酸序列数据集;将得到的氨基酸序列进行蛋白质结构功能预测。本发明专利技术基于大模型的一体化科研平台,打通从数据集收集和准备、基因序列数输入和优化处理、同源氨基酸序列和结构模型训练、氨基酸序列蛋白质结构预测、蛋白功能试验数据接入、蛋白质功能验证到优化调整的完整闭环,建立完整的科研体系。

【技术实现步骤摘要】

本专利技术涉及合成生物领域,尤其涉及基于ai改进的基因设计方法及平台。


技术介绍

1、目前在分子生物学、合成生物学科研领域,需要对设计的基因序列以及提取的宏基因组序列样本需要依次进行解读比对、基因转录成mrna、mrna翻译成氨基酸序列、确认基因序列对应的蛋白质功能是否是需要的等环节,各环节的实现需要基因库作为数据基础,目前,常见基因库有人类基因库grch38、小鼠基因库mm10、ncbi等,ncbi、pdb、uniprot、interpro、dsemr、biox finder、pfam等蛋白库以及相关的专业数据库,数据量在t以上,而且还有专业文献库和期刊数据库等。

2、在上述的各个环节也有相应的各种开源软件,比如trimmomatic用于宏基因组数据的质量控制、bowtie2用于基因数据比对、megahit用于基因组装、me tawrap用于基因数据分箱、jackhmmer用于同源蛋白质比对、pdbfixer用于蛋白质数据修复、hhsuite用于蛋白质功能搜索、alphafold、esmfold用于蛋白质结构预测。

3、现有技术的本文档来自技高网...

【技术保护点】

1.基于AI改进的基因设计方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基因设计方法,其特征在于,所述分别建立基因和蛋白质的本地数据库,包括以下步骤:

3.根据权利要求2所述的基因设计方法,其特征在于,所述步骤S13包括:

4.根据权利要求1所述的基因设计方法,其特征在于,所述建立专业文献数据库,包括以下步骤:

5.根据权利要求1所述的基因设计方法,其特征在于,所述基因设计或者样品采样自动选取,包括:

6.根据权利要求1所述的基因设计方法,其特征在于,所述步骤S4包括:

7.根据权利要求1所述的基因设计方...

【技术特征摘要】

1.基于ai改进的基因设计方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基因设计方法,其特征在于,所述分别建立基因和蛋白质的本地数据库,包括以下步骤:

3.根据权利要求2所述的基因设计方法,其特征在于,所述步骤s13包括:

4.根据权利要求1所述的基因设计方法,其特征在于,所述建立专业文献数据库,包括以下步骤:

5.根据权利要求1所述的基因设计方法,其特征在于,所述基因设计或者样品采样自动选取,包括:

6.根据权利要求1所述的基因设计方法,其特征在于,所述步骤s4...

【专利技术属性】
技术研发人员:李进
申请(专利权)人:成汤碳能成都科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1