一种蛋白质序列生成方法、装置、系统及存储介质制造方法及图纸

技术编号:46602364 阅读:0 留言:0更新日期:2025-10-10 21:33
本发明专利技术提供一种蛋白质序列生成方法、装置、系统及存储介质,涉及生物信息技术领域。所述生成方法包括:获取待分析蛋白质序列并构建序列数据集;构建不同功能属性的多属性条件向量;构建蛋白质序列生成模型;将序列数据集中的待分析蛋白质序列编码为离散表示后输入至蛋白质序列生成模型中;利用多属性条件向量对生成过程进行引导生成基于目标属性的目标蛋白质序列。所述蛋白质序列生成方法利用离散扩散模型和多属性条件向量,实现了精准的功能控制和结构优化,降低了实验成本和时间。同时,支持多种功能属性联合优化,具备高度的灵活性和实用性,为蛋白质工程提供了高效的技术支持,加速了新型蛋白质的开发。

【技术实现步骤摘要】

本专利技术涉及生物信息,具体而言,涉及一种蛋白质序列生成方法、装置、系统及存储介质


技术介绍

1、蛋白质设计作为生物技术和生物工程领域的重要研究方向,旨在通过人工手段创造出具有特定功能的蛋白质序列,以满足生物医药、工业酶应用等多方面的需求。这一领域的发展不仅依赖于对蛋白质结构与功能关系的深入理解,还涉及到多种跨学科的技术与方法。蛋白质是生命活动的主要执行者,其功能由其三维结构决定,而三维结构又由其氨基酸序列决定。因此,设计出具有特定功能的蛋白质序列,本质上是通过控制氨基酸序列来实现对蛋白质功能的调控。这一过程需要综合考虑生物化学、分子生物学、计算科学等多个学科的知识和技术。

2、在蛋白质设计领域,现有的技术方案主要包括基于物理化学原理的方法、统计学方法以及基于深度学习的端对端方法。基于物理化学原理的方法通过考虑氨基酸的极性、疏水性等化学物理特性来设计蛋白质序列,这种方法理论基础坚实,但由于需要综合考虑众多因素,计算量巨大,且往往难以获得理想的设计结果。统计学方法则利用已知蛋白质序列的数据集,通过统计学分析来预测并设计具有目标功能的新序列,例如本文档来自技高网...

【技术保护点】

1.一种蛋白质序列生成方法,其特征在于,包括:

2.如权利要求1所述蛋白质序列生成方法,其特征在于,所述获取待分析蛋白质序列,包括:

3.如权利要求1所述蛋白质序列生成方法,其特征在于,所述基于所述序列数据集中的所述待分析蛋白质序列,构建不同功能属性的多属性条件向量,包括:

4.如权利要求3所述蛋白质序列生成方法,其特征在于,所述利用训练好的属性预测模型对所述序列数据集中的所述待分析蛋白质序列进行预测,获得属性标签,包括:

5.如权利要求1所述蛋白质序列生成方法,其特征在于,所述通过训练得到训练好的所述蛋白质序列生成模型,包括:

...

【技术特征摘要】

1.一种蛋白质序列生成方法,其特征在于,包括:

2.如权利要求1所述蛋白质序列生成方法,其特征在于,所述获取待分析蛋白质序列,包括:

3.如权利要求1所述蛋白质序列生成方法,其特征在于,所述基于所述序列数据集中的所述待分析蛋白质序列,构建不同功能属性的多属性条件向量,包括:

4.如权利要求3所述蛋白质序列生成方法,其特征在于,所述利用训练好的属性预测模型对所述序列数据集中的所述待分析蛋白质序列进行预测,获得属性标签,包括:

5.如权利要求1所述蛋白质序列生成方法,其特征在于,所述通过训练得到训练好的所述蛋白质序列生成模型,包括:

6.如权利要求5所述蛋白质序列生成方法,其特征在于,所述重建损失的计算方法为:

7.如权利要求5所述蛋白质序列生成方法,其特征在于,所述利用多属性条件向量对生成过程进行引导,生成基于目标属性的目标蛋白质序列,包括:

8.如权利要求7所述蛋白质序列生成方法,其特征在于,所述状态转移概率的计...

【专利技术属性】
技术研发人员:唐可馨丁灏陆遥遥
申请(专利权)人:上海图灵智算量子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1