【技术实现步骤摘要】
本专利技术涉及生物信息,具体而言,涉及一种蛋白质序列生成方法、装置、系统及存储介质。
技术介绍
1、蛋白质设计作为生物技术和生物工程领域的重要研究方向,旨在通过人工手段创造出具有特定功能的蛋白质序列,以满足生物医药、工业酶应用等多方面的需求。这一领域的发展不仅依赖于对蛋白质结构与功能关系的深入理解,还涉及到多种跨学科的技术与方法。蛋白质是生命活动的主要执行者,其功能由其三维结构决定,而三维结构又由其氨基酸序列决定。因此,设计出具有特定功能的蛋白质序列,本质上是通过控制氨基酸序列来实现对蛋白质功能的调控。这一过程需要综合考虑生物化学、分子生物学、计算科学等多个学科的知识和技术。
2、在蛋白质设计领域,现有的技术方案主要包括基于物理化学原理的方法、统计学方法以及基于深度学习的端对端方法。基于物理化学原理的方法通过考虑氨基酸的极性、疏水性等化学物理特性来设计蛋白质序列,这种方法理论基础坚实,但由于需要综合考虑众多因素,计算量巨大,且往往难以获得理想的设计结果。统计学方法则利用已知蛋白质序列的数据集,通过统计学分析来预测并设计具有目
...【技术保护点】
1.一种蛋白质序列生成方法,其特征在于,包括:
2.如权利要求1所述蛋白质序列生成方法,其特征在于,所述获取待分析蛋白质序列,包括:
3.如权利要求1所述蛋白质序列生成方法,其特征在于,所述基于所述序列数据集中的所述待分析蛋白质序列,构建不同功能属性的多属性条件向量,包括:
4.如权利要求3所述蛋白质序列生成方法,其特征在于,所述利用训练好的属性预测模型对所述序列数据集中的所述待分析蛋白质序列进行预测,获得属性标签,包括:
5.如权利要求1所述蛋白质序列生成方法,其特征在于,所述通过训练得到训练好的所述蛋白质序列生成模型
...
【技术特征摘要】
1.一种蛋白质序列生成方法,其特征在于,包括:
2.如权利要求1所述蛋白质序列生成方法,其特征在于,所述获取待分析蛋白质序列,包括:
3.如权利要求1所述蛋白质序列生成方法,其特征在于,所述基于所述序列数据集中的所述待分析蛋白质序列,构建不同功能属性的多属性条件向量,包括:
4.如权利要求3所述蛋白质序列生成方法,其特征在于,所述利用训练好的属性预测模型对所述序列数据集中的所述待分析蛋白质序列进行预测,获得属性标签,包括:
5.如权利要求1所述蛋白质序列生成方法,其特征在于,所述通过训练得到训练好的所述蛋白质序列生成模型,包括:
6.如权利要求5所述蛋白质序列生成方法,其特征在于,所述重建损失的计算方法为:
7.如权利要求5所述蛋白质序列生成方法,其特征在于,所述利用多属性条件向量对生成过程进行引导,生成基于目标属性的目标蛋白质序列,包括:
8.如权利要求7所述蛋白质序列生成方法,其特征在于,所述状态转移概率的计...
【专利技术属性】
技术研发人员:唐可馨,丁灏,陆遥遥,
申请(专利权)人:上海图灵智算量子科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。