【技术实现步骤摘要】
本专利技术属于合成生物,具体涉及一种多模态指令指导的蛋白质设计方法和装置。
技术介绍
1、利用深度学习技术辅助蛋白质设计的任务受到越来越多从业者的关注。蛋白质设计是合成生物学新兴的重要分支和前沿学科,深度学习技术在辅助蛋白质设计中发挥了不可忽视的作用,为合成生物学研究提供更大的助力。蛋白质是生物体内的大分子,有复杂的一级、二级和三级结构,发挥着多种多样的生物功能。生物学中常用蛋白质序列作为蛋白质的描述,而蛋白质序列是由20种天然氨基酸组成的线性链,长度为几十到数千个氨基酸不等。蛋白质设计基于生物学原理和计算机模拟技术,旨在设计出具有新结构和新活性的蛋白质分子,推动生物技术和医药领域的发展。然而,传统蛋白质设计的设计空间有限,往往只能基于已知的蛋白质序列进行设计,生成的结果与已有蛋白质重合度较高,难以探索更广阔的全新蛋白质结构。为弥补传统蛋白质设计的局限性,利用当前热点的深度学习技术辅助蛋白质设计是一项具有重大现实意义的工作。
2、深度学习辅助蛋白质设计是一种生成任务,把输入的指令数据作为生成条件,在其指导下生成对应的目标数据
...【技术保护点】
1.一种多模态指令指导的蛋白质设计方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的多模态指令指导的蛋白质设计方法,其特征在于,单个样本中,文字指令通过自然语言描述了蛋白质的至少一种属性,蛋白质序列对应性地拥有所描述的至少一种属性,且由几十到数千个氨基酸组成。
3.根据权利要求1所述的多模态指令指导的蛋白质设计方法,其特征在于,利用预训练好的SciBERT编码器将文字指令转换成文字形式的生成条件作为一个模态指令。
4.根据权利要求1所述的多模态指令指导的蛋白质设计方法,其特征在于,利用预训练好的高斯分布模型进行跨模态转换,把
...【技术特征摘要】
1.一种多模态指令指导的蛋白质设计方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的多模态指令指导的蛋白质设计方法,其特征在于,单个样本中,文字指令通过自然语言描述了蛋白质的至少一种属性,蛋白质序列对应性地拥有所描述的至少一种属性,且由几十到数千个氨基酸组成。
3.根据权利要求1所述的多模态指令指导的蛋白质设计方法,其特征在于,利用预训练好的scibert编码器将文字指令转换成文字形式的生成条件作为一个模态指令。
4.根据权利要求1所述的多模态指令指导的蛋白质设计方法,其特征在于,利用预训练好的高斯分布模型进行跨模态转换,把文字形式的生成条件转换为蛋白形式的生成条件作为另一模态指令。
5.根据权利要求1所述的多模态指令指导的蛋白质设计方法,其特征在于,多模态融合器融合多模态指令的过程包括:
6.根据权利要求1所述的多模态指令指导的蛋白质设计方法,其特征在于,解码器包括至少2个transformer d...
【专利技术属性】
技术研发人员:吴健,周寒靖,殷铭泽,应豪超,徐红霞,
申请(专利权)人:浙江大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。