一种基于并行和张量分块的AlphaFold推理高性能实现方法技术

技术编号:36702778 阅读:30 留言:0更新日期:2023-03-01 09:21
本发明专利技术公开了一种基于并行和张量分块的AlphaFold推理高性能实现方法,包括前处理部分和推理部分;所述前处理部分包括如下步骤:基于Ray的数据前处理并行策略;对于多条氨基酸序列的蛋白质复合物结构预测;所述推理部分包括如下步骤:优化的动态轴并行;自动张量分组;显存共享。本发明专利技术前处理部分:单条氨基酸序列的前处理速度为约原方法前处理速度的3倍;推理部分:能够更好地发挥GPU平台的性能,提高推理速度;可以有效地降低计算所需的显存,从而支持更长的输入氨基酸序列。而支持更长的输入氨基酸序列。而支持更长的输入氨基酸序列。

【技术实现步骤摘要】
一种基于并行和张量分块的AlphaFold推理高性能实现方法


[0001]本专利技术涉及人工智能
,尤其涉及一种基于并行和张量分块的AlphaFold推理高性能实现方法。

技术介绍

[0002]蛋白质是构成生命的基础,蛋白质的结构能够帮助我们理解其功能。由于使用传统的实验方法解出一个蛋白的结构可能需要花费数月甚至数年的时间,目前人类掌握的蛋白质结构仅有10万种左右,这在数以十亿计的的已知氨基酸序列中只占一小部分。
[0003]随着深度学习的发展,研究者们在积极探索使用深度学习进行蛋白质结构推理,其中的佼佼者是由DeepMind提出的AlphaFold。目前AlphaFold的推理结果已经达到了原子精度。但由于推理速度较慢且对于GPU显存要求较高,AlphaFold在工业上落地还并不成熟。
[0004]AlphaFold是由DeepMind公司针对蛋白质结构预测任务提出的深度学习模型。2018年,DeepMind首次提出了基于卷积神经网络的AlphaFold;在2020年,受Transformer模型启发,DeepMind提本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于并行和张量分块的AlphaFold推理高性能实现方法,其特征在于,包括前处理部分和推理部分;所述前处理部分包括如下步骤:S11基于Ray的数据前处理并行策略:在单条氨基酸序列的前处理过程中,只有极少数数据库搜索之前存在依赖关系,使用Ray将不存在依赖关系的数据库搜索之间实现了并行;S12对于多条氨基酸序列的蛋白质复合物结构预测:将每一条氨基酸序列作为一个工作流,每一个工作流下又分出多条工作流进行序列内前处理并行;所述推理部分包括如下步骤:S21优化的动态轴并行:在模型推理的过程中,主要由Embedding,Evoformer和Structure Module组成,将动态轴并行扩展到了AlphaFold模型的全...

【专利技术属性】
技术研发人员:程盛淦路广阳赵轩磊马千里方佳瑞李升桂卞正达李永彬柳泓鑫麦思琪刘育良黄海晨娄宇轩吴俊铭陈巍文
申请(专利权)人:北京潞晨科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1