基于国产超算平台的蛋白质-配体亲和力评价方法技术

技术编号:39860771 阅读:17 留言:0更新日期:2023-12-30 12:55
本发明专利技术提供一种基于国产超算平台的蛋白质

【技术实现步骤摘要】
基于国产超算平台的蛋白质

配体亲和力评价方法


[0001]本专利技术涉及高性能计算
,更具体的说,本专利技术涉及一种基于国产超算平台的蛋白质

配体亲和力评价方法


技术介绍

[0002]超级计算机是衡量一个国家科技发展水平和综合国力的重要标志,其具有功能强,运算速度快,存储容量大的特点,支持大型复杂应用课题的计算,可广泛应用于医疗领域及高科技领域

近年来,以“神威
·
太湖之光”为代表的国产超级计算机发展迅速,“神威
·
太湖之光”是世界上首次性能超过
100PFlops
的超级计算机

[0003]超级计算机在医疗领域尤其是药物虚拟筛选领域具有重要作用,其中蛋白质

配体亲和力评价是药物虚拟筛选及药物开发过程中的关键阶段,准确高效的蛋白质

配体亲和力评价将大大降低药物的开发周期和开发成本

目前基于超级计算机的蛋白质

配体亲和力本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于国产超算平台的蛋白质

配体亲和力评价方法,其特征在于,包括:国产超算生产环境的搭建步骤包括:编译深度学习模型运行所需要的依赖库,并完成对
SWPyTorch
的框架配置;深度学习模型的设计与实现步骤包括:构建一基于蛋白质

配体亲和力评价数据集的所述深度学习模型,基于
X86
平台下的
PyTorch
框架对所述深度学习模型进行模型实现,完成模型实现后进行模型移植,将所述深度学习模型移植至国产超算平台;深度学习模型的并行优化步骤包括:基于所述国产超算平台,从数据并行

计算并行

通信并行

算子库优化及
SWPyTorch
多节点并行对所述深度学习模型进行优化;作业提交与运行步骤包括:配置所述国产超算平台的计算节点资源,激活所述国产超算平台的依赖环境,提交运行作业
。2.
根据权利要求1所述基于国产超算平台的蛋白质

配体亲和力评价方法,其特征在于,所述深度学习模型采用基于
Bi

LSTM
神经网络融合
Attention
机制的模型
。3.
根据权利要求2所述基于国产超算平台的蛋白质

配体亲和力评价方法,其特征在于,所述大规模蛋白质

配体亲和力评价数据集包含
3420
万蛋白质

配体相互作用数据,主要涵盖蛋白质

化合物相互作用数据及蛋白质

蛋白质相互作用数据,还包括蛋白质和化合物的结构序列数据,所述结构序列数据的亲和力特征包括药效团

分子骨架

疏水基团

水溶性及脂溶性
。4.
根据权利要求3所述基于国产超算平台的蛋白质

配体亲和力评价方法,其特征在于,所述基于
Bi

LSTM
神经网络融合
attention
机制的模型结构包括:输入蛋白质及化合物的结构序列数据后,经
word2vec
向量化处理得到词嵌入向量;将所述词嵌入向量输入卷积层进行多次卷积操作,得到特征序列;将所述特征序列输入
Bi

LSTM
神经网络结构,所述
Bi

LSTM
神经网络结构输出的特征信息作为
attention
机制层的输入;所述特征信息经过所述
attention
机制层处理,对所述特征信息的权重进行调整,得到涵盖分子特殊结构特征的文本表示;对所述文本表示进行整合得到综合文本表示,将所述综合文本表示作为
Softmax
分类器的输入;通过所述
Softmax
分类器对蛋白质

配体间的亲和力进行分类后,获得蛋白质

配体间的亲和力评价结果
。5.
根据权利要求1所述基于国产超算平台的蛋白质

配体亲和力评价方法,其特征在于,所述依赖库包括
13

Python
库,包括:
torch、torc...

【专利技术属性】
技术研发人员:陈溟谭华苏亮杨帅
申请(专利权)人:青岛国实科技集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1