【技术实现步骤摘要】
基于国产超算平台的蛋白质
‑
配体亲和力评价方法
[0001]本专利技术涉及高性能计算
,更具体的说,本专利技术涉及一种基于国产超算平台的蛋白质
‑
配体亲和力评价方法
。
技术介绍
[0002]超级计算机是衡量一个国家科技发展水平和综合国力的重要标志,其具有功能强,运算速度快,存储容量大的特点,支持大型复杂应用课题的计算,可广泛应用于医疗领域及高科技领域
。
近年来,以“神威
·
太湖之光”为代表的国产超级计算机发展迅速,“神威
·
太湖之光”是世界上首次性能超过
100PFlops
的超级计算机
。
[0003]超级计算机在医疗领域尤其是药物虚拟筛选领域具有重要作用,其中蛋白质
‑
配体亲和力评价是药物虚拟筛选及药物开发过程中的关键阶段,准确高效的蛋白质
‑
配体亲和力评价将大大降低药物的开发周期和开发成本
。
目前基于超级计算机的蛋白质
‑ ...
【技术保护点】
【技术特征摘要】
1.
一种基于国产超算平台的蛋白质
‑
配体亲和力评价方法,其特征在于,包括:国产超算生产环境的搭建步骤包括:编译深度学习模型运行所需要的依赖库,并完成对
SWPyTorch
的框架配置;深度学习模型的设计与实现步骤包括:构建一基于蛋白质
‑
配体亲和力评价数据集的所述深度学习模型,基于
X86
平台下的
PyTorch
框架对所述深度学习模型进行模型实现,完成模型实现后进行模型移植,将所述深度学习模型移植至国产超算平台;深度学习模型的并行优化步骤包括:基于所述国产超算平台,从数据并行
、
计算并行
、
通信并行
、
算子库优化及
SWPyTorch
多节点并行对所述深度学习模型进行优化;作业提交与运行步骤包括:配置所述国产超算平台的计算节点资源,激活所述国产超算平台的依赖环境,提交运行作业
。2.
根据权利要求1所述基于国产超算平台的蛋白质
‑
配体亲和力评价方法,其特征在于,所述深度学习模型采用基于
Bi
‑
LSTM
神经网络融合
Attention
机制的模型
。3.
根据权利要求2所述基于国产超算平台的蛋白质
‑
配体亲和力评价方法,其特征在于,所述大规模蛋白质
‑
配体亲和力评价数据集包含
3420
万蛋白质
‑
配体相互作用数据,主要涵盖蛋白质
‑
化合物相互作用数据及蛋白质
‑
蛋白质相互作用数据,还包括蛋白质和化合物的结构序列数据,所述结构序列数据的亲和力特征包括药效团
、
分子骨架
、
疏水基团
、
水溶性及脂溶性
。4.
根据权利要求3所述基于国产超算平台的蛋白质
‑
配体亲和力评价方法,其特征在于,所述基于
Bi
‑
LSTM
神经网络融合
attention
机制的模型结构包括:输入蛋白质及化合物的结构序列数据后,经
word2vec
向量化处理得到词嵌入向量;将所述词嵌入向量输入卷积层进行多次卷积操作,得到特征序列;将所述特征序列输入
Bi
‑
LSTM
神经网络结构,所述
Bi
‑
LSTM
神经网络结构输出的特征信息作为
attention
机制层的输入;所述特征信息经过所述
attention
机制层处理,对所述特征信息的权重进行调整,得到涵盖分子特殊结构特征的文本表示;对所述文本表示进行整合得到综合文本表示,将所述综合文本表示作为
Softmax
分类器的输入;通过所述
Softmax
分类器对蛋白质
‑
配体间的亲和力进行分类后,获得蛋白质
‑
配体间的亲和力评价结果
。5.
根据权利要求1所述基于国产超算平台的蛋白质
‑
配体亲和力评价方法,其特征在于,所述依赖库包括
13
个
Python
库,包括:
torch、torc...
【专利技术属性】
技术研发人员:陈溟,谭华,苏亮,杨帅,
申请(专利权)人:青岛国实科技集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。