一种基于异构众核架构的并行海洋药物筛选方法技术

技术编号:24414396 阅读:88 留言:0更新日期:2020-06-06 10:45
本发明专利技术涉及一种基于异构众核架构的并行海洋药物筛选方法,属于药物筛选技术领域,所述方法包括构建异构众核的高性能计算架构、药物高通量筛选程序的输入输出和并行化、评分和优化分子结构。本发明专利技术方法利用异构众核的高性能计算架构,使得药物筛选更加高效,精确,且最终筛选的分子结构简单且对于靶点的作用效果较好。

A parallel method of marine drug screening based on heterogeneous multi-core architecture

【技术实现步骤摘要】
一种基于异构众核架构的并行海洋药物筛选方法
本专利技术属于药物筛选
,特别涉及一种基于异构众核架构的并行海洋药物筛选方法。
技术介绍
海洋药物指以海洋生物和海洋微生物为药源,运用现代科学方法和技术研制而成的药物。现有的海洋药物大多属于天然药物范畴,即直接从海洋生物中提取的有效成分,也有一些是海洋生物活性成分经过人工合成或生物技术转化而获得。海洋药用资源总量丰富,是制药业高质量发展的战略要地,已成为全球关注的生物医药焦点资源。20世纪40年代以来,国际海洋药物研究取得了一系列成果,发现了近4万个海洋化合物,一半以上有活性,已成功开发上市13个海洋药物。海洋天然产物的筛选目标主要是针对严重危害人类健康的癌症、心脑血管疾病、病毒感染(艾滋病等)及其他疑难杂症。但是目前真正用于临床研究的海洋药物尚不多。海洋药物的研发有助于提升我国新药研发能力,围绕当前社会严重威胁人类健康生活的心脏类、癌症等重大疾病,催生一批具有创新性且满足市场和临床需求的海洋创新药物,对提升我国在创新药物研发领域的国际竞争力、解决危害人类生命健康的疑难杂症提供新的药源支持,挽救生命并提高人类生活幸福指数,具有重大的社会效益。由于生长在高盐高压等特殊环境下的海洋天然产物结构复杂,采集过程以及化学合成比较困难,虚拟筛选的对接计算过程就显得尤为重要。针对海洋化合物复杂的构象,采用异构众核架构完成虚拟筛选的构象搜索部分。该系统采用主处理器+协处理器的体系架构,该架构下主处理器(主核)负责处理复杂的逻辑控制任务,协处理器(从核)负责处理计算密度高、逻辑分支简单的大规模数据并行任务,两者协同为具体的应用提供高效的计算平台。异构众核处理器则在同一芯片内集成了具有控制管理功能的通用处理器核心和大量用于加速计算的精简计算核心,能够实现较高的性能功耗比和计算密度,弥补了同构众核的不足。为实现海洋药物的高通量筛选,使用MPI并行技术。MPI是一个跨语言的通讯协议,用于编写并行计算,支持点对点和广播。MPI是一个信息传递应用程序接口,包括协议和和语义说明,他们指明其如何在各种实现中发挥其特性。MPI的目标是高性能,大规模性和可移植性。MPI是基于进程的并行,进程拥有独立的虚拟地址空间和处理器调度,并且执行相互独立。MPI设计为支持通过网络连接的机群系统,且通过消息传递来实现通信。针对海洋药物结构的特殊性,为提高海洋药物的虚拟筛选精度,使用机器学习的算法优化筛选过程中的评分函数的参数。蛋白质-配体对接是药物虚拟筛选中的一种计算方法,用来预测配体与蛋白质结合的最可能位置、方向和构想,以不同方式预测配体与蛋白质的结合自由能的对接方法可以分为三类:1.基于分子力场的方法;2.基于经验回归参数的方法;3.基于经验的评分函数的方法。经验评分函数通过总结许多单个术语的贡献来计算蛋白质-配体结合的亲和力。每一个术语通常代表蛋白质-配体结合中的重要能量因子。这些函数中的每一个都涉及几个参数,可以对其进行修改以改进预测。最后,在总计为最终预测的结合亲和力之前,对每个术语进行加权。对于目前的药物虚拟筛选程序,虽然在计算速度以及计算精度方面有了较大的提升,但仍然存在较多不足。1.传统的药物虚拟筛选的构象搜索通常是部署在单个处理器上顺序运行的,所以在整个筛选过程中也是耗时较长的。2.传统的分子对接方法的I/O通常是读入一个靶点数据文件,读入一个小分子数据文件和一个配置文件,之后对接产生一个包含打分的结果文件,即传统的虚拟筛选技术大多是串行的。但是面对高通量的虚拟筛选计算效率较低,并且对系统的存储和I/O压力较大。3.药物虚拟筛选的打分函数一般是通过对实验的回归分析和对所选数据集预测结合亲和力进行训练的。这种方法确保了良好的得分能力,但不一定具有良好的对接能力。
技术实现思路
针对现有技术存在的不足,本专利技术提供一种基于异构众核架构的并行高精度海洋药物筛选方法,利用异构众核的高性能计算架构,通过I/O优化、虚拟筛选过程的并行化以及对评分函数的优化,使得药物筛选更加高效,精确。采用海洋化合物作为配体数据集,有助于加快海洋药物的研发进度。为了解决上述技术问题,本专利技术采用的技术方案是:一种基于异构众核架构的并行高精度海洋药物筛选方法,所述方法包括构建异构众核的高性能计算架构、药物高通量筛选程序的输入输出和并行化、评分和优化分子结构;所述的构建异构众核的高性能计算架构:在虚拟筛选计算过程中,采用迭代的局部搜索全局优化算法来搜索配体经过一次旋转后的构象;旋转后的构象根据打分函数计算出此构象下与对应受体的结合自由能,根据对接的复杂性,自适应的确定在搜索过程中的步骤数并选择一个随机构象开始执行若干次搜索;将主控制流程放在主核上运行,构象搜索过程放在从核上计算,每个从核循环执行构象的能量计算,最终将计算结果返回到主核,继而筛选最优构象,最终将打分靠前的若干个构象筛出从而实现药物虚拟筛选程序的内部并行加速;进一步,所述的旋转包括配体在位置和方向上的变化,以及配体中活跃的可旋转键和灵活残基的扭转值的变化。所述的药物高通量筛选程序的输入输出和并行化:首先,使用自动化模块生成包含多个配体信息的输入,然后顺序执行输入中的配体与受体的对接计算,产生包含多个计算结果的输出。这一方法将药物虚拟筛选程序的多组小容量输入合并为一组多配体大容量输入,将多路作业输出合并为单路大作业输出;从而降低多核批处理计算系统的I/O压力,提高系统的存储效率。其次,使用MPI并行技术实现多任务的并行化,MPI的主进程负责读取多配体信息的输入并将配体信息依次分发给各子进程,各子进程接收到配体信息后进行独立的虚拟筛选过程,计算结束后产生包含多个计算结果的输出,各子进程继续向主进程申请配体分子直至列表文件中的配体分子全部计算完毕;所述评分:采用海洋天然产物作为配体数据集,使用线性回归算法训练评分函数,通过对评分函数中包括高斯空间吸引力、二次空间排斥、真空静电相互作用、疏水相互作用、氢键相互作用、lennard-jones势能、离子键相互作用能、芳香环的Π堆积作用在内术语的权值的调整,生成大量评分函数;为了训练评分函数,首先将海洋天然产物小分子数据集中每一个晶体结构最小化,然后从筛选结果中挑选打分排名靠前的配体构象,计算出结合自由能最小的配体姿势与原始结构之间的平均RMSD,RMSD值最小的即为评分能力最佳的评分函数;所述的优化分子结构:针对打分结果较好的配体分子,使用基于化学反应生长片段和基于电子等排体替换的骨架跃迁相结合的方法对分子结构进行优化,在受体蛋白结构的指导下对先导化合物骨架进行改造,保留与受体蛋白反应的主要官能团结构,选取配体分子中某个原子或者某一个基团作为反应位点,选取经典的化学反应进行片段生长,最后根据蛋白口袋匹配特性枚举化合物并进行优化。通过这种方法设计得到的分子较先导化合物结构简单且对于靶点作用效果较好。骨架跃迁大体分为4类:杂环替换、开环或闭环、肽模拟和基于拓扑的跃迁。骨架跃迁主要用于找到候选化合物,但是骨架跃迁方法通常不能预测候选化合物本文档来自技高网
...

【技术保护点】
1.一种基于异构众核架构的并行高精度海洋药物筛选方法,其特征在于所述方法包括构建异构众核的高性能计算架构、药物高通量筛选程序的输入输出和并行化,评分、优化分子结构;/n所述的构建异构众核的高性能计算架构:在虚拟筛选计算过程中,采用迭代的局部搜索全局优化算法来搜索配体经过一次旋转后的构象;旋转后的构象根据打分函数计算出此构象下与对应受体的结合自由能,根据对接的复杂性,自适应的确定在搜索过程中的步骤数并选择一个随机构象开始执行若干次搜索;将主控制流程放在主核上运行,构象搜索过程放在从核上计算,每个从核循环执行构象的能量计算,最终将计算结果返回到主核,继而筛选最优构象,最终将打分靠前的若干个构象筛出从而实现药物虚拟筛选程序的内部并行加速;/n所述的药物高通量筛选程序的输入输出和并行化:首先,使用自动化模块生成包含多个配体信息的输入,然后顺序执行输入中的配体与受体的对接计算,产生包含多个计算结果的输出;/n其次,使用MPI并行技术实现多任务的并行化,MPI的主进程负责读取多配体信息的输入并将配体信息依次分发给各子进程,各子进程接收到配体信息后进行独立的虚拟筛选过程,计算结束后产生包含多个计算结果的输出,各子进程继续向主进程申请配体分子直至列表文件中的配体分子全部计算完毕;/n所述评分:采用海洋天然产物作为配体数据集,使用线性回归算法训练评分函数,通过对评分函数中包括高斯空间吸引力、二次空间排斥、真空静电相互作用、疏水相互作用、氢键相互作用、lennard-jones势能、离子键相互作用能、芳香环的Π堆积作用在内术语的权值的调整,生成大量评分函数;为了训练评分函数,首先将海洋天然产物小分子数据集中每一个晶体结构最小化,然后从筛选结果中挑选打分排名靠前的配体构象,计算出结合自由能最小的配体姿势与原始结构之间的平均RMSD,RMSD值最小的即为评分能力最佳的评分函数;/n所述的优化分子结构:针对打分结果较好的配体分子,使用基于化学反应生长片段和基于电子等排体替换的骨架跃迁相结合的方法对分子结构进行优化,在受体蛋白结构的指导下对先导化合物骨架进行改造,保留与受体蛋白反应的主要官能团结构,选取配体分子中某个原子或者某一个基团作为反应位点,选取经典的化学反应进行片段生长,最后根据蛋白口袋匹配特性枚举化合物并进行优化。/n...

【技术特征摘要】
1.一种基于异构众核架构的并行高精度海洋药物筛选方法,其特征在于所述方法包括构建异构众核的高性能计算架构、药物高通量筛选程序的输入输出和并行化,评分、优化分子结构;
所述的构建异构众核的高性能计算架构:在虚拟筛选计算过程中,采用迭代的局部搜索全局优化算法来搜索配体经过一次旋转后的构象;旋转后的构象根据打分函数计算出此构象下与对应受体的结合自由能,根据对接的复杂性,自适应的确定在搜索过程中的步骤数并选择一个随机构象开始执行若干次搜索;将主控制流程放在主核上运行,构象搜索过程放在从核上计算,每个从核循环执行构象的能量计算,最终将计算结果返回到主核,继而筛选最优构象,最终将打分靠前的若干个构象筛出从而实现药物虚拟筛选程序的内部并行加速;
所述的药物高通量筛选程序的输入输出和并行化:首先,使用自动化模块生成包含多个配体信息的输入,然后顺序执行输入中的配体与受体的对接计算,产生包含多个计算结果的输出;
其次,使用MPI并行技术实现多任务的并行化,MPI的主进程负责读取多配体信息的输入并将配体信息依次分发给各子进程,各子进程接收到配体信息后进行独立的虚拟筛选过程,计算结束后产生包含多个计算结果的输出,各子进程继续向主进程申请配体分子直至列表文件中...

【专利技术属性】
技术研发人员:刘昊王新茹魏志强张志雨
申请(专利权)人:中国海洋大学
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1