一种蛋白结构的对接方法及分布式蛋白结构对接系统技术方案

技术编号:25693326 阅读:25 留言:0更新日期:2020-09-18 21:04
本公开提供了一种蛋白结构的对接方法及分布式蛋白结构对接系统,该方法包括:获取待处理任务的所有蛋白结构,根据待处理任务创建至少一个线程任务,其中,线程任务用于处理待处理任务中的至少一个蛋白结构;将所有线程任务分配至至少一个运算节点中,使运算节点执行线程任务中的蛋白结构的对接,并生成线程任务对接的评估数据,其中,每个运算节点至少分配有一个线程任务。本公开对运算资源通过中央处理单元实现了统一的调度使用,以并行形式实现了海量蛋白结构的分配,使每个运算节点可以实现同时进行蛋白结构的对接处理,加快整体蛋白结构的对接速度,提升了整体任务处理效率,实现了海量蛋白结构的对接。

【技术实现步骤摘要】
一种蛋白结构的对接方法及分布式蛋白结构对接系统
本公开涉及医学药物领域,特别涉及一种蛋白结构的对接方法及分布式蛋白结构对接系统。
技术介绍
在抗体研发过程中,通过计算机模拟蛋白与蛋白的结构对接是非常重要的一个环节,因抗体研发属于医药专业领域,从业人员很少有专业的计算机软件研发能力,绝大多数专家与学者是通过已有的专业软件或在线网络服务进行该工作的,蛋白-蛋白对接如今比较著名的软件有HexProteinDocking,ZDock,rDock,Rosetta等等。其中HexProteinDocking虽算法比较复杂,但没有评分功能,ZDock一般作为前期的初对接,rDock为ZDock的升级算法,一般将ZDock对接后的前几个得分构象使用rDock进行进一步对接。但是这些算法均存在如下主要问题,即运算速度缓慢,对接效率较低,单个蛋白对接需要耗费的时间为5-10分钟不等,对于海量蛋白结构数据的对接任务是无法完成的,进而影响了抗体的研发和药物的开发进度。
技术实现思路
本公开实施例的目的在于提供一种蛋白结构的对接方法及分布式蛋白结构对接系统,以解决现有技术中的对接算法运算速度慢,对接效率低,无法实现海量蛋白结构对接的问题。为了解决上述技术问题,本公开的实施例采用了如下技术方案:一种蛋白结构的对接方法,包括:获取待处理任务的所有蛋白结构,根据所述待处理任务创建至少一个线程任务,其中,所述线程任务用于处理所述待处理任务中的至少一个蛋白结构;将所有所述线程任务分配至至少一个运算节点中,使所述运算节点执行所述线程任务中的蛋白结构的对接,并生成所述线程任务对接的评估数据,其中,每个所述运算节点至少分配有一个线程任务。进一步,所述在获取待处理任务的所有蛋白结构之前,还包括:接收预设算力;根据所述预设算力从所有运算资源中为所述待处理任务分配至少一个运算节点,其中,所述运算资源至少包括以下之一:服务器、中央处理器、硬盘、云盘。进一步,所述根据所述待处理任务创建至少一个线程任务之后,还包括:对每个所述线程任务中的所述蛋白结构进行第一预设处理,其中,所述第一预设处理至少包括以下之一:蛋白结构完整性验证、蛋白结构的文件的有效性验证、蛋白结构的文件的存储位置验证。进一步,所述将所有所述线程任务分配至至少一个运算节点中,使所述运算节点执行所述线程任务中的蛋白结构的对接,并生成所述线程任务对接的评估数据之后,还包括:接收所有所述运算节点发送的所述评估数据,对所述评估数据进行第二预设处理,得到所述待处理任务的蛋白结构对接结果,其中,所述第二预设处理至少包括以下之一:所述评估数据的有效性分析、所述评估数据的过滤、所述评估数据的排序。进一步,还包括:接收预设对接位置信息;在所述蛋白结构上确定所述预设对接位置对应的角度范围;创建第一线程任务用于处理所述蛋白结构上处于所述角度范围内的抗体结合位点,并将所述第一线程任务分配至第一运算节点。本公开实施例还公开了一种分布式的蛋白结构对接系统,包括:中央处理单元,用于在获取待处理任务的所有蛋白结构后,创建至少一个线程任务,并将所有所述线程任务分配至至少一个运算节点中,其中,所述线程任务用于处理所述待处理任务中的至少一个蛋白结构;至少一个运算节点,用于执行所述线程任务中的蛋白结构的对接,并生成所述线程任务对应的评估数据,其中,每个所述运算节点至少分配有一个线程任务。进一步,所述中央处理单元还用于:接收预设算力;根据所述预设算力从所有运算资源中为所述待处理任务分配至少一个运算节点,其中,所述运算资源至少包括以下之一:服务器、中央处理器、硬盘、云盘。进一步,所述中央处理单元还用于:在创建至少一个线程任务后,对每个所述线程任务中的所述蛋白结构进行第一预设处理,其中,所述第一预设处理至少包括以下之一:蛋白结构完整性验证、蛋白结构的文件的有效性验证、蛋白结构的文件的存储位置验证。进一步,所述运算节点还用于,将每个线程任务的评估数据发送至所述中央处理单元;所述中央处理单元还用于,在接收到所述运算节点发送的所述评估数据后,对所述评估数据进行第二预设处理,得到所述待处理任务的蛋白结构对接结果,其中,所述第二预设处理至少包括以下之一:所述评估数据的有效性分析、所述评估数据的过滤、所述评估数据的排序。进一步,所述中央处理单元还用于:接收预设对接位置信息;在所述蛋白结构上确定所述预设对接位置对应的角度范围;创建第一线程任务用于处理所述蛋白结构上处于所述角度范围内的抗体结合位点,并将所述第一线程任务分配至第一运算节点;所述第一运算节点,用于执行所述第一线程任务中的所述蛋白结构在所述角度范围内的对接。本公开实施例的有益效果在于:对各种分布式部署的运算资源通过中央处理单元实现了统一的调度和使用,以并行的形式实现了待处理任务中海量蛋白结构的分配,使每个运算节点可以实现同时进行蛋白结构的对接处理,加快整体蛋白结构的对接速度,提升了整体任务处理效率,实现了海量蛋白结构的对接。附图说明为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本公开第一实施例中蛋白结构的对接方法的流程图;图2为本公开第一实施例中蛋白结构的对接方法的另一种流程图;图3为本公开第二实施例中分布式的蛋白结构对接系统的结构示意图。具体实施方式此处参考附图描述本公开的各种方案以及特征。应理解的是,可以对此处申请的实施例做出各种修改。因此,上述说明书不应该视为限制,而仅是作为实施例的范例。本领域的技术人员将想到在本公开的范围和精神内的其他修改。包含在说明书中并构成说明书的一部分的附图示出了本公开的实施例,并且与上面给出的对本公开的大致描述以及下面给出的对实施例的详细描述一起用于解释本公开的原理。通过下面参照附图对给定为非限制性实例的实施例的优选形式的描述,本公开的这些和其它特性将会变得显而易见。还应当理解,尽管已经参照一些具体实例对本公开进行了描述,但本领域技术人员能够确定地实现本公开的很多其它等效形式,它们具有如权利要求的特征并因此都位于借此所限定的保护范围内。当结合附图时,鉴于以下详细说明,本公开的上述和其他方面、特征和优势将变得更为显而易见。此后参照附图描述本公开的具体实施例;然而,应当理解,所申请的实施例仅仅是本公开的实例,其可采用多种方式实施。熟知和/或重复的功能和结构并未详细描述以避免不必要或多余的细节使得本公开模糊不清。因此,本文所申请的具体的结构性和功能性细节并非意在限定,而是仅仅作为权利要求的基础和代表性基础用于教导本领域技术人员以实质上任意合适的详细结构多样地使用本公开。本说明书可使用词组“在一种实施例中”、“在另一个实施例中”、“在又一实施例中”或“在其他实施本文档来自技高网...

【技术保护点】
1.一种蛋白结构的对接方法,其特征在于,包括:/n获取待处理任务的所有蛋白结构,根据所述待处理任务创建至少一个线程任务,其中,所述线程任务用于处理所述待处理任务中的至少一个蛋白结构;/n将所有所述线程任务分配至至少一个运算节点中,使所述运算节点执行所述线程任务中的蛋白结构的对接,并生成所述线程任务对接的评估数据,其中,每个所述运算节点至少分配有一个线程任务。/n

【技术特征摘要】
1.一种蛋白结构的对接方法,其特征在于,包括:
获取待处理任务的所有蛋白结构,根据所述待处理任务创建至少一个线程任务,其中,所述线程任务用于处理所述待处理任务中的至少一个蛋白结构;
将所有所述线程任务分配至至少一个运算节点中,使所述运算节点执行所述线程任务中的蛋白结构的对接,并生成所述线程任务对接的评估数据,其中,每个所述运算节点至少分配有一个线程任务。


2.根据权利要求1所述的对接方法,其特征在于,所述在获取待处理任务的所有蛋白结构之前,还包括:
接收预设算力;
根据所述预设算力从所有运算资源中为所述待处理任务分配至少一个运算节点,其中,所述运算资源至少包括以下之一:服务器、中央处理器、硬盘、云盘。


3.根据权利要求1所述的对接方法,其特征在于,所述根据所述待处理任务创建至少一个线程任务之后,还包括:
对每个所述线程任务中的所述蛋白结构进行第一预设处理,其中,所述第一预设处理至少包括以下之一:蛋白结构完整性验证、蛋白结构的文件的有效性验证、蛋白结构的文件的存储位置验证。


4.根据权利要求1所述的对接方法,其特征在于,所述将所有所述线程任务分配至至少一个运算节点中,使所述运算节点执行所述线程任务中的蛋白结构的对接,并生成所述线程任务对接的评估数据之后,还包括:
接收所有所述运算节点发送的所述评估数据,对所述评估数据进行第二预设处理,得到所述待处理任务的蛋白结构对接结果,其中,所述第二预设处理至少包括以下之一:所述评估数据的有效性分析、所述评估数据的过滤、所述评估数据的排序。


5.根据权利要求1至4中任一项所述的对接方法,其特征在于,还包括:
接收预设对接位置信息;
在所述蛋白结构上确定所述预设对接位置对应的角度范围;
创建第一线程任务用于处理所述蛋白结构上处于所述角度范围内的抗体结合位点,并将所述第一线程任务分配至第一运算节点。


...

【专利技术属性】
技术研发人员:谢敬聃袁普卫王志伟王晶晶
申请(专利权)人:北京纽伦智能科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1