一种基于蛋白靶点结构信息的信息处理方法技术

技术编号:36941703 阅读:21 留言:0更新日期:2023-03-22 19:03
本发明专利技术实施例涉及一种基于蛋白靶点结构信息的信息处理方法,包括:获取蛋白靶点结构信息;设置虚拟粒子对象;将虚拟粒子均匀而连续的排布在空腔中;根据第一分子结构模型,对每个空间坐标下的虚拟粒子的虚拟粒子对象中的空间坐标属性和原子类型属性进行不同的数据设定;选择对应空间坐标下的虚拟粒子的不同的稳定位置坐标和不同的稳定原子类型属性;将具有相近空间坐标的虚拟粒子基于空间坐标属性和原子类型属性进行聚类处理;将多个原子对象作为整体经过微调优化处理,得到具有空间结构信息的分子对象。本发明专利技术基于蛋白靶点结构信息的信息处理方法,得到的生成分子信息质量高,有效进行分子设计,提高分子生成效率;提升分子生成及优化的质量。分子生成及优化的质量。分子生成及优化的质量。

【技术实现步骤摘要】
一种基于蛋白靶点结构信息的信息处理方法


[0001]本专利技术涉及信息处理
,尤其涉及一种基于蛋白靶点结构信息的信息处理方法。

技术介绍

[0002]药物效应的基础是药物分子和蛋白靶点产生相互作用。因此在基于结构的药物设计中的关键是寻找或者设计出与蛋白靶点具有强结合亲和力的药物分子。
[0003]基于蛋白靶点来设计药物分子,一种是通过对分子库的高通量筛选,其受限于分子库固有大小,分子库太大又使筛选的成本增高,效率低。另一种是基于蛋白靶点结构进行理性设计。面对复杂的蛋白靶点结构时设计难度很大。
[0004]分子理性设计往往受限于药化学家的专家经验,另外这几种方法受限于计算机科学家对药效团的定义,难以全面考虑蛋白靶点内复杂的化学信息。
[0005]因此,基于蛋白靶点结构信息进行药物分子设计目前还没有有效的方法。

技术实现思路

[0006]本专利技术的目的是针对现有技术的缺陷,提供一种基于蛋白靶点结构信息的信息处理方法,利用蛋白靶点的三维结构信息作为基础,对其进行全面、充分、不带信息丢失的进行信息处理,得到的生成分子信息速度快,提高效率;另外可以提升分子生成及优化的质量。
[0007]为此,第一方面,本专利技术实施例提供了一种基于蛋白靶点结构信息的信息处理方法,所述方法包括:
[0008]步骤1、获取蛋白靶点结构信息,从中提取蛋白靶点空腔的空腔三维数据;
[0009]步骤2、设置虚拟粒子对象,所述虚拟粒子对象包括空间属性,所述空间属性包括虚拟粒子的粒子三维数据;
[0010]步骤3、根据所述空腔三维数据和所述粒子三维数据对应的空间坐标,将所述虚拟粒子均匀而连续的排布在所述空腔中,使得所述空腔中具有多个所述虚拟粒子;
[0011]步骤4、根据第一分子结构模型,对每个空间坐标下的所述虚拟粒子的虚拟粒子对象中的空间坐标属性和原子类型属性进行不同的数据设定;选择对应空间坐标下的虚拟粒子的不同的稳定位置坐标和不同的稳定原子类型属性,作为对应虚拟粒子处于稳定态后的虚拟粒子对象的属性;
[0012]步骤5、将具有相近空间坐标的虚拟粒子基于空间坐标属性和原子类型属性进行聚类处理,生成多个具有特定空间坐标属性和特定原子模型的原子对象;
[0013]步骤6,将多个所述原子对象作为整体经过微调优化处理,从而得到具有空间结构信息的分子对象;
[0014]步骤7,通过步骤1

6得到多个具有对应空间结构信息的分子对象,对多个分子对象的空间结构信息通过模型对蛋白靶点

分子复合物整体结构信息进行置信度评估处理,
得到对应的评估处理结果数据;
[0015]步骤8、对不同的所述分子对象对应的评估处理结果数据进行排序处理,得到排序顺序较优的分子对象对应的分子结构信息。
[0016]进一步的,所述步骤4中的第一分子结构模型包括蛋白靶点结构信息和虚拟粒子对象信息;其中,所述蛋白靶点结构信息组成蛋白靶点的原子信息,或组成蛋白靶点的氨基酸信息。
[0017]进一步的,所述步骤4中的第一分子结构模型的基础框架为Transformer、图神经网络或卷积神经网络架构,或者为分子力场的分子动力学框架。
[0018]进一步的,所述步骤4中具体为:根据第一分子结构模型,对每个空间坐标下的所述虚拟粒子的虚拟粒子对象中的空间坐标属性和原子类型属性进行多轮迭代空间坐标属性和原子类型属性的数据设定,直到最后每一个虚拟粒子对象的空间坐标属性不再改变或在一个固定的小区域内振动,原子类型属性不再改变为止;选择对应空间坐标下的虚拟粒子的不同的稳定位置坐标和不同的稳定原子类型属性,作为对应虚拟粒子处于稳定态后的虚拟粒子对象的属性。
[0019]进一步的,所述步骤7中的蛋白靶点

分子复合物整体结构信息具体为,实验解析得到的蛋白靶点

分子复合物晶体结构信息,或者基于分子对接、分子动力学得到的蛋白靶点

分子复合物的虚拟数据信息。
[0020]本专利技术实施例提供的基于蛋白靶点结构信息的信息处理方法,可以利用蛋白靶点的三维结构信息作为基础,对其进行全面、充分、不带信息丢失的进行信息处理,得到的生成分子信息质量高,从而有效的用来进行分子设计,而且提高了分子生成效率;并且提升了分子生成及优化的质量。
附图说明
[0021]图1为本专利技术基于蛋白靶点结构信息的信息处理方法的流程图;
[0022]图2为本专利技术基于蛋白靶点结构信息的信息处理方法中基于Transformer架构的模型示意图;
[0023]图3为本专利技术基于蛋白靶点结构信息的信息处理方法的演化示意图。
具体实施方式
[0024]下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。
[0025]因为现有的分子理性设计往往受限于药化学家的专家经验,但这种方法受限于计算机科学家对药效团的定义,难以全面考虑蛋白靶点内复杂的化学信息。本专利技术提供了一种人工智能方法,基于蛋白靶点结构的信息来进行可药分子设计的方法。可以称之为“虚拟动力学”(virtual dynamics)方法,也就是在蛋白靶点空腔中覆盖虚拟粒子,通过模型驱动虚拟粒子移动到目标位置并演化出目标类型,最终归并和微调后得到真实分子的流程。
[0026]图1为本专利技术基于蛋白靶点结构信息的信息处理方法的流程图,如图所示,本专利技术实施例包括如下步骤:
[0027]步骤101、获取蛋白靶点结构信息,从中提取蛋白靶点空腔的空腔三维数据;
[0028]根据需要进行处理的蛋白靶点,获取到该蛋白靶点的靶点结构信息,这样就可以
得到该蛋白靶点空腔的空腔和位置,也就是蛋白靶点空腔的空腔三维数据。
[0029]获取靶点的方法有基于知识的、基于蛋白实验结构的、基于化学信息学分析的。总的来说就是首先获知构成靶点的氨基酸是哪几个,然后对应到蛋白结构上,观察这些氨基酸所围成的空腔结构。
[0030]步骤102、设置虚拟粒子对象,虚拟粒子对象包括空间属性,空间属性包括虚拟粒子的粒子三维数据;
[0031]虚拟粒子对象是为了对应虚拟粒子后续处理而抽象的数据信息,其包括空间属性,也就是从中可以获知粒子三维数据,为了后续步骤进行处理。虚拟粒子除了是实际的空间坐标外,也可以是空间上的概率密度,来进行位置和类型的演化。
[0032]步骤103、根据空腔三维数据和粒子三维数据对应的空间坐标,将虚拟粒子均匀而连续的排布在空腔中,使得空腔中具有多个虚拟粒子;
[0033]以上步骤的意义就是在蛋白靶点空腔中放置大量“虚拟粒子”(virtual particles),使虚拟粒子充满整个蛋白靶点空腔。这些虚拟粒子没有原子类型信息,但是有空间坐标信息,空间坐标在蛋白靶点空腔中平均分布。
[0034]步骤104、根据第一分子结构模型,对每个空间坐标下的虚拟粒子的虚拟粒子对象中的空间坐标属性和原子类型属性进行不同本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于蛋白靶点结构信息的信息处理方法,其特征在于,所述方法包括:步骤1、获取蛋白靶点结构信息,从中提取蛋白靶点空腔的空腔三维数据;步骤2、设置虚拟粒子对象,所述虚拟粒子对象包括空间属性,所述空间属性包括虚拟粒子的粒子三维数据;步骤3、根据所述空腔三维数据和所述粒子三维数据对应的空间坐标,将所述虚拟粒子均匀而连续的排布在所述空腔中,使得所述空腔中具有多个所述虚拟粒子;步骤4、根据第一分子结构模型,对每个空间坐标下的所述虚拟粒子的虚拟粒子对象中的空间坐标属性和原子类型属性进行不同的数据设定;选择对应空间坐标下的虚拟粒子的不同的稳定位置坐标和不同的稳定原子类型属性,作为对应虚拟粒子处于稳定态后的虚拟粒子对象的属性;步骤5、将具有相近空间坐标的虚拟粒子基于空间坐标属性和原子类型属性进行聚类处理,生成多个具有特定空间坐标属性和特定原子模型的原子对象;步骤6,将多个所述原子对象作为整体经过微调优化处理,从而得到具有空间结构信息的分子对象;步骤7,通过步骤1

6得到多个具有对应空间结构信息的分子对象,对多个分子对象的空间结构信息通过模型对蛋白靶点

分子复合物整体结构信息进行置信度评估处理,得到对应的评估处理结果数据;步骤8、对不同的所述分子对象对应的评估处理结果数据进行排序处理,得到排序顺序较优的分子对象对应的分子结构信息。2.根据权利要求1所述的方法,其特征在于,所述步骤具体为:对于从头分子,...

【专利技术属性】
技术研发人员:卢淑祺柯国霖郑行张林峰孙伟杰
申请(专利权)人:北京深势科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1