分子特征的提取及三维定量构效关系的计算方法及装置制造方法及图纸

技术编号:26973721 阅读:20 留言:0更新日期:2021-01-06 00:07
本发明专利技术公开了一种分子特征的提取及三维定量构效关系的计算方法及装置,其中,该提取方法包括:获取分子的第一特征矩阵;根据所述第一特征矩阵及预设图卷积神经网络模型,生成分子第二特征矩阵;根据预设正方体像素模型及第二特征矩阵,生成第三特征矩阵;根据第三特征矩阵及预设三维图卷积神经网络模型,生成第四特征矩阵;根据第三特征矩阵及第四特征矩阵,计算生成用以表征分子特征的第五特征矩阵;或据第四特征矩阵,计算生成用以表征分子特征的第五特征矩阵。通过实施本发明专利技术,解决了只能根据分子二维坐标对神经网络进行训练,导致提取出的分子特征较为片面的问题,可以使用表征分子键的连接关系的三维图结构直接训练神经网络模型。

【技术实现步骤摘要】
分子特征的提取及三维定量构效关系的计算方法及装置
本专利技术涉及数据处理领域,具体涉及一种分子特征的提取及三维定量构效关系的计算方法及装置。
技术介绍
定量构效关系(QSAR),是使用某种数学模型来描述分子结构与某种分子的生物活性之间的关系。QSAR的基本假设是分子的结构信息包含了与其物理、化学及生物等性质相关的信息,而再通过这些理化性质进而决定该化合物的生物活性。因此化合物的分子结构信息与生物活性也有一定程度的相关。具体的,二维定量构效关系(2DQSAR)有hansch方法、free-wilson方法。基于分子构象的进行QSAR预测的称为三维定量构效关系(下文称3D-QSAR)。现有技术中有根据分子化合物的smiles编码及其原子坐标,确定分子化合物的QSAR的拟合值;也有将分子表达为图结构,并经由图卷积神经网络(GCN)提取特征矩阵;但是上述方法只能根据大量的分子二维坐标对神经网络进行训练,导致提取出的分子特征表达分子的结构信息较为片面。
技术实现思路
因此,本专利技术要解决的技术问题在于克服现有技术中的提取出的分子特征表达分子的结构信息较为片面的缺陷,从而提供一种分子特征的提取及三维定量构效关系的计算方法及装置。根据第一方面,本专利技术实施例提供了一种分子特征的提取方法,包括:获取分子的第一特征矩阵,所述第一特征矩阵用以表征所述分子的初始特征维度以及原子数目;根据所述第一特征矩阵以及预设图卷积神经网络模型,生成所述分子的第二特征矩阵;所述第二特征矩阵用以表征所述分子的第一特征维度以及原子数目;根据预设正方体像素模型以及所述第二特征矩阵,生成第三特征矩阵,所述第三特征矩阵用以表征所述分子中各原子在空间坐标系的坐标信息以及第一特征维度;根据所述第三特征矩阵以及预设三维图卷积神经网络模型,生成第四特征矩阵,所述第四特征矩阵用以表征所述分子中各原子在空间坐标系的坐标信息以及第二特征维度;根据所述第三特征矩阵以及所述第四特征矩阵,计算生成用以表征所述分子特征的第五特征矩阵;或根据所述第四特征矩阵,计算生成用以表征所述分子特征的第五特征矩阵。结合第一方面第一实施方式,在第一方面第一实施方式中,所述获取分子的第一特征矩阵,具体包括:获取分子中的多个原子及原子数目;根据预设编码方式将各原子编码,生成各原子对应的编码向量;根据各编码向量,确定分子的初始特征维度;根据所述原子数目以及初始特征维度,确定所述分子的第一特征矩阵。结合第一方面,在第一方面第二实施方式中,所述根据预设正方体像素模型以及所述第二特征矩阵,生成第三特征矩阵的步骤中,包括:将所述预设正方体像素模型划分为多个三维像素;当所述原子在所述三维像素的中心时,将所述原子填充至所述三维像素,并确定所述原子在空间坐标系的坐标信息。结合第一方面,在第一方面第三实施方式中,该方法还包括:根据第一维度参数确定所述第一特征维度,根据第二维度参数确定第二特征维度。根据第二方面,本专利技术实施例提供了一种分子三维定量构效关系的计算方法,包括:获取分子的计算层次参数;根据所述计算层次参数确定分子的目标特征矩阵,所述目标特征矩阵是通过多个计算单元生成的,所述计算单元用于执行如第一方面或第一方面任一实施方式所述的分子特征的提取方法;根据预设的全联接层函数,将所述目标特征矩阵转换为一维特征矩阵;根据所述一维特征矩阵,计算生成所述分子的三维定量构效关系值。根据第三方面,本专利技术实施例提供了一种分子特征的提取装置,包括:第一特征矩阵获取模块,用于获取分子的第一特征矩阵,所述第一特征矩阵用以表征所述分子的初始特征维度以及原子数目;第二特征矩阵获取模块,用于根据所述第一特征矩阵以及预设图卷积神经网络模型,生成所述分子的第二特征矩阵;所述第二特征矩阵用以表征所述分子的第一特征维度以及原子数目;第三特征矩阵获取模块,用于根据预设正方体像素模型以及所述第二特征矩阵,生成第三特征矩阵,所述第三特征矩阵用以表征所述分子中各原子在空间坐标系的坐标信息以及第一特征维度;第四特征矩阵获取模块,用于根据所述第三特征矩阵以及预设三维图卷积神经网络模型,生成第四特征矩阵,所述第四特征矩阵用以表征所述分子中各原子在空间坐标系的坐标信息以及第二特征维度;第五特征矩阵获取模块,用于根据所述第三特征矩阵以及所述第四特征矩阵,计算生成用以表征所述分子特征的第五特征矩阵;或根据所述第四特征矩阵,计算生成用以表征所述分子特征的第五特征矩阵。根据第四方面,本专利技术实施例提供了一种分子三维定量构效关系的计算装置,包括:计算层次参数获取模块,用于获取分子的计算层次参数;目标特征矩阵确定模块,用于根据所述计算层次参数确定分子的目标特征矩阵,所述目标特征矩阵是通过多个计算单元生成的,所述计算单元用于执行第一方面或第一方面任一实施方式所述的分子特征的提取方法;转换模块,用于根据预设的全联接层函数,将所述目标特征矩阵转换为一维特征矩阵;计算模块,用于根据所述一维特征矩阵,计算生成所述分子的三维定量构效关系值。根据第五方面,本专利技术实施例提供了一种计算机设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行如第一方面或第一方面任一实施方式所述的分子特征的提取方法的步骤或者第二方面所述的分子三维定量构效关系的计算方法的步骤。根据第六方面,本专利技术实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面或第一方面任一实施方式所述的分子特征的提取方法的步骤或者第二方面所述的分子三维定量构效关系的计算方法的步骤。本专利技术技术方案,具有如下优点:本专利技术提供了一种分子特征的提取及三维定量构效关系的计算方法及装置,其中,该分子特征的提取方法包括:获取分子的第一特征矩阵;根据第一特征矩阵以及预设图卷积神经网络模型,生成分子的第二特征矩阵;根据预设正方体像素模型以及第二特征矩阵,生成第三特征矩阵;根据第三特征矩阵以及预设三维图卷积神经网络模型,生成第四特征矩阵;根据第三特征矩阵以及第四特征矩阵,计算生成用以表征分子特征的第五特征矩阵;或根据第四特征矩阵,计算生成用以表征分子特征的第五特征矩阵。通过实施本专利技术,解决了现有技术中存在的只能根据分子二维坐标对神经网络进行训练,导致提取出的分子特征较为片面的问题,可以使用表征分子键的连接关系的三维图结构直接训练神经网络模型,且需要的数据量较少,可以全面的表征分子的结构信息。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例中分子特征的提取方法的一个具体示例的流程图;图2为本专利技术实施例中分子特征的提取方法的计算第五特征矩阵的一个流程图;<本文档来自技高网...

【技术保护点】
1.一种分子特征的提取方法,其特征在于,包括:/n获取分子的第一特征矩阵,所述第一特征矩阵用以表征所述分子的初始特征维度以及原子数目;/n根据所述第一特征矩阵以及预设图卷积神经网络模型,生成所述分子的第二特征矩阵;所述第二特征矩阵用以表征所述分子的第一特征维度以及原子数目;/n根据预设正方体像素模型以及所述第二特征矩阵,生成第三特征矩阵,所述第三特征矩阵用以表征所述分子中各原子在空间坐标系的坐标信息以及第一特征维度;/n根据所述第三特征矩阵以及预设三维图卷积神经网络模型,生成第四特征矩阵,所述第四特征矩阵用以表征所述分子中各原子在空间坐标系的坐标信息以及第二特征维度;/n根据所述第三特征矩阵以及所述第四特征矩阵,计算生成用以表征所述分子特征的第五特征矩阵;或/n根据所述第四特征矩阵,计算生成用以表征所述分子特征的第五特征矩阵。/n

【技术特征摘要】
1.一种分子特征的提取方法,其特征在于,包括:
获取分子的第一特征矩阵,所述第一特征矩阵用以表征所述分子的初始特征维度以及原子数目;
根据所述第一特征矩阵以及预设图卷积神经网络模型,生成所述分子的第二特征矩阵;所述第二特征矩阵用以表征所述分子的第一特征维度以及原子数目;
根据预设正方体像素模型以及所述第二特征矩阵,生成第三特征矩阵,所述第三特征矩阵用以表征所述分子中各原子在空间坐标系的坐标信息以及第一特征维度;
根据所述第三特征矩阵以及预设三维图卷积神经网络模型,生成第四特征矩阵,所述第四特征矩阵用以表征所述分子中各原子在空间坐标系的坐标信息以及第二特征维度;
根据所述第三特征矩阵以及所述第四特征矩阵,计算生成用以表征所述分子特征的第五特征矩阵;或
根据所述第四特征矩阵,计算生成用以表征所述分子特征的第五特征矩阵。


2.根据权利要求1所述的方法,其特征在于,所述获取分子的第一特征矩阵,具体包括:
获取分子中的多个原子及原子数目;
根据预设编码方式将各原子编码,生成各原子对应的编码向量;
根据各编码向量,确定分子的初始特征维度;
根据所述原子数目以及初始特征维度,确定所述分子的第一特征矩阵。


3.根据权利要求1所述的方法,其特征在于,所述根据预设正方体像素模型以及所述第二特征矩阵,生成第三特征矩阵的步骤中,包括:
将所述预设正方体像素模型划分为多个三维像素;
当所述原子在所述三维像素的中心时,将所述原子填充至所述三维像素,并确定所述原子在空间坐标系的坐标信息。


4.根据权利要求1所述的方法,其特征在于,还包括:
根据第一维度参数确定所述第一特征维度,根据第二维度参数确定第二特征维度。


5.一种分子三维定量构效关系的计算方法,其特征在于,包括:
获取分子的计算层次参数;
根据所述计算层次参数确定分子的目标特征矩阵,所述目标特征矩阵是通过多个计算单元生成的,所述计算单元用于执行如权利要求1-4任一项所述的分子特征的提取方法;
根据预设的全联接层函数,将所述目标特征矩阵转换为一维特征矩阵;
根据所述一维特征矩阵,计算生成所述分子的三维定量构效关系值。

【专利技术属性】
技术研发人员:贾伯阳
申请(专利权)人:北京望石智慧科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1