【技术实现步骤摘要】
图特征提取、脂水分配系数预测方法及图特征提取模型
本专利技术涉及人工智能
,具体涉及一种图特征提取、脂水分配系数预测方法及图特征提取模型。
技术介绍
脂水分配系数logp=物质在辛醇中的浓度/物质在水中的浓度,该指标是药物设计中的重要参考要素,它影响着药物在体内的吸收运转。该指标虽然可以由简单的实验测得,但是在药物设计早期虚拟筛选阶段,需要对大量候选小分子进行实验测定是不现实的,这时药化专家往往会借助软件计算的方法对logp进行粗筛。相关技术中,通常采用机器学习模型对小分子的logp进行预测,但是特征的提取需要大量的前期工作,而且需要具有较深专业知识和经验,工作量大。故亟待提出一种图特征提取方法,以学到小分子的合理且充足的表征信息,更准确的表达分子的特征,减少工作量。
技术实现思路
因此,本专利技术要解决的技术问题在于克服现有技术中特征提取需要大量前期工作,工作量大的缺陷,从而提供一种图特征提取、脂水分配系数预测方法及图特征提取模型。根据第一方面,本专利技术实施例公开了一种图特征提取方法,包 ...
【技术保护点】
1.一种图特征提取方法,其特征在于,包括:/n获取待提取特征图,所述待提取特征图由多个节点以及连接具有关联关系的节点的边组成;/n将所述待提取特征图输入到图特征提取模型进行特征提取,得到每一个节点的特征,所述图特征提取模型包含多个卷积层和GRU网络层,所述多个卷积层与所述GRU网络层间隔设置,通过所述GRU网络层进行具有关联关系节点的特征融合;/n将最后一层卷积层输出的每一个节点的特征输入到归并层进行特征融合,得到所述待提取特征图的特征。/n
【技术特征摘要】
1.一种图特征提取方法,其特征在于,包括:
获取待提取特征图,所述待提取特征图由多个节点以及连接具有关联关系的节点的边组成;
将所述待提取特征图输入到图特征提取模型进行特征提取,得到每一个节点的特征,所述图特征提取模型包含多个卷积层和GRU网络层,所述多个卷积层与所述GRU网络层间隔设置,通过所述GRU网络层进行具有关联关系节点的特征融合;
将最后一层卷积层输出的每一个节点的特征输入到归并层进行特征融合,得到所述待提取特征图的特征。
2.根据权利要求1所述的图特征提取方法,其特征在于,所述通过所述GRU网络层进行具有关联关系节点的特征融合,包括:
w′=GRU(w,aroundw)
其中,aroundw表示图特征提取模型中与节点w连接的所有其他节点v对w节点的总影响;是一个MLP神经网络,不同类型的边对应不同的网络参数;w′表示更新后的节点w的特征向量。
3.根据权利要求1所述的图特征提取方法,其特征在于,所述将最后一层卷积层输出的每一个节点的特征输入到归并层进行特征融合,包括:
将所述最后一层卷积层输出的每一个节点的特征输入到归并层,通过所述归并层将每一个节点的特征映射为模拟指纹后进行特征融合。
4.根据权利要求3所述的图特征提取方法,其特征在于,所述通过所述归并层将每一个节点的特征映射为模拟指纹后进行特征融合,包括:
其中,w(n)是第n层图卷积计算后节点w的输出特征向量;dim表示任一节点特征向量映射到dim维向量空间中;表示节点w第n层卷积的输出特征向量的映射值;softBitMap表示归并层的输出。
5.一种脂水分配系数预测方法,其特征在于,包括如下步骤:
利用如权利要求1-4中任一项所述的图特征提取方法对生物小分子进行特征提取;
利用预先训练好的脂水分配系数预测模型对提取到的生物小分子特征进行脂水分配系数预测。
6.根据权利要求5所述的方法,其特征在于,所述脂水分配系数预测模型通过下述方式训练得到:
获取第一脂水分配系数训练数据以及与所述第一脂水分配系数关联的训练数据,所...
【专利技术属性】
技术研发人员:周文彪,
申请(专利权)人:北京望石智慧科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。