化合物性质预测方法、装置、计算机设备及可读存储介质制造方法及图纸

技术编号:23290151 阅读:21 留言:0更新日期:2020-02-08 19:42
本申请实施例公开了一种化合物性质预测方法、装置、计算机设备及可读存储介质,涉及人工智能的计算机视觉技术;具体地可以获取目标化合物的化学结构信息,该化学结构信息包括原子和化学键;根据化学结构信息生成与化学结构信息对应的化学结构图,化学结构图包括原子对应的节点以及化学键对应的边;构建节点的原始节点特征和边的原始边特征;根据节点的原始节点特征、边的原始边特征,在边上进行多轮消息传播,得到边在经过多轮消息传播后的传播状态信息;根据传播状态信息获取边的目标特征;根据边的目标特征预测目标化合物的性质,并输出目标化合物的性质预测结果。该方案科研大大提升化合物性质预测的准确性。

Prediction method, device, computer equipment and readable storage medium of compound properties

【技术实现步骤摘要】
化合物性质预测方法、装置、计算机设备及可读存储介质
本专利技术涉及人工智能
,具体涉及一种化合物性质预测方法、装置、计算机设备及可读存储介质。
技术介绍
在药物分析中,如何根据化合物如蛋白质等的结构判断或预测物质的一些性质如化学、生物性质,例如毒性、溶解性,致癌性等等,是一件非常重要的任务。目前的化合物性质预测方式是采用人工智能(AI,ArtificialIntelligence)来实现。比如,可以将性质预测这类任务建模成AI机器学习中的分类问题。具体地,可以通过表示学习的方式,将化合物如蛋白质的结构式转化为在欧式空间中的向量,然后通过神经网络如卷积神经网络(CNN)对其进行分类,进而判断或预测物质的性质如化学/生物性质。作为表示学习经典方法,卷积神经网络(CNN)已经在识别等领域获得了极大的成功。许多现有模型和架构用于解决大规模分类和识别问题,具体应用有图像(image)、自然语言处理等,但是由于这些应用的源数据都有一个共同点,具有网格(grid)结构。然而,化合物如蛋白质化学结构不具有这样的网格结构,会导致性质预测的准确性较低。
技术实现思路
本申请实施例提供一种化合物性质预测方法、装置、计算机设备及可读存储介质,可以提高化合物性质预测的准确性。本申请实施例提供一种化合性质预测方法,包括:获取目标化合物的化学结构信息,所述化学结构信息包括原子和化学键;根据所述化学结构信息生成与所述化学结构信息对应的化学结构图,所述化学结构图包括所述原子对应的节点以及所述化学键对应的边;构建所述节点的原始节点特征和所述边的原始边特征;根据所述节点的原始节点特征、所述边的原始边特征,在所述边上进行多轮消息传播,得到所述边在经过多轮消息传播后的传播状态信息;根据所述传播状态信息获取所述边的目标特征;根据所述边的目标特征预测目标化合物的性质,并输出目标化合物的性质预测结果。本申请实施例提供一种基于多层边信息传播模型的化合物性质预测方法,包括:获取目标化合物的化学结构信息,所述化学结构信息包括原子和化学键;根据所述化学结构信息生成与所述化学结构信息对应的化学结构图,所述化学结构图包括所述原子对应的节点以及所述化学键对应的边;根据所述节点的原始节点特征向量、所述边的原始边特征向量获取所述多层边信息传播模型的初始输入信息;采用所述多层边信息传播模型,基于所述初始输入信息在所述边上进行多轮消息传播,得到所述边在经过多轮消息传播后的传播状态信息;采用所述多层边信息传播模型,基于所述传播状态信息获取所述边的目标特征;采用所述多层边信息传播模型,根据所述边的目标特征预测目标化合物的性质,并输出目标化合物的性质预测结果。相应的,本申请实施例还提供一种化合物性质预测装置,包括:获取单元,用于获取目标化合物的化学结构信息,所述化学结构信息包括原子和化学键;转换单元,用于根据所述化学结构信息生成与所述化学结构信息对应的化学结构图,所述化学结构图包括所述原子对应的节点以及所述化学键对应的边;特征构建单元,用于构建所述节点的原始节点特征和所述边的原始边特征;消息传播单元,用于根据所述节点的原始节点特征、所述边的原始边特征,在所述边上进行多轮消息传播,得到所述边在经过多轮消息传播后的传播状态信息;特征获取单元,用于根据所述传播状态信息获取所述边的目标特征;预测单元,用于根据所述边的目标特征预测目标化合物的性质,并输出目标化合物的性质预测结果。在一实施例中,所述消息传播单元,包括:初始输入子单元,用于根据所述节点的原始节点特征、所述边的原始边特征获取多轮消息传播的初始输入信息;传播子单元,用于基于所述初始输入信息在所述边上进行多轮消息传播,得到所述边在经过多轮消息传播后的传播状态信息。在一实施例中,所述传播子单元,用于将所述初始输入信息作为当前轮消息传播的当前输入,并基于当前输入进行当前轮消息传播;根据所述节点的原始节点特征、所述边的当前边特征以及历史传播状态信息,获取所述边在当前轮消息传播时的当前传播状态信息,其中,所述历史传播状态信息为所述边在历史轮消息传播时的传播状态信息;在进入下一轮消息传播时,根据所述当前传播状态信息、节点的原始节点特征更新所述当前输入,并返回执行于当前输入进行当前轮消息传播的步骤直至完成所有轮消息传播,得到所述边在经过多轮消息传播后的传播状态信息。在一实施例中,所述传播子单元,用于:确定所述边的起始节点对应的所有入边;对所述入边的当前边特征、所述入边上节点的原始节点特征、以及所述入边在历史消息传播时的历史传播状态信息进行融合,得到所述入边的消息;对所有入边的消息进行聚合,得到所述边在当前轮消息传播时的消息信息;对所述边在历史轮消息传播时的历史传播状态信息、以及所述消息信息进行融合,得到所述边在当前轮消息传播时的当前传播状态信息。在一实施例中,所述传播子单元,用于:根据消息生成参数,对所述入边的当前边特征、所述入边上节点的原始节点特征、以及所述入边在历史消息传播时的历史传播状态信息进行融合,得到融合后特征;基于激活函数对所述调整后特征进行处理,得到所述入边的消息。在一实施例中,所述传播子单元,用于:获取所述边在参考历史轮消息传播时的参考历史传播状态信息;根据第一融合参数对参考历史传播状态、和所述消息信息进行融合,得到融合后传播状态信息;基于激活函数对融合后传播状态进行处理,得到所述边在当前轮消息传播时的当前传播状态信息。在一实施例中,所述传播子单元,用于:根据第二融合参数对所述边的原始边特征、所述边上节点的原始节点特征进行融合,得到所述边的融合后边特征;基于激活函数对融合后边特征进行处理,得到所述边在参考历史轮消息传播时的参考历史传播状态信息。在一实施例中,所述预测单元,包括:转换子单元,用于将所述边的目标特征转换成所述化学结构图中每个节点的节点特征;融合子单元,用于对每个节点的节点特征进行融合,得到所述化学结构图的特征;预测子单元,用于根据所述化学结构图的特征预测目标化合物的性质。在一实施例中,所述转换子单元,用于:针对每个节点,确定与节点相关联的关联边,所述关联边包括所述节点、以及所述节点的邻居节点;对所有关联边的目标特征进行融合,得到融合后关联边特征;基于第三融合参数对所述节点的当前节点特征、和所述融合后关联边特征进行融合,得到所述节点的节点特征。在一实施例中,所述特征构建单元,用于:根据所述原子的原子属性信息构建节点的原始节点特征;根据所述化学键的属性信息构建所述边的原始边特征。在一实施例中,所述传播子单元,用于:将所述初始输入导入至多层边信息传播模型,所述多层边信息传播模型包括:多个消息传播层、节点特征转化层、和融合层;通过多层边信本文档来自技高网...

【技术保护点】
1.一种化合物性质预测方法,其特征在于,包括:/n获取目标化合物的化学结构信息,所述化学结构信息包括原子和化学键;/n根据所述化学结构信息生成与所述化学结构信息对应的化学结构图,所述化学结构图包括所述原子对应的节点以及所述化学键对应的边;/n构建所述节点的原始节点特征和所述边的原始边特征;/n根据所述节点的原始节点特征、所述边的原始边特征,在所述边上进行多轮消息传播,得到所述边在经过多轮消息传播后的传播状态信息;/n根据所述传播状态信息获取所述边的目标特征;/n根据所述边的目标特征预测目标化合物的性质,并输出目标化合物的性质预测结果。/n

【技术特征摘要】
1.一种化合物性质预测方法,其特征在于,包括:
获取目标化合物的化学结构信息,所述化学结构信息包括原子和化学键;
根据所述化学结构信息生成与所述化学结构信息对应的化学结构图,所述化学结构图包括所述原子对应的节点以及所述化学键对应的边;
构建所述节点的原始节点特征和所述边的原始边特征;
根据所述节点的原始节点特征、所述边的原始边特征,在所述边上进行多轮消息传播,得到所述边在经过多轮消息传播后的传播状态信息;
根据所述传播状态信息获取所述边的目标特征;
根据所述边的目标特征预测目标化合物的性质,并输出目标化合物的性质预测结果。


2.如权利要求1所述的化合物性质预测方法,其特征在于,根据所述节点的原始节点特征、所述边的原始边特征,在所述边上进行多轮消息传播,得到所述边在经过多轮消息传播后的传播状态信息,包括:
根据所述节点的原始节点特征、所述边的原始边特征获取多轮消息传播的初始输入信息;
基于所述初始输入信息在所述边上进行多轮消息传播,得到所述边在经过多轮消息传播后的传播状态信息。


3.如权利要求2所述的化合物性质预测方法,其特征在于,基于所述初始输入信息在所述边上进行多轮消息传播,得到所述边在经过多轮消息传播后的传播状态信息,包括:
将所述初始输入信息作为当前轮消息传播的当前输入,并基于当前输入进行当前轮消息传播;
根据所述节点的原始节点特征、所述边的当前边特征以及历史传播状态信息,获取所述边在当前轮消息传播时的当前传播状态信息,其中,所述历史传播状态信息为所述边在历史轮消息传播时的传播状态信息;
在进入下一轮消息传播时,根据所述当前传播状态信息、节点的原始节点特征更新所述当前输入,并返回执行基于当前输入进行当前轮消息传播的步骤直至完成所有轮消息传播,得到所述边在经过多轮消息传播后的传播状态信息。


4.如权利要求3所述的化合物性质预测方法,其特征在于,根据所述节点的原始节点特征、所述边的当前边特征以及历史传播状态信息,获取所述边在当前轮消息传播时的当前传播状态信息,包括:
确定所述边的起始节点对应的所有入边;
对所述入边的当前边特征、所述入边上节点的原始节点特征、以及所述入边在历史消息传播时的历史传播状态信息进行融合,得到所述入边的消息;
对所有入边的消息进行聚合,得到所述边在当前轮消息传播时的消息信息;
对所述边在历史轮消息传播时的历史传播状态信息、以及所述消息信息进行融合,得到所述边在当前轮消息传播时的当前传播状态信息。


5.如权利要求4所述的化合物性质预测方法,其特征在于,对所述入边的当前边特征、所述入边上节点的原始节点特征、以及所述入边在历史消息传播时的历史传播状态信息进行融合,得到所述入边的消息,包括:
根据消息生成参数,对所述入边的当前边特征、所述入边上节点的原始节点特征、以及所述入边在历史消息传播时的历史传播状态信息进行融合,得到融合后特征;
基于激活函数对所述调整后特征进行处理,得到所述入边的消息。


6.如权利要求4所述的化合物性质预测方法,其特征在于,对所述边在历史轮消息传播时的历史传播状态信息、以及所述消息信息进行融合,得到所述边在当前轮消息传播时的当前传播状态信息,包括:
获取所述边在参考历史轮消息传播时的参考历史传播状态信息;
根据第一融合参数对参考历史传播状态、和所述消息信息进行融合,得到融合后传播状态信息;
基于激活函数对融合后传播状态进行处理,得到所述边在当前轮消息传播时的当前传播状态信息。


7.如权利要求6所述的化合物性质预测方法,其特征在于,获取所述边在参考历史轮消息传播时的参考历史传播状态信息,包括:
根据第二融合参数对所述边的原始边特征、所述边上节点的原始节点特征进行融合,得到所述边的融合后边特征;
基于激活函数对融合后边特征进行处理,得到所述边在参考历史轮消息传播时的参考历史传播状态信息。


8.如权利要求1-7任一项所述的化合物性质预测方法,其特征在于,根据所述边的目标特征预测目标化合物的性质,包括:
将所述边的目标特征转换成所述化学结构图中每个节点的节点特征;
对每个节点的节点特征进行融...

【专利技术属性】
技术研发人员:荣钰黄文炳徐挺洋
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1