基于知识图谱和消息传递神经网络的药物重定位方法及系统技术方案

技术编号：40489235 阅读：5 留言：0更新日期：2024-02-26 19:20

本发明专利技术公开一种基于知识图谱和消息传递神经网络药物重定位方法及系统，涉及生物医学和自然语言处理技术领域。本发明专利技术提出了Message‑Passing Transformer网络，将上下文三元组映射到不同的表示空间，充分利用其语义信息，并利用注意力机制对消息进行聚合，区分其重要性；为了减少网络的信息丢失和提高预测精度，本发明专利技术中引入了残差连接。本发明专利技术解决了当前基于知识图谱的药物重定位方法中实体和关系嵌入只能学习到邻接节点和边的信息的问题，并且使用了注意力机制将有限的上下文信息融入到嵌入中，使其能学习到丰富的语义信息，进而提高发现新药物治疗途经的能力。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及生物医学和自然语言处理，尤其是涉及一种基于知识图谱和消息传递神经网络药物重定位方法及系统。

技术介绍

1、随着药物研发技术的发展，以基因组学、蛋白质组学和系统生物学为代表的多种手段已广泛应用于药物靶标的辨识和创新药物的发现，但药物发现和药物开发是一项需要投入大量资金和时间并且带有巨大风险的任务。药物重定位(drug repositioning)是指利用相关技术方法从已有的药物挖掘其新适应症的过程。药物重定位能够为药物研发提供有效的实验线索和指导建议，使新药研发突破过度依赖实验筛选的局限进入到理性设计和实验筛选验证相结合的新阶段，从而大幅减少实验的周期和成本，对于新药研制具有重要的理论价值和现实意义。

2、将深度学习技术引入药物重定位预测，能够大大提高新药的研发效率。随着深度学习模型的发展，一些知识图谱推理的模型被应用到药物重定位。这种模型将知识图谱中的实体和关系表示为低维向量，同时最大限度地保留拓扑特征，并利用这些表示进行链接预测。

3、现有技术中，采用异构网络rwhndr进行药物重定位，该网络利用随机游走法获取网络信息，预测治疗疾病的候选药物。虽然rwhndr方法很经典，但它只能获得实体之间不同类型关系的语义。以往的代表性消息传递神经网络，如compgcn，将邻居节点和边的聚合语义信息传递到中心节点，以更新中心节点的向量。compgcn中的消息传播方法首先传输聚合的原始边和邻居节点信息，然后传输聚合的反向边和邻居节点信息，最后传输自循环关系信息。compgcn只对相邻节点和边进行聚合，没有

技术实现思路

1、有鉴于此，本专利技术提出一种基于知识图谱和消息传递神经网络的药物重定位方法及系统，以克服现有技术中只考虑嵌入实体与其相邻实体和关系之间的信息，忽略了与实体相关的其他三元组或路径对嵌入学习影响的问题。

2、本专利技术的技术方案如下：

3、本专利技术提供了一种基于知识图谱和消息传递神经网络的药物重定位方法，包括：

4、对药物知识图谱中的实体和关系进行数据预处理，以索引的形式表示知识图谱中的三元组，初始化三元组中的实体和关系嵌入；

5、使用基于组合的多关系神经网络compgcn编码实体和关系嵌入；

6、利用message-passing transformer消息传递神经网络将compgcn输出的实体和关系嵌入进行组合，得到药物知识图谱表示；在message-passing transformer中包括多头注意力机制；

7、利用interacte模型捕获保存在药物知识图谱表示中的异构特征相互作用，以推断新的药物-疾病相互作用，得到药物重定位预测结果。

8、进一步地，初始化三元组中的实体和关系嵌入，包括：

9、compgcn在初始卷积层将关系的初始特征向量变换为一组基向量的线性组合。

10、进一步地，使用基于组合的多关系神经网络compgcn编码实体和关系嵌入，包括：

11、使用compgcn作为模型的第一层编码器通过组合算子来学习实体和关系的嵌入；所述组合算子，包括减法、乘法和循环卷积；

12、使用concat函数将相应的聚合特征向量与前一个卷积层的实体特征向量连接起来，最后得到该层的实体嵌入；

13、使用关系特定系数矩阵将所有关系投影到与实体相同的嵌入空间中，更新关系的嵌入。

14、进一步地，利用message-passing transformer消息传递神经网络将compgcn输出的实体和关系嵌入进行组合，得到药物知识图谱表示，包括：

15、使用组合算子将上下文三元组映射到表示空间中，然后在消息中进行组合；

16、使用transformer中的注意力机制将所有上下文三元组表示聚合在一起；

17、计算每个邻近三元组的注意力分数，以捕获其重要性；

18、对具有注意力分数的消息进行聚合，以丰富实体嵌入。

19、进一步地，在message-passing transformer的多头注意力机制中引入了预激活残差连接。

20、进一步地，利用interacte模型捕获保存在药物知识图谱表示中的异构特征相互作用，包括：

21、利用重塑函数捕获实体和关系特征之间最大异构交互；

22、将重塑的矩阵堆叠成一个3d张量；对三维张量进行深度循环卷积处理；再将每个循环卷积的输出扁平化并连接成一个向量。

23、进一步地，模型的损失函数为二元交叉熵损失函数。

24、又一方面，本专利技术还提供了一种基于知识图谱和消息传递神经网络的药物重定位系统，包括：

25、预处理模块，用于对药物知识图谱中的实体和关系进行数据预处理，以索引的形式表示知识图谱中的三元组，初始化三元组中的实体和关系嵌入；

26、药物知识图谱表示模块，使用基于组合的多关系神经网络compgcn编码实体和关系嵌入；利用message-passing transformer消息传递神经网络将compgcn输出的实体和关系嵌入进行组合，得到药物知识图谱表示；在message-passing transformer中包括多头注意力机制；

27、预测额模块，利用interacte模型捕获保存在药物知识图谱表示中的异构特征相互作用，以推断新的药物-疾病相互作用，得到药物重定位预测结果。

28、与现有技术相比，本专利技术的有益效果是：

29、1)本专利技术提出了message-passing transformer网络将上下文三元组映射到不同的潜在空间进行表示学习；message-passing transformer能够充分利用知识图谱中的图上下文三元组，使得实体和关系嵌入能够学习到丰富的语义信息，从而得到高质量的嵌入。

30、2)本专利技术在message-passing transformer的多头注意力机制中引入了预激活残差连接，能够减少由于网络结构导致的信息丢失，解决了网络过度平滑的问题，进而提高了预测的性能。

31、3)本专利技术中利用interacte模型捕捉保存在实体和关系嵌入中的异质神经特征相互作用，以推断新的药物-疾病相互作用，使得实体和关系嵌入能够学习到丰富的语义信息，并且提高了预测的性能，更有利于药物研发的效率。

本文档来自技高网...

【技术保护点】

1.一种基于知识图谱和消息传递神经网络的药物重定位方法，其特征在于，包括：

2.根据权利要求1所述的一种基于知识图谱和消息传递神经网络的药物重定位方法，其特征在于，初始化三元组中的实体和关系嵌入，包括：

3.根据权利要求1所述的一种基于知识图谱和消息传递神经网络的药物重定位方法，其特征在于，使用基于组合的多关系神经网络CompGCN编码实体和关系嵌入，包括：

4.根据权利要求1所述的一种基于知识图谱和消息传递神经网络的药物重定位方法，其特征在于，利用Message-Passing Transformer消息传递神经网络将CompGCN输出的实体和关系嵌入进行组合，得到药物知识图谱表示，包括：

5.根据权利要求1所述的一种基于知识图谱和消息传递神经网络的药物重定位方法，其特征在于，在Message-Passing Transformer的多头注意力机制中引入了预激活残差连接。

6.根据权利要求1所述的一种基于知识图谱和消息传递神经网络的药物重定位方法，其特征在于，利用InteractE模型捕获保存在药物知识图谱表示中的异构特征相互作用，包括：

7.根据权利要求1所述的一种基于知识图谱和消息传递神经网络的药物重定位方法，其特征在于，模型的损失函数为二元交叉熵损失函数。

8.一种基于知识图谱和消息传递神经网络的药物重定位系统，其特征在于，包括：

...

【技术特征摘要】

1.一种基于知识图谱和消息传递神经网络的药物重定位方法，其特征在于，包括：

2.根据权利要求1所述的一种基于知识图谱和消息传递神经网络的药物重定位方法，其特征在于，初始化三元组中的实体和关系嵌入，包括：

3.根据权利要求1所述的一种基于知识图谱和消息传递神经网络的药物重定位方法，其特征在于，使用基于组合的多关系神经网络compgcn编码实体和关系嵌入，包括：

4.根据权利要求1所述的一种基于知识图谱和消息传递神经网络的药物重定位方法，其特征在于，利用message-passing transformer消息传递神经网络将compgcn输出的实体和关系嵌入进行组合，得到药物知识图...

【专利技术属性】
技术研发人员：张益嘉，刘源新，刘智，桑国明，
申请(专利权)人：大连海事大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人