一种生物网络交互构建方法技术

技术编号:36404508 阅读:13 留言:0更新日期:2023-01-18 10:12
本发明专利技术属于深度学习大数据医疗技术领域,具体涉及一种生物网络交互构建方法,包括建立无向连接网络图G;对无向连接网络图G进行初步处理:将不同层级的邻居节点的信息聚合到源节点上,生成广域的源节点表征向量;从原始网络图G中为每一个源节点构建出特异性子图,学习源节点的特异性表征向量;基于和,预测任意两个节点之间存在的交互关系。本发明专利技术根据部分信息,不仅能准确预测已经存在的节点之间交互关系,同时还能预测出未知交互关系,为后续生物医学探究提供方向。此外,能清晰展示深度模型是基于哪些邻居节点信息来推断这些交互关系,具有较高可靠性和鲁棒性。具有较高可靠性和鲁棒性。具有较高可靠性和鲁棒性。

【技术实现步骤摘要】
一种生物网络交互构建方法


[0001]本专利技术属于深度学习大数据医疗
,具体涉及一种生物网络交互构建方法。

技术介绍

[0002]生物系统是各种分子实体(如基因、蛋白质和其他生物分子)通过相互作用连接在一起的复杂网络。不同分子实体之间复杂的相互作用可以表示为相互作用网络,以分子实体为节点,它们的相互作用为边。生物系统的网络表征为研究和理解生物系统中不同分子实体之间直接或间接的相互作用提供了一个概念性和直观的框架。基于这些节点的网络表征,利用深度学习的方法,发现新的节点之间的交互,有利于促进我们对生物系统的认识和了解,更进一步阐述清楚生命活动的本质和规律。例如发现新的蛋白质与蛋白质之间的交互关系,可以帮助认识是否这两种蛋白质存在协同效应,或者发现某种基因与疾病存在高概率链接度,可以指导我们是否这类基因的异常表达会诱发某类疾病。因此,设计一种基于生物网络的交互关系挖掘模型是具有重要意义的。
[0003]在中医药领域中,治疗疾病的药物常常以处方形式提供,处方中包含多味药材,而且每味药材又存在多种活性成分。按照中医诊疗理念,这些化合物形成一个整体,共同作用于某类疾病中,从多个方面对身体进行调节,多通路来治疗某类疾病。这种治疗模式可以自发以一种网络结构进行描述,多种成分都和多类疾病存在关系,具有多对多的属性。探索这类问题,发掘其中这些交互关系的真假性,从而有利于阐述中医治疗疾病的分子层面的作用机制。此外,中医又存在“异病同治,同病异治”的理念,弄清楚这些理念背后存在的科学内涵及其原理,都需要生物网络挖掘技术支撑和应用。
[0004]由于疾病病症、基因、药物等多种因素融合后,交互作用复杂多样,如何对多种因素融合后的无向连接网络图进行处理,构建出具有差异化的特征形式的生物网络,预知已存的或未知的交互关系,仍具有较大复杂度和难度。因此,本专利技术提出一种生物网络交互构建方法。

技术实现思路

[0005]为了解决现有技术中的上述技术问题,本专利技术提供一种生物网络交互构建方法。
[0006]为实现上述目的,本专利技术的技术方案如下:一种生物网络交互构建方法,包括:S1、建立无向连接网络图G,图中节点V表示症候信息,节点之间的边E表示生物交互关系,节点表征向量X表示节点的生物学描述、化学结构、信息编码中任意信息的组合;S2、利用多阶图聚合模块对无向连接网络图G进行初步处理:将不同层级的邻居节点的信息聚合到源节点上,生成广域的源节点表征向量;S3、通过子图选择模块利用广域的源节点表征向量,从原始网络图G中为每一个源节点构建出特异性子图;
S4、基于特异性子图学习源节点的特异性表征向量;S5、基于广域的源节点表征向量和源节点的特异性表征向量,预测任意两个节点之间存在的交互关系。
[0007]进一步地,所述证候信息包括疾病、症状、基因、药物、生物靶标;生物交互关系包括疾病

疾病、疾病

症状、疾病

基因、疾病

药物、基因

靶标等任何生物关系。
[0008]进一步地,多阶图聚合模块依据不同阶数的邻接矩阵A和维度转化矩阵,将不同层级的邻居节点的信息聚合到源节点上,生成广域的节点表征向量。
[0009]更进一步地,多阶图聚合模块首先对网络图G中的初始信息特征进行变换,应用全连接层将初始信息映射到同一个低维的共享子空间内,具体方法为:其中,W表述初始特征映射参数矩阵,b表示偏置系数;H表示映射后得到的嵌入表征;之后应用高阶图卷积编码器聚合生物网络图G中不同阶的节点信息,具体方法为:其中,表示节点k阶的转移概率矩阵,为第l层的第k阶的可学习的参数矩阵;将不同阶的节点嵌入表征进行拼接,得到节点的表征向量。
[0010]更进一步地,的生成方式为:先将基于边构建的邻接矩阵A进行拉普拉斯变换并归一化,再求k次幂。
[0011]更进一步地,依据多阶图聚合模型映射后得到的嵌入表征,计算源节点周围不同层级的边对源节点表征学习贡献的信息权重;设定源节点为u,从生物网络图G中搜索源节点u的P层的邻居节点集合,以及这些节点之间存在的边的集合,将集合中的边两端节点通过多阶图聚合模块学习到的表征向量和,与源节点u的表征向量进行拼接,以此计算中每个边对于源节点的重要程度;具体为:其中,表示边(i,j)对源节点u的权重值,表示参数为的多层感知器模块。
[0012]更进一步地,利用源节点u的P层邻居集合中每个边的权重值,对权重值进行离散化处理,具体方法为:其中,表示sigmoid函数,将计算值映射到区间内,为随机值,服从(0,1)内的均匀分布,为温度系数。
[0013]进一步地,定义一个简单的双线性层学习潜在的边的表征:
其中,表示可学习的融合矩阵,b为偏置系数,表示节点i和节点j通过双线性层得到的边的表征。
[0014]得到的边的表征被输入到2层的全连接层网络中预测两个节点存在边的可能性,具体方法为:其中,FC表示全连接层,sigmoid和ELU表示非线性激活函数。
[0015]进一步地,对边的可能性参数应用二值交叉损失函数求取损失,具体为:其中,为0

1化的邻接矩阵,在求取预测误差损失值后,应用反向传播算法和模型学习率参数更新模型中参数,减少预测误差。
[0016]相对于现有技术,本专利技术具有以下有益效果:本专利技术先建立无向连接网络,然后将不同层级的邻居节点信息聚合到源节点上,生成广域的源节点表征向量,再构建源节点的特异性子图,得到特异性表征向量,基于广域的源节点表征向量和源节点的特异性表征向量,预测任意两个节点之间存在的交互关系,进而能够预测疾病、药物、基因、症状等元素之间的已知概率关系和未知的关系,为后续生物医学研究提供可靠的数据依据和研究方向。此外,为每个节点构建出子图,从而能清晰的展示出深度模型是基于哪些邻居节点信息来推断这些交互关系,具有较高可靠性和鲁棒性。
附图说明
[0017]图1为本专利技术实施例的总框图。
[0018]图2为本专利技术实施例的多阶图聚合模块的处理流程图。
[0019]图3为本专利技术实施例的子图选择模块的处理过程示意图。
[0020]图4为本专利技术实施例在DTI数据集上为样本节点选择不同层级子图的示意图。
具体实施方式
[0021]下面将结合附图说明对本专利技术的技术方案进行清楚的描述,显然,所描述的实施例并不是本专利技术的全部实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术的保护范围。
[0022]本专利技术实施方案如图1所示:首先,对收集到病历数据和公开的生物信息数据进行预处理,提取出每个病历中的主要疾病类型和使用药物等重要信息,构建出多个实体图,从而可以生成一个无向的疾病

药物网络图。接着,统计出在本病历数据中出现的所有疾病和药物类型,并对其进行一一标号,以此来确定疾病和药物在的唯一性。同理,基于被选择出的药物和疾病,从TCMSP、Dr本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种生物网络交互构建方法,其特征在于,包括:S1、建立无向连接网络图G,图中节点V表示症候信息,节点之间的边E表示生物交互关系,节点表征向量X表示节点的生物学描述、化学结构、信息编码中任意信息的组合;S2、利用多阶图聚合模块对无向连接网络图G进行初步处理:将不同层级的邻居节点的信息聚合到源节点上,生成广域的源节点表征向量;S3、通过子图选择模块利用广域的源节点表征向量,从原始网络图G中为每一个源节点构建出特异性子图;S4、基于特异性子图学习源节点的特异性表征向量;S5、基于广域的源节点表征向量和源节点的特异性表征向量,预测任意两个节点之间存在的交互关系。2.根据权利要求1所述的生物网络交互构建方法,其特征在于,多阶图聚合模块依据不同阶数的邻接矩阵A和维度转化矩阵,将不同层级的邻居节点的信息聚合到源节点上,生成广域的节点表征向量。3.根据权利要求2所述的生物网络交互构建方法,其特征在于,多阶图聚合模块首先对网络图G中的初始信息特征进行变换,应用全连接层将初始信息映射到同一个低维的共享子空间内,具体方法为:其中,W表述初始特征映射参数矩阵,b表示偏置系数;H表示映射后得到的嵌入表征;之后应用高阶图卷积编码器聚合生物网络图G中不同阶的节点信息,具体方法为:其中,表示节点k阶的转移概率矩阵,为第l层的第k阶的可学习的参数矩阵;将不同阶的节点嵌入表征进行拼接,得到节点的表征向量。4.根据权利要求3所述的生物网络交互构建方法,其特征在于,的生成方式为:先将基于边构建的邻接矩阵A进行拉普拉斯变换并归一化,再求...

【专利技术属性】
技术研发人员:赵玉凤庞华鑫张小平周佩刘佳
申请(专利权)人:中国中医科学院中医药信息研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1