用于疾病预测的异质图表示方法、装置、设备及存储介质制造方法及图纸

技术编号:32552668 阅读:20 留言:0更新日期:2022-03-05 11:53
本发明专利技术公开了一种异质图表示方法、异质图表示设备、移动设备及存储介质,该方法包括:基于元路径将同一向量空间的异构图转化为同构图,各个同构图的节点类型与其源节点相同;对所述同构图的每个节点的子图进行分解,获得多个因子图;采用双注意力机制对所述多个因子图进行邻居信息聚合,并拼接聚合后的特征信息,获得元路径的节点特征向量;对不同元路径的节点特征向量进行融合,获得异构图节点的节点嵌入。由此,将异构图转化为同构图后,对节点的子图进行分解获得大量的因子图,并通过双注意力机制对因子图进行邻居信息聚合,以获得该异构图的节点嵌入,进而得到了异构图全面、准确的信息,提高了机器学习中基于少量数据的信息提取的准确性和全面性。取的准确性和全面性。取的准确性和全面性。

【技术实现步骤摘要】
用于疾病预测的异质图表示方法、装置、设备及存储介质


[0001]本专利技术涉及生物信息中的疾病预测
,尤其涉及一种异质图表示方法、装置、设备及存储介质。

技术介绍

[0002]在生物信息研究领域,疾病和基因的关联预测一直是个热点问题,受限于基因的多效性集合很大,但是已经确认的疾病基因数目在整个基因组中占比很小,只能用较少的数据去挖掘疾病基因关联,并且疾病的遗传异质性使得模式具有多样性,因此疾病基因的预测是准确性依然不如人意。
[0003]提高疾病预测准确性的关键在于从有限的数据集中获取到更多的语义信息。因此,亟需提高对有限数据的信息获取能力。

技术实现思路

[0004]本专利技术提供一种异质图表示方法、装置、设备及存储介质,旨在提高机器学习中基于少量数据的信息提取的准确性和全面性。
[0005]为实现上述目的,本专利技术提供一种异质图表示方法,所述方法应用于异质图表示设备,所述方法包括:
[0006]基于元路径将同一向量空间的异构图转化为同构图,各个同构图的节点类型与其源节点相同;
[0007]对所述同构图的每个节点的子图进行分解,获得多个因子图;
[0008]采用双注意力机制对所述多个因子图进行邻居信息聚合,并拼接聚合后的特征信息,获得元路径的节点特征向量;
[0009]对不同元路径的节点特征向量进行融合,获得异构图节点的节点嵌入。
[0010]可选地,所述基于元路径将同一向量空间的异构图转化为同构图的步骤之前还包括:
[0011]将包含不同节点类型的数据集的异构图投影至同一向量空间,以统一模型输入特征向量的维度。
[0012]可选地,所述对所述同构图的每个节点的子图进行分解,获得多个因子图的步骤包括:
[0013]多次重构所述同构图的边权重,获得所述同构图每条边的新的权重矩阵,并基于所述新的权重矩阵获得节点的因子图。
[0014]可选地,所述对所述同构图的每个节点的子图进行分解,获得大量的因子图的步骤包括:
[0015]在重构权重获得因子图的过程中,通过判别损失函数计算多个因子图的判别损失,以获得包括不同语义信息的因子图。
[0016]可选地,所述双注意力机制包括自注意力机制和多头注意力机制;
[0017]所述采用双注意力机制对所述多个因子图进行邻居信息聚合,并拼接聚合后的特征信息,获得元路径的节点特征向量的步骤包括:
[0018]基于自注意力对单个因子图的目标节点的邻居信息进行聚合,获得聚合后的特征向量;
[0019]通过所述多头注意力机制重复执行所述聚合操作,并拼接聚合后的特征向量;
[0020]将所有因子图生成的特征向量进行拼接,获得元路径的节点特征向量。
[0021]可选地,所述基于自注意力对单个因子图的目标节点的邻居信息进行聚合获得聚合后的特征向量的步骤包括:
[0022]对单个因子图的目标节点的邻居信息进行聚合,获得聚合后目标节点在对应因子图中的注意力权重;
[0023]获得因子图中所有节点的注意力权重后,基于所述自注意力机制将各个节点的注意力权重进行拼接,获得聚合后的特征向量。
[0024]可选地,对不同元路径的节点信息进行融合,获得异构图节点的节点嵌入的步骤包括:
[0025]对每种元路径下产生的节点特征向量进行平均操作,获得平均节点特征向量;
[0026]基于所述平均节点特征向量计算每种元路径下的注意力权重,并基于所述每种元路径下的注意力权重获得融合了不同元路径的异构图节点的节点嵌入。
[0027]此外,为实现上述目的,本专利技术还提供一种异质图表示方法装置,所述装置包括:
[0028]转化模块,用于基于元路径将同一向量空间的异构图转化为同构图,各个同构图的节点类型与其源节点相同;
[0029]分解模块,用于对所述同构图的每个节点的子图进行分解,获得多个因子图;
[0030]聚合模块,用于采用双注意力机制对所述多个因子图进行邻居信息聚合,并拼接聚合后的特征信息,获得元路径的节点特征向量;
[0031]融合模块,用于对不同元路径的节点特征向量进行融合,获得异构图节点的节点嵌入。
[0032]此外,为实现上述目的,本专利技术还提供一种异质图表示设备,包括存储器、处理器以及存储在所述存储器上的异质图表示方法程序,所述异质图表示方法程序被所述处理器运行时实现如上所述的方法的步骤。
[0033]此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有异质图表示方法程序,所述异质图表示方法程序被处理器运行时实现如上所述的方法的步骤
[0034]相比现有技术,本专利技术提出的一种异质图表示方法、装置、设备及存储介质,所述方法包括:基于元路径将同一向量空间的异构图转化为同构图,各个同构图的节点类型与其源节点相同;对所述同构图的每个节点的子图进行分解,获得多个因子图;采用双注意力机制对所述多个因子图进行邻居信息聚合,并拼接聚合后的特征信息,获得元路径的节点特征向量;对不同元路径的节点特征向量进行融合,获得异构图节点的节点嵌入。由此,将异构图转化为同构图后,对节点的子图进行分解获得大量的因子图,并通过双注意力机制对因子图进行邻居信息聚合,以获得该异构图的节点嵌入,进而得到了异构图全面、准确的信息,提高了机器学习中基于少量数据的信息提取的准确性和全面性。
附图说明
[0035]图1是本专利技术本专利技术各实施例涉及的异质图表示设备的硬件结构示意图
[0036]图2是本专利技术异质图表示方法第一实施例的流程示意图;
[0037]图3是本专利技术异质图表示方法第一实施例的第一场景示意图;
[0038]图4是本专利技术异质图表示方法第一实施例的第二场景示意图;
[0039]图5是本专利技术异质图表示方法第一实施例的第三场景示意图;
[0040]图6是本专利技术异质图表示装置第一实施例的功能模块示意图。
[0041]本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0042]应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0043]本专利技术实施例主要涉及的异质图表示设备是指能够实现网络连接的网络连接设备,所述异质图表示设备可以是服务器、云平台等。
[0044]参照图1,图1是本专利技术各实施例涉及的异质图表示设备的硬件结构示意图。本专利技术实施例中,异质图表示设备可以包括处理器1001(例如中央处理器Central Processing Unit、CPU),通信总线1002,输入端口1003,输出端口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信;输入端口1003用于数据输入;输出端口1004用于数据输出,存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non

volatile memory),例如磁本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种异质图表示方法,其特征在于,所述方法应用于异质图表示设备,所述方法包括:基于元路径将同一向量空间的异构图转化为同构图,各个同构图的节点类型与其源节点相同;对所述同构图的每个节点的子图进行分解,获得多个因子图;采用双注意力机制对所述多个因子图进行邻居信息聚合,并拼接聚合后的特征信息,获得元路径的节点特征向量;对不同元路径的节点特征向量进行融合,获得异构图节点的节点嵌入。2.根据权利要求1所述的方法,其特征在于,所述基于元路径将同一向量空间的异构图转化为同构图的步骤之前还包括:将包含不同节点类型的数据集的异构图投影至同一向量空间,以统一模型输入特征向量的维度。3.根据权利要求1所述的方法,其特征在于,所述对所述同构图的每个节点的子图进行分解,获得多个因子图的步骤包括:多次重构所述同构图的边权重,获得所述同构图每条边的新的权重矩阵,并基于所述新的权重矩阵获得节点的因子图。4.根据权利要求3所述的方法,其特征在于,所述对所述同构图的每个节点的子图进行分解,获得大量的因子图的步骤包括:在重构权重获得因子图的过程中,通过判别损失函数计算多个因子图的判别损失,以获得包括不同语义信息的因子图。5.根据权利要求1所述的方法,其特征在于,所述双注意力机制包括自注意力机制和多头注意力机制;所述采用双注意力机制对所述多个因子图进行邻居信息聚合,并拼接聚合后的特征信息,获得元路径的节点特征向量的步骤包括:基于自注意力对单个因子图的目标节点的邻居信息进行聚合,获得聚合后的特征向量;通过所述多头注意力机制重复执行所述聚合操作,并拼接聚合后的特征向量;将所有因子图生成的特征向量进行拼接,获得元路径的节点特征向量。6.根据权利要求5所述的方法,其特征在...

【专利技术属性】
技术研发人员:李君一贺明黄晨刘博王亚东
申请(专利权)人:哈尔滨工业大学深圳
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1