当前位置: 首页 > 专利查询>湖南大学专利>正文

异质信息网络表示学习方法及相关装置制造方法及图纸

技术编号:39054542 阅读:11 留言:0更新日期:2023-10-12 19:47
本发明专利技术提供一种异质信息网络表示学习方法及相关装置,可以充分利用异质信息网络的属性信息,进而提高输出结果准确性。该方法包括:基于异质信息网络生成属性视图及结构视图,所述属性视图和所述结构视图包括目标类型节点和连边;对所述属性视图和所述结构视图进行随机游走,直至每一个所述目标类型节点所对应的游走次数大于等于目标游走次数,以得到节点序列构成的节点序列集合,所述节点序列的长度为目标节点序列长度;将所述节点序列集合输入预设的学习模型,以得到节点嵌入。以得到节点嵌入。以得到节点嵌入。

【技术实现步骤摘要】
异质信息网络表示学习方法及相关装置


[0001]本专利技术涉及数据挖掘网络表示学习
,具体涉及一种异质信息网络表示学习方法及相关装置。

技术介绍

[0002]网络数据作为表达物体间关系的载体,在现实中无处不在,如引文网络、推荐网络和生物信息网络等。异质信息网络包含多种类型的节点和边,相比于同构信息网络具有更丰富的语义信息。因此,对异质信息网络的研究和分析具有很高的应用价值。异质网络表示学习是将异质网络中的节点映射到低维的向量空间以更好地处理下游任务。由于异质网络的复杂性,现有的同构网络表示方法无法直接用于异质网络。
[0003]目前的异质信息网络表示学习方法通常使用元路径来捕获网络中复杂的结构信息和语义信息。元路径是连接异质信息网络中两个节点间类型的关系序列,不同的元路径含有特定的语义信息。基于随机游走的方法能有效捕获网络中的节点相似度信息,通过基于元路径的随机游走策略得到捕获元路径语义的节点序列,再通过训练模型学习节点表示。但是现有的异质信息网络表示学习方法未能充分利用异质信息网络的属性信息。

技术实现思路

[0004]本专利技术提供一种异质信息网络表示学习方法及相关装置,可以充分利用异质信息网络的属性信息,进而提高输出结果准确性。
[0005]本申请第一方面提供了一种异质信息网络表示学习方法,包括:
[0006]基于异质信息网络生成属性视图及结构视图,所述属性视图和所述结构视图包括目标类型节点和连边;
[0007]对所述属性视图和所述结构视图进行随机游走,直至每一个所述目标类型节点所对应的游走次数大于等于目标游走次数,以得到节点序列构成的节点序列集合,所述节点序列的长度为目标节点序列长度;
[0008]将所述节点序列集合输入预设的学习模型,以得到节点嵌入。
[0009]本申请第二方面提供了一种异质信息网络表示学习装置,包括:
[0010]生成单元,用于基于异质信息网络生成属性视图及结构视图,所述属性视图和所述结构视图包括目标类型节点和连边;
[0011]采样单元,用于对所述属性视图和所述结构视图进行随机游走,直至每一个所述目标类型节点所对应的游走次数大于等于目标游走次数,以得到节点序列构成的节点序列集合,所述节点序列的长度为目标节点序列长度;
[0012]学习单元,用于将所述节点序列集合输入预设的学习模型,以得到节点嵌入。
[0013]本申请实施例第三方面提供了一种计算机设备,其包括至少一个连接的处理器、存储器和收发器,其中,所述存储器用于存储程序代码,所述处理器用于调用所述存储器中的程序代码来执行上述第一方面所述的异质信息网络表示学习方法的步骤。
[0014]本申请实施例第四方面提供了一种计算机存储介质,其包括指令,当其在计算机上运行时,使得计算机执行上述任一方面所述的异质信息网络表示学习方法的步骤。
[0015]相对于相关技术,本专利技术的异质信息网络表示学习方法基于异质信息网络生成属性视图,将属性视图融入随机游走,对属性视图和结构视图进行随机游走,结合了属性视图,充分利用了异质信息网络的属性信息,提高了异质信息网络表示学习方法的输出结果的准确性。
【附图说明】
[0016]图1为本申请实施例提供的基于磁盘的数据图中三角形个数确定方法的流程示意图:
[0017]图2为本申请实施例提供的基于磁盘的数据图中三角形个数确定装置的虚拟结构示意图;
[0018]图3为本申请实施例提供的服务器的硬件结构示意图。
【具体实施方式】
[0019]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,本专利技术所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。
[0020]下面从异质信息网络表示学习装置的角度对异质信息网络表示学习方法的进行说明,该异质信息网络表示学习装置可以为服务器,也可以为服务器中的服务单元,具体不做限定。
[0021]请参阅图1,图1为本专利技术实施例提供的异质信息网络表示学习方法的流程示意图,包括:
[0022]101、基于异质信息网络生成属性视图及结构视图,属性视图和结构视图包括目标类型节点和连边。
[0023]本实施例中,基于异质信息网络表示学习装置可以基于异质信息网络生成属性视图及结构视图。异质信息网络包含节点和边,节点和边具有多种类型,节点和边构成的视图即为异质信息网络对应的原始结构视图,包含丰富的语义信息。基于异质信息网络生成属性视图及结构视图具体包括:
[0024]A01、基于异质信息网络获得目标类型节点构成的目标节点集合。
[0025]本实施例中,所述目标类型节点为所述异质信息网络中的特定类型的节点,具体类型由本领域技术人员根据实际需求确认,在此,具体不做限定。
[0026]A02、对目标类型节点对的属性相似度进行计算,以得到目标属性相似度,目标类型节点对为目标节点集合中的任意两个目标类型节点。
[0027]本实施例中,相似度计算方法可以采用本领域的常用计算方法,在此,可以采用余弦相似性计算目标类型节点对的属性相似度。通过计算目标类型节点对的属性相似度,可以评价目标类型节点对中的两个目标类型节点的关联度。
[0028]A03、比较目标属性相似度与预设属性相似度,以获得属性视图。
[0029]本实施例中,连边用于连接于两个目标类型节点之间,所述预设属性相似度是预
先设置的,用于控制属性视图中具有连边的两个目标类型节点间的平均属性相似程度。即设置的所述预设属性相似度越高,说明具有连边的两个目标类型节点间的平均属性相似程度越高。比较目标属性相似度与预设属性相似度,以获得所述属性视图具体包括:
[0030]若目标属性相似度大于等于预设属性相似度,则确认目标类型节点对之间有连边;
[0031]若目标属性相似度小于预设属性相似度,则确认目标类型节点对之间无连边。
[0032]其中,基于异质信息网络获得目标类型节点后,在目标属性相似度大于等于预设属性相似度的目标类型节点对之间构建连边,目标类型节点和连边构成的视图即为属性视图。
[0033]本实施例中,基于异质信息网络生成属性视图及结构视图具体还包括:
[0034]B01、基于异质信息网络确认目标类型节点所对应的元路径。
[0035]本实施例中,元路径为两个节点之间的关系序列,从一个节点经由边到达另一节点,或经由边和节点到达另一节点的路径,即为元路径,可以理解的是,从一个节点到另一个节点可以存在多条元路径,处于同一条元路径上的所有节点为元路径的邻居。因此,基于异质信息网络的节点和边,异质信息网络表示学习装置可以确认目标类型节点所对应的元路径。
[0036]B02、根据目标类型节点所对应的元路径将异质信息网络所对应的原始结构视图转换为目标类型节点所对应的元路径所对应的结构视图。
[0037]本实施例中,若两个目标类型节点之间只存在一条元路径,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种异质信息网络表示学习方法,其特征在于,包括:基于异质信息网络生成属性视图及结构视图,所述属性视图和所述结构视图包括目标类型节点和连边;对所述属性视图和所述结构视图进行随机游走,直至每一个所述目标类型节点所对应的游走次数大于等于目标游走次数,以得到节点序列构成的节点序列集合,所述节点序列的长度为目标节点序列长度;将所述节点序列集合输入预设的学习模型,以得到节点嵌入。2.根据权利要求1所述的方法,其特征在于,所述基于异质信息网络生成属性视图及结构视图包括:基于所述异质信息网络获得所述目标类型节点构成的目标节点集合;对目标类型节点对的属性相似度进行计算,以得到目标属性相似度,所述目标类型节点对为所述目标节点集合中的任意两个所述目标类型节点;比较所述目标属性相似度与预设属性相似度,以获得所述属性视图。3.根据权利要求1所述的方法,其特征在于,所述基于异质信息网络生成属性视图及结构视图包括:基于所述异质信息网络确认所述目标类型节点所对应的元路径;根据所述目标类型节点所对应的元路径将所述异质信息网络所对应的原始结构视图转换为所述目标类型节点所对应的元路径所对应的所述结构视图。4.根据权利要求1所述的方法,其特征在于,所述对所述属性视图和所述结构视图进行随机游走,直至每一个所述目标类型节点所对应的游走次数大于等于目标游走次数,以得到节点序列构成的节点序列集合,所述节点序列的长度为目标节点序列长度包括:步骤1、以游走起始点为起点,对所述属性视图和所述结构视图进行随机游走,得到所述游走起始点所对应的所述节点序列和每一个所述目标类型节点所对应的游走次数,所述游走起始点为所述目标节点集合中的任意一个目标类型节点;步骤2、比较每一个所述目标类型节点所对应的游走次数与所述目标游走次数;步骤3、若任意一个所述目标类型节点所对应的游走次数小于所述目标游走次数,则迭代执行步骤1至2,直至每一个所述目标类型节点所对应的游走次数大于等于所述目标游走次数。5.根据权利要求4所述的方法,其特征在于,所述以游走起始点为起点,对所述属性视图和所述结构视图进行随机游走,得到所述游走起始点所对应的所述节点序列和每一个所述目标类型节点所对应的游走次数包括:确认第一采样概率和第二采样概率,所述第一采样概率为对所述属性视图进行采样的概率,所述第二采样概率为对所述结构视图采样的概率;确认当前游走节点,以根据所述第一采样概率和所述第二采样概率选择所述属性视图或所述结构视图进行采样,所述当前游走节点为所述目标节点集合中的一个目标类型节点。6.根据权利要求5所述的方...

【专利技术属性】
技术研发人员:陈湘涛方姝蕊
申请(专利权)人:湖南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1