一种异质信息网络的嵌入方法和装置制造方法及图纸

技术编号:21200412 阅读:38 留言:0更新日期:2019-05-25 01:24
本发明专利技术实施例提供了一种异质信息网络的嵌入方法和装置,所述方法可以包括:确定待嵌入异质信息网络中每个节点的表示向量;将所确定的表示向量输入至预先设定的双曲空间嵌入模型中;基于双曲空间嵌入模型,对表示向量进行双曲空间中的指数映射,得到每个节点在双曲空间中的嵌入向量。应用本发明专利技术实施例,由于双曲空间与异质信息网络同样具有幂律分布特性,在双曲空间中能够更贴合地体现出异质信息网络的结构和语义信息,使得异质信息网络的结构和语义信息保留得更完整。因此,可以提高嵌入准确度。

An Embedding Method and Device for Heterogeneous Information Network

The embodiments of the present invention provide an embedding method and device for heterogeneous information network, which can include: determining the representation vectors of each node in the heterogeneous information network to be embedded; inputting the determined representation vectors into the pre-established hyperbolic space embedding model; and mapping the representation vectors in hyperbolic space based on the hyperbolic space embedding model to obtain each of them. The embedding vectors of each node in hyperbolic space. The embodiment of the present invention shows that the structure and semantic information of the heterogeneous information network can be more appropriately reflected in the hyperbolic space because the hyperbolic space and the heterogeneous information network also have power-law distribution characteristics, so that the structure and semantic information of the heterogeneous information network can be preserved more completely. Therefore, the embedding accuracy can be improved.

【技术实现步骤摘要】
一种异质信息网络的嵌入方法和装置
本专利技术涉及网络嵌入领域,特别是涉及一种异质信息网络的嵌入方法和装置。
技术介绍
异质信息网络的嵌入,是指将异质信息网络中的节点以及节点之间的关系投射到度量空间中,在度量空间中将节点及节点之间的关系表示为向量。一般来说,要尽量保证原异质信息网络的结构和其中的语义信息的完整性,也就是尽量保证原异质信息网络中节点之间的关系保持不变。目前,大多方案是将异质信息网络嵌入在欧几里德空间中,也就是欧氏空间中。然而,专利技术人在研究中发现,由于异质信息网络中节点分布遵循幂律分布,而欧氏空间并不具有幂律分布特性,因此,将异质信息网络嵌入到欧氏空间,异质信息网络的结构和其中的语义信息保留得不够完整,也就是嵌入准确度不够高。
技术实现思路
本专利技术实施例的目的在于提供一种异质信息网络的嵌入方法和装置,以提高嵌入准确度。为了达到上述目的,本专利技术实施例公开了一种异质信息网络的嵌入方法,所述方法包括:确定待嵌入异质信息网络中每个节点的表示向量;将所确定的表示向量输入至预先设定的双曲空间嵌入模型中;基于所述双曲空间嵌入模型,对所述表示向量进行双曲空间中的指数映射,得到所述每个节点在双曲空间中的嵌入向量。可选的,所述确定待嵌入异质信息网络中每个节点的表示向量的步骤,包括:随机给定待嵌入异质信息网络中每个节点的表示向量。可选的,在所述基于所述双曲空间嵌入模型,对所述表示向量进行双曲空间中的指数映射,得到所述每个节点在双曲空间中的嵌入向量的步骤之前,还包括:确定待嵌入异质信息网络中每个节点之间的关联关系;针对所述每个节点,基于所确定的关联关系,确定与该节点的距离在第一预设范围内的节点作为邻居节点,获取所述邻居节点的表示向量;计算该节点的表示向量与所述邻居节点的表示向量在双曲空间中的距离,作为第一距离;根据所述第一距离,计算该节点与所述邻居节点的相似度,作为第一相似度;计算所述第一相似度对于该节点的表示向量的梯度,作为该节点的第一梯度;所述基于所述双曲空间嵌入模型,对所述表示向量进行双曲空间中的指数映射,得到所述每个节点在双曲空间中的嵌入向量的步骤,包括:针对所述每个节点,基于所述双曲空间嵌入模型,根据该节点的表示向量和所述该节点的第一梯度,对该节点的表示向量进行双曲空间中的指数映射,得到该节点在双曲空间中的嵌入向量。可选的,所述确定待嵌入异质信息网络中每个节点之间的关联关系的步骤,包括:根据待嵌入异质信息网络中每个节点的类型,生成所述待嵌入异质信息网络的元路径;针对所述待嵌入异质信息网络中每个节点,根据所述元路径确定与该节点的距离在第二预设范围内的节点,作为该节点的关联节点;所述第二预设范围大于第一预设范围;生成包括该节点以及所确定的关联节点的关系序列。可选的,在所述基于所述双曲空间嵌入模型,对所述表示向量进行双曲空间中的指数映射,得到所述每个节点在双曲空间中的嵌入向量的步骤之前,还包括:确定待嵌入异质信息网络中每个节点之间的关联关系;针对所述每个节点,基于所述每个节点之间的关联关系,确定与该节点的距离在第一预设范围内的节点作为邻居节点,获取所述邻居节点的表示向量;计算该节点的表示向量与所述邻居节点的表示向量在双曲空间中的距离,作为第一距离;根据所述第一距离,计算该节点与所述邻居节点的相似度,作为第一相似度;计算所述第一相似度对于该节点的表示向量的梯度,作为该节点的第一梯度;针对所述每个节点,确定与该节点无关联关系的预设数量个节点作为负样本节点,获取所述负样本节点的表示向量;计算该节点的表示向量与所述负样本节点的表示向量在双曲空间中的距离,作为第二距离;根据所述第二距离,计算该节点与所述负样本节点的相似度,作为第二相似度;计算所述第一相似度与所述第二相似度的和,得到相似度总和;通过计算相似度总和对于该节点的表示向量的梯度,作为该节点的第二梯度;所述基于所述双曲空间嵌入模型,对所述表示向量进行双曲空间中的指数映射,得到所述每个节点在双曲空间中的嵌入向量的步骤,包括:针对所述每个节点,基于所述双曲空间嵌入模型,根据该节点的表示向量和所述该节点的第二梯度,对该节点的表示向量进行双曲空间中的指数映射,得到该节点在双曲空间中的嵌入向量。可选的,在所述计算所述第一相似度与所述第二相似度的和,得到相似度总和的步骤之后,还包括:通过计算所述相似度总和对于所述邻居节点的表示向量的梯度,作为所述邻居节点的梯度;所述基于所述双曲空间嵌入模型,对所述表示向量进行双曲空间中的指数映射,得到所述每个节点在双曲空间中的嵌入向量的步骤,包括:针对所述每个节点,基于所述双曲空间嵌入模型,根据该节点的邻居节点的表示向量和该邻居节点的梯度,对该节点的邻居节点的表示向量进行双曲空间中的指数映射,得到该节点的邻居节点在双曲空间中的嵌入向量。可选的,在所述计算所述第一相似度与所述第二相似度的和,得到相似度总和的步骤之后,还包括:通过计算所述相似度总和对于所述负样本节点的表示向量的梯度,作为所述负样本节点的梯度;所述基于所述双曲空间嵌入模型,对所述表示向量进行双曲空间中的指数映射,得到所述每个节点在双曲空间中的嵌入向量的步骤,包括:针对所述每个节点,基于所述双曲空间嵌入模型,根据该节点的负样本节点的表示向量和所述负样本节点的梯度,对该节点的负样本节点的表示向量进行双曲空间中的指数映射,得到该节点的负样本节点在双曲空间中的嵌入向量。可选的,所述基于所述双曲空间嵌入模型,对所述表示向量进行双曲空间中的指数映射,得到所述每个节点在双曲空间中的嵌入向量的步骤,包括:基于所述双曲空间嵌入模型,对所述表示向量进行双曲空间中的指数映射,得到映射结果;判断映射次数是否达到预设值;如果达到,将所述映射结果确定为所述每个节点在双曲空间中的嵌入向量;如果未达到,基于所述映射结果对所述表示向量进行更新,并返回执行所述基于所述双曲空间嵌入模型,对所述表示向量进行双曲空间中的指数映射的步骤。为了达到上述目的,本专利技术实施例还公开了一种异质信息网络的嵌入装置,所述装置包括:确定模块,用于确定待嵌入异质信息网络中每个节点的表示向量;输入模块,用于将所确定的表示向量输入至预先设定的双曲空间嵌入模型中;映射模块,用于基于所述双曲空间嵌入模型,对所述表示向量进行双曲空间中的指数映射,得到所述每个节点在双曲空间中的嵌入向量。可选的,其特征在于,所述确定模块,具体用于随机给定待嵌入异质信息网络中每个节点的表示向量。本专利技术实施例提供的一种双曲空间异质信息网络的嵌入方法和装置,通过将异质信息网络中每个节点的表示向量,输入至预先设定的双曲空间嵌入模型中,基于双曲空间嵌入模型,对表示向量进行双曲空间中的指数映射,得到每个节点在双曲空间中的嵌入向量。由于在双曲空间中可以更准确地对具有幂律分布特性的数据进行建模,而异质信息网络中的数据具有幂律分布特性,在双曲空间中嵌入异质信息网络,能够更贴合地体现出异质信息网络的结构和语义信息,使得异质信息网络的结构和语义信息保留得更完整。因此,可以提高嵌入准确度。当然,实施本专利技术的任一产品或方法必不一定需要同时达到以上所述的所有优点。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,本文档来自技高网...

【技术保护点】
1.一种异质信息网络的嵌入方法,其特征在于,所述方法包括:确定待嵌入异质信息网络中每个节点的表示向量;将所确定的表示向量输入至预先设定的双曲空间嵌入模型中;基于所述双曲空间嵌入模型,对所述表示向量进行双曲空间中的指数映射,得到所述每个节点在双曲空间中的嵌入向量。

【技术特征摘要】
1.一种异质信息网络的嵌入方法,其特征在于,所述方法包括:确定待嵌入异质信息网络中每个节点的表示向量;将所确定的表示向量输入至预先设定的双曲空间嵌入模型中;基于所述双曲空间嵌入模型,对所述表示向量进行双曲空间中的指数映射,得到所述每个节点在双曲空间中的嵌入向量。2.根据权利要求1所述的方法,其特征在于,所述确定待嵌入异质信息网络中每个节点的表示向量的步骤,包括:随机给定待嵌入异质信息网络中每个节点的表示向量。3.根据权利要求1所述的方法,其特征在于,在所述基于所述双曲空间嵌入模型,对所述表示向量进行双曲空间中的指数映射,得到所述每个节点在双曲空间中的嵌入向量的步骤之前,还包括:确定待嵌入异质信息网络中每个节点之间的关联关系;针对所述每个节点,基于所确定的关联关系,确定与该节点的距离在第一预设范围内的节点作为邻居节点,获取所述邻居节点的表示向量;计算该节点的表示向量与所述邻居节点的表示向量在双曲空间中的距离,作为第一距离;根据所述第一距离,计算该节点与所述邻居节点的相似度,作为第一相似度;计算所述第一相似度对于该节点的表示向量的梯度,作为该节点的第一梯度;所述基于所述双曲空间嵌入模型,对所述表示向量进行双曲空间中的指数映射,得到所述每个节点在双曲空间中的嵌入向量的步骤,包括:针对所述每个节点,基于所述双曲空间嵌入模型,根据该节点的表示向量和所述该节点的第一梯度,对该节点的表示向量进行双曲空间中的指数映射,得到该节点在双曲空间中的嵌入向量。4.根据权利要求3所述的方法,其特征在于,所述确定待嵌入异质信息网络中每个节点之间的关联关系的步骤,包括:根据待嵌入异质信息网络中每个节点的类型,生成所述待嵌入异质信息网络的元路径;针对所述待嵌入异质信息网络中每个节点,根据所述元路径确定与该节点的距离在第二预设范围内的节点,作为该节点的关联节点;所述第二预设范围大于第一预设范围;生成包括该节点以及所确定的关联节点的关系序列。5.根据权利要求1所述的方法,其特征在于,在所述基于所述双曲空间嵌入模型,对所述表示向量进行双曲空间中的指数映射,得到所述每个节点在双曲空间中的嵌入向量的步骤之前,还包括:确定待嵌入异质信息网络中每个节点之间的关联关系;针对所述每个节点,基于所述每个节点之间的关联关系,确定与该节点的距离在第一预设范围内的节点作为邻居节点,获取所述邻居节点的表示向量;计算该节点的表示向量与所述邻居节点的表示向量在双曲空间中的距离,作为第一距离;根据所述第一距离,计算该节点与所述邻居节点的相似度,作为第一相似度;计算所述第一相似度对于该节点的表示向量的梯度,作为该节点的第一梯度;针对所述每个节点,确定与该节点无关联关系的预设数量个节点作为负样本节点,获取所述负样本节点的表示向量;计算该节点的表示向量与所述负样本节点的表示向量在双曲空间中的距离,作为第二距离;根据所述第二距离,计...

【专利技术属性】
技术研发人员:石川王啸张依丁
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1