The embodiments of the present invention provide an embedding method and device for heterogeneous information network, which can include: determining the representation vectors of each node in the heterogeneous information network to be embedded; inputting the determined representation vectors into the pre-established hyperbolic space embedding model; and mapping the representation vectors in hyperbolic space based on the hyperbolic space embedding model to obtain each of them. The embedding vectors of each node in hyperbolic space. The embodiment of the present invention shows that the structure and semantic information of the heterogeneous information network can be more appropriately reflected in the hyperbolic space because the hyperbolic space and the heterogeneous information network also have power-law distribution characteristics, so that the structure and semantic information of the heterogeneous information network can be preserved more completely. Therefore, the embedding accuracy can be improved.
【技术实现步骤摘要】
一种异质信息网络的嵌入方法和装置
本专利技术涉及网络嵌入领域,特别是涉及一种异质信息网络的嵌入方法和装置。
技术介绍
异质信息网络的嵌入,是指将异质信息网络中的节点以及节点之间的关系投射到度量空间中,在度量空间中将节点及节点之间的关系表示为向量。一般来说,要尽量保证原异质信息网络的结构和其中的语义信息的完整性,也就是尽量保证原异质信息网络中节点之间的关系保持不变。目前,大多方案是将异质信息网络嵌入在欧几里德空间中,也就是欧氏空间中。然而,专利技术人在研究中发现,由于异质信息网络中节点分布遵循幂律分布,而欧氏空间并不具有幂律分布特性,因此,将异质信息网络嵌入到欧氏空间,异质信息网络的结构和其中的语义信息保留得不够完整,也就是嵌入准确度不够高。
技术实现思路
本专利技术实施例的目的在于提供一种异质信息网络的嵌入方法和装置,以提高嵌入准确度。为了达到上述目的,本专利技术实施例公开了一种异质信息网络的嵌入方法,所述方法包括:确定待嵌入异质信息网络中每个节点的表示向量;将所确定的表示向量输入至预先设定的双曲空间嵌入模型中;基于所述双曲空间嵌入模型,对所述表示向量进行双曲空间中的指数映射,得到所述每个节点在双曲空间中的嵌入向量。可选的,所述确定待嵌入异质信息网络中每个节点的表示向量的步骤,包括:随机给定待嵌入异质信息网络中每个节点的表示向量。可选的,在所述基于所述双曲空间嵌入模型,对所述表示向量进行双曲空间中的指数映射,得到所述每个节点在双曲空间中的嵌入向量的步骤之前,还包括:确定待嵌入异质信息网络中每个节点之间的关联关系;针对所述每个节点,基于所确定的关联关系,确定与该 ...
【技术保护点】
1.一种异质信息网络的嵌入方法,其特征在于,所述方法包括:确定待嵌入异质信息网络中每个节点的表示向量;将所确定的表示向量输入至预先设定的双曲空间嵌入模型中;基于所述双曲空间嵌入模型,对所述表示向量进行双曲空间中的指数映射,得到所述每个节点在双曲空间中的嵌入向量。
【技术特征摘要】
1.一种异质信息网络的嵌入方法,其特征在于,所述方法包括:确定待嵌入异质信息网络中每个节点的表示向量;将所确定的表示向量输入至预先设定的双曲空间嵌入模型中;基于所述双曲空间嵌入模型,对所述表示向量进行双曲空间中的指数映射,得到所述每个节点在双曲空间中的嵌入向量。2.根据权利要求1所述的方法,其特征在于,所述确定待嵌入异质信息网络中每个节点的表示向量的步骤,包括:随机给定待嵌入异质信息网络中每个节点的表示向量。3.根据权利要求1所述的方法,其特征在于,在所述基于所述双曲空间嵌入模型,对所述表示向量进行双曲空间中的指数映射,得到所述每个节点在双曲空间中的嵌入向量的步骤之前,还包括:确定待嵌入异质信息网络中每个节点之间的关联关系;针对所述每个节点,基于所确定的关联关系,确定与该节点的距离在第一预设范围内的节点作为邻居节点,获取所述邻居节点的表示向量;计算该节点的表示向量与所述邻居节点的表示向量在双曲空间中的距离,作为第一距离;根据所述第一距离,计算该节点与所述邻居节点的相似度,作为第一相似度;计算所述第一相似度对于该节点的表示向量的梯度,作为该节点的第一梯度;所述基于所述双曲空间嵌入模型,对所述表示向量进行双曲空间中的指数映射,得到所述每个节点在双曲空间中的嵌入向量的步骤,包括:针对所述每个节点,基于所述双曲空间嵌入模型,根据该节点的表示向量和所述该节点的第一梯度,对该节点的表示向量进行双曲空间中的指数映射,得到该节点在双曲空间中的嵌入向量。4.根据权利要求3所述的方法,其特征在于,所述确定待嵌入异质信息网络中每个节点之间的关联关系的步骤,包括:根据待嵌入异质信息网络中每个节点的类型,生成所述待嵌入异质信息网络的元路径;针对所述待嵌入异质信息网络中每个节点,根据所述元路径确定与该节点的距离在第二预设范围内的节点,作为该节点的关联节点;所述第二预设范围大于第一预设范围;生成包括该节点以及所确定的关联节点的关系序列。5.根据权利要求1所述的方法,其特征在于,在所述基于所述双曲空间嵌入模型,对所述表示向量进行双曲空间中的指数映射,得到所述每个节点在双曲空间中的嵌入向量的步骤之前,还包括:确定待嵌入异质信息网络中每个节点之间的关联关系;针对所述每个节点,基于所述每个节点之间的关联关系,确定与该节点的距离在第一预设范围内的节点作为邻居节点,获取所述邻居节点的表示向量;计算该节点的表示向量与所述邻居节点的表示向量在双曲空间中的距离,作为第一距离;根据所述第一距离,计算该节点与所述邻居节点的相似度,作为第一相似度;计算所述第一相似度对于该节点的表示向量的梯度,作为该节点的第一梯度;针对所述每个节点,确定与该节点无关联关系的预设数量个节点作为负样本节点,获取所述负样本节点的表示向量;计算该节点的表示向量与所述负样本节点的表示向量在双曲空间中的距离,作为第二距离;根据所述第二距离,计...
【专利技术属性】
技术研发人员:石川,王啸,张依丁,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。