异构信息网络关系预测方法、可读存储介质和终端技术

技术编号:20726302 阅读:36 留言:0更新日期:2019-03-30 17:59
一种异构信息网络关系预测方法、可读存储介质和终端,所述方法包括:获取原始输入的目标节点对集合;将所述目标节点对集合进行预处理,得到对应的正例集合和未标记例集合;基于所得到的正例集合,从所述未标记例集合中抽取对应的未标记例,组成对应的可靠反例集合;采用所述正例集合和所得到的可靠反例集合训练得到对应的异构信息网络关系预测模型;采用训练得到的异构信息网络关系预测模型对待预测网络中节点之间的未知关系进行预测。上述的方案,可以提高异构信息网络中节点关系预测的准确性。

【技术实现步骤摘要】
异构信息网络关系预测方法、可读存储介质和终端
本专利技术属于数据分析
,特别是涉及一种异构信息网络关系预测方法、可读存储介质和终端。
技术介绍
随着科学技术的飞速发展,人们的社交方式越来越多元化,各种各样的复杂网络由此诞生。从蚁群结构到社交系统、从神经系统到生态系统、从交通系统到电力系统等现实世界中的复杂系统都可以拓扑近似为复杂网络结构。复杂系统中的对象抽象表示为网络中的节点,对象间的交互关系抽象表示为节点间的链接。在复杂网络研究中,链接预测因其巨大的应用价值受到研究者广泛的关注。当前,大部分链接预测的研究对象为同质的复杂网络,即网络中的节点和链接类型单一。然而,现实复杂网络大多是异构的网络,存在多种类型的节点和节点间复杂的依赖关系。同构网络本质上只是异质网络的一个同质切面,因此仅研究同构网络会丢失重要的信息。例如,现实的社交网络中不仅仅存在用户节点和表示朋友关系的链接,还包括日志、词语、位置和时间戳等类型的节点和表示日志与词语节点间包含关系的链接、日志与地点间签到关系的链接等;在医疗网络中的节点有病人、医生、疾病、药物和医院地点等类型。这些信息对于目标链接的预测都有潜在的影响本文档来自技高网...

【技术保护点】
1.一种异构信息网络关系预测方法,其特征在于,包括:获取原始输入的目标节点对集合;将所述目标节点对集合进行预处理,得到对应的正例集合和未标记例集合;基于所得到的正例集合,从所述未标记例集合中抽取对应的未标记例,组成对应的可靠反例集合;采用所述正例集合和所得到的可靠反例集合训练得到对应的异构信息网络关系预测模型;采用训练得到的异构信息网络关系预测模型对待预测网络中节点之间的未知关系进行预测。

【技术特征摘要】
1.一种异构信息网络关系预测方法,其特征在于,包括:获取原始输入的目标节点对集合;将所述目标节点对集合进行预处理,得到对应的正例集合和未标记例集合;基于所得到的正例集合,从所述未标记例集合中抽取对应的未标记例,组成对应的可靠反例集合;采用所述正例集合和所得到的可靠反例集合训练得到对应的异构信息网络关系预测模型;采用训练得到的异构信息网络关系预测模型对待预测网络中节点之间的未知关系进行预测。2.根据权利要求1所述的异构信息网络关系预测方法,其特征在于,所述将所述目标节点对集合进行预处理,包括:对给定的网络图构造以目标节点类型为起始点的元路径集合;计算目标节点对集合中的每个节点对对应的每条元路径的路径数和随机游走特征;采用每个节点对构成该节点的每条元路径的路径数和随机游走特征构建节点对对应的示例,形成示例集合;将所述示例集合中存在目标关系的节点对对应的示例作为正例,将不存在目标关系的节点对对应的示例作为未标记例,得到所述正例集合和未标记例集合。3.根据权利要求1所述的异构信息网络关系预测方法,其特征在于,所述基于所得到的正例集合,从所述未标记例集合中抽取对应的未标记例,组成对应的可靠反例集合,包括:分别对所述正例集合和未标记例集合进行聚簇,得到对应的局部正簇和局部未标记簇;基于所述局部正簇和局部未标记簇中的示例的特征,计算每个局部正簇到局部未标记簇之间的距离;每个所述局部正簇向与其距离大于预设的距离阈值的局部未标记簇进行投票,并将投票总数排列在前的预设数量个局部未标记簇中的未标记例作为反例,得到所述可靠反例集合。4.根据权利要求3所述的异构信息网络关系预测方法,其特征在于,所述局部正簇和局部未...

【专利技术属性】
技术研发人员:陈可佳吴桐
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1