The invention discloses a link prediction methods based on deep belief network, first training data acquisition module from a given network structure in random sampling while training set and validation set and test set of edge edge; network node feature representation module after the training data acquisition module is processed in the network, using deepwalk algorithm to generate feature representation each network node; edge feature representation module to complete the verification and testing side edge set focused on the training set of edges, each edge computing feature representation, in order to meet the requirements of deep belief networks to input data, it is necessary to generate feature vectors of edges are normalized; finally deep belief network training modules to build a deep belief network structure, and load the training set and validation set and edge edge edge test set for training. The invention can achieve higher prediction accuracy than the traditional link prediction algorithm, and has universal applicability to networks with various structural characteristics.
【技术实现步骤摘要】
一种基于深度置信网络的链路预测方法
本专利技术属于人工神经网络
,具体涉及一种基于深度置信网络的链路预测方法。
技术介绍
基于游走的网络表示学习算法,例如deepwalk,是利用了word2vec的理论方法,将网络中的结点与自然语言处理中的词单元进行了类比,将网络中的一条一条的连接路径类比作自然语言处理中的一条语句;利用概率语言模型中求解每一个词语之间共现关系(即所有的条件概率参数)的方法来探讨网络结点之间的连接结构;利用生成词向量的方法生成了网络中结点的向量表示方法。通过这种类比算法得到的网络结点的向量,反映了对应网络结点与周围邻居结点联系的结构特征,同时实现了网络结点的低维向量表示,这就为针对网络数据的一些数据挖掘问题,比如网络结点分类,链路预测,社区发现等等,提供了一个新的使用机器学习算法进行处理或是优化的思路。深度学习是机器学习的一个分支,是基于传统人工神经网络计算模型,利用新的训练方式改进传统浅层神经网络的一类智能算法的总称。传统的浅层的神经网络模型通常面临着数据特征人工或者自行提取、容易求得局部极小值、多层(超过三层)的神经网络模型很难进行优化三个难题。Hinton于2006年提出深度置信网络,深度置信网络计算模型采用全新的网络结构和训练方式,很好的解决了上述的三个问题。现在,DBN已被广泛作为一种典型的改造传统的浅层神经网络计算模型网络层数和训练方式的一种深度学习算法。链路预测是通过给定网络的结点属性信息和网络的连接结构信息对网络中尚未存在边的结点对之间出现边的可能性的预测。链路预测任务既包括对网络中已经存在但尚未被发现的边的预测,也包 ...
【技术保护点】
一种基于深度置信网络的链路预测方法,其特征在于包含以下步骤:步骤1:训练数据采集模块完成从给定网络结构中随机采样得到训练边集、验证边集和测试边集,其中每一个边集中包含等比例的正样本和负样本;步骤2:网络结点特征表示模块在经过训练数据采集模块处理过的网络中,使用deepwalk算法生成每一个网络结点的特征表示;步骤3:边特征表示生成模块完成对训练边集、验证边集和测试边集中的每一条边计算边的特征表示,为了符合深度置信网络对输入数据的要求,还需要对生成的边的特征向量进行归一化处理;步骤4:深度置信网络训练模块完成深度置信网络结构的建立,并加载训练边集、验证边集和测试边集进行训练。
【技术特征摘要】
1.一种基于深度置信网络的链路预测方法,其特征在于包含以下步骤:步骤1:训练数据采集模块完成从给定网络结构中随机采样得到训练边集、验证边集和测试边集,其中每一个边集中包含等比例的正样本和负样本;步骤2:网络结点特征表示模块在经过训练数据采集模块处理过的网络中,使用deepwalk算法生成每一个网络结点的特征表示;步骤3:边特征表示生成模块完成对训练边集、验证边集和测试边集中的每一条边计算边的特征表示,为了符合深度置信网络对输入数据的要求,还需要对生成的边的特征向量进行归一化处理;步骤4:深度置信网络训练模块完成深度置信网络结构的建立,并加载训练边集、验证边集和测试边集进行训练。2.根据权利要求1所述的基于深度置信网络的链路预测方法,其特征在于步骤1中,每个边集的大小可以灵活配置,可以通过train_percent参数配置在所用现存的边中训练边集的正样本所占的比例;通过valid_percent参数配置验证边集和测试边集之间的比例关系。3.根据权利要求2所述的基于深度置信网络的链路预测方法,其特征在于验证边集和测试边集中的正样本需要从原始网络结构中去除,在去除过程中为了保证网络的连通性,需要首先建立一个网络的生成树,负...
【专利技术属性】
技术研发人员:李涛,王次臣,李华康,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。