The invention discloses a method for estimating entry information based on random walk access frequency, which includes step 1: random selection of random walk seed nodes from a directed network to be estimated entry information. The seed nodes are arbitrary nodes of the network, and then random walk is implemented. The following nodes of random walk are randomly selected by the neighbor nodes of the current node; step 2: random selection of the neighbor nodes of the current node. In the process of traveling, the number of repeated visits to each node I is recorded xi; Step 3: When the number of steps n is equal to the number of nodes N i n the network, the number Xi of visits to each node I is counted; Step 4: Estimate the degree of access information according to the number of visits to each node i and output it; When the directed network is not strong, the present invention uses statistics randomly. The number of times each node is visited in the process of traveling is used to estimate the entrance information. The error of the estimated entrance information is small and the efficiency of the estimation is higher.
【技术实现步骤摘要】
基于随机游走访问频数的入度信息估计方法及系统
本专利技术属于社会网络拓扑信息估计领域,尤其涉及一种基于随机游走访问频数的入度信息估计方法及系统。
技术介绍
当前在线社交网络规模巨大,为研究者们提供了研究复杂网络、真实群体特征、行为的平台。而又由于其规模巨大,研究者们无法进行全网络信息收集或获取用于分析。一般地,只能通过随机游走的方式,获取网络的部分信息。利用获取的网络部分信息去恢复网络的拓扑结构是后续进行复杂网络分析、群体特征分析等的基础。但是怎样通过获取的网络部分信息去恢复网络拓扑结构中重要的一个环节是对网络入度分布的估计,因为在随机游走过程中,入度信息是潜在的、隐藏了。有了入度信息的估计,即网络入度分布的估计,才能进行网络拓扑结构的恢复,从而进一步得出全网络的特征。传统的入度信息估计方法,利用随机游走过程中能够收集到的出度信息,假设当网络中节点的入度边和出度边高度对称时,即网络无向性程度较高时(无向性即无向边的比例),可以得到基于出度信息的估计方法EST_out:其中,表示网络的入度分布估计,表示网络的出度分布的估计,qd(kout)是随机游走抽样获取样本的出度分布。然而对于在线社交网络来说,用户之间的关系或行为是有方向的,例如,“关注行为”可以是“关注”或“被关注”两种关系;“选举行为”可以是“选举”或“被选举”关系等等。由此,网络的边可以分为“入度边”和“出度边”,用于分别描述“指向”该节点的关系(边)和该节点指向其他节点的关系(边)。并且在大多数情况下,有向网络中的无向性不强。由此,利用式(1)得到的入度信息估计会引起很大的偏差,因此需要去解决有 ...
【技术保护点】
1.一种基于随机游走访问频数的复杂网络入度信息估计方法,其特征在于:包括以下步骤:步骤1:从待估计入度信息的有向网络中随机选择随机游走的种子节点,所述种子节点为网络的任意节点,然后实施随机游走,随机游走的后续节点由当前节点的邻居节点随机选出;步骤2:在随机游走过程中,记录各个节点i被重复访问的次数xi;步骤3:当实施行走的步数n与网络的节点数N相等时,统计每个节点i被访问的次数xi;步骤4:根据所统计的每个节点i被访问的次数估计入度信息pd(xi)并输出;
【技术特征摘要】
1.一种基于随机游走访问频数的复杂网络入度信息估计方法,其特征在于:包括以下步骤:步骤1:从待估计入度信息的有向网络中随机选择随机游走的种子节点,所述种子节点为网络的任意节点,然后实施随机游走,随机游走的后续节点由当前节点的邻居节点随机选出;步骤2:在随机游走过程中,记录各个节点i被重复访问的次数xi;步骤3:当实施行走的步数n与网络的节点数N相等时,统计每个节点i被访问的次数xi;步骤4:根...
【专利技术属性】
技术研发人员:吕欣,陈洒然,刘忠,谭跃进,秦烁,蔡梦思,黄格,肖时耀,
申请(专利权)人:中国人民解放军国防科技大学,
类型:发明
国别省市:湖南,43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。