一种SimRank迭代删点框架的上界计算方法技术

技术编号：13776399 阅读：70 留言：0更新日期：2016-09-30 23:37

一种SimRank迭代删点框架的上界计算方法，其特征在于，包括：(1)通过先验信息，建立超点，使得每个点与超点的相似度值不小于此点和其他点的相似度值；(2)通过以上特性，预估每个点与超点的相似度作为该点上界，在每次迭代中，预估值会不断减小，上界收敛。本发明专利技术方法snbUB的效果比现有技术geoUB的效果持续时间长，每轮迭代snbUB都能保持删点，并且snbUB的删点力度比geoUB的删点力度更大。本发明专利技术的上界不仅易于计算且十分逼近真实值。本发明专利技术可广泛应用于竞价搜索排名、网络垃圾监测和模式匹配等网络结构中结点相似度计算领域。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及SimRank计算领域，尤其涉及在SimRank迭代批量删点框架的上界计算方法。
技术介绍
SimRank是一种普适的网络节点结构相似度度量模型，广泛应用于竞价搜索排名、网络垃圾监测和模式匹配等领域。其基本思想可以概括为两个节点的邻居越相似，这两个节点越相似；即两个节点的相似度由其邻居节点的相似度决定。SimRank可以被广泛应用于具有一定关联的、可以被抽象化为网络模型的领域中：例如在社交网络中，SimRank可以被用于相似用户识别和朋友推荐,进而辅助链路预测和跟踪信息传播等。因其重要的作用，SimRank的计算一直是研究的热点问题之一。起初的研究焦点集中在SimRank的全匹配问题。给定一个含有n个节点,平均度为d的网络G,SimRank全匹配问题需要计算出网络中所有点对,即n×n对的SimRank值。SimRank的提出者Glen Jeh和Jennifer Widom教授设计了首个基于迭代的SimRank全匹配算法(文献：G.Jeh and J.Widom.SimRank:a measure of structural-context similarity.In Proceedings of the Eighth ACM SIGKDD International Conference onKnowledge Discovery and Data Mining,July 23-26,2002,Edmonton,Alberta,Canada,pages 538–543,2002)。该算法在处理SimRank全匹配问题上的时空开销分别为O(k...

【技术保护点】
一种SimRank迭代删点框架的上界计算方法，其特征在于，包括以下步骤：(1)通过先验信息，建立超点，使得每个点与超点的相似度值不小于此点和其他点的相似度值；给定一个点集R和其中某点v,此节点v的超点Vs是一个虚拟的点,满足Vs到达某点x的概率是是网络上除v以外的其他点到以相同步数到达该点的最大值，即：其中Rv代表点集R中除v以外的点，代表从点u出发走l步到达点x的概率；以S(v,u)表示点相似度v和点u的相似度，则对于点v和其超点Vs的相似度不小于点v和其他点的相似度，即如下不等式成立:S(v,Vs)≥S(v,u),u∈Rv＝R\{v}.(2)通过以上特性，预估每个点与超点的相似度作为该点上界，在每次迭代中，预估值会不断减小，上界因此收敛；上界的计算公式为：其中ρ(y,i)为二次相遇概率，代表了从点y出发走i步的两条随机路径再次相遇的概率，T代表了已经被计算出的二次相遇概率，凡是代表上界的地方用Snb表示，snbUB(v,u)是S(v,u)的一个估计。

【技术特征摘要】
1.一种SimRank迭代删点框架的上界计算方法，其特征在于，包括以下步骤：(1)通过先验信息，建立超点，使得每个点与超点的相似度值不小于此点和其他点的相似度值；给定一个点集R和其中某点v,此节点v的超点Vs是一个虚拟的点,满足Vs到达某点x的概率是是网络上除v以外的其他点...

【专利技术属性】
技术研发人员：李瑞琪，赵翔，唐九阳，陈一帆，肖卫东，
申请(专利权)人：中国人民解放军国防科学技术大学，
类型：发明
国别省市：湖南;43

全部详细技术资料下载我是这个专利的主人