【技术实现步骤摘要】
本专利技术涉及,可用于优化网页搜索结果的相关性。
技术介绍
网页搜索引擎的目的就是把用户关心的网页结果按照相关性和重要性排序显示给用户。最著名的就是google的I^geRank专利技术,其核心思想就是把某个网页的重要性根据其内含各前向链接传递给所指向网页,从而影响所指向网页的重要性。PageRank采用基于均勻分布的随机模型,也就是说某个页面内所有链接都均分该页的重要性。其计算模型参见
【技术保护点】
1.一种基于链接在网页中所处位置的计算网页重要性的方法,其特征在于,包含:(1)一个网页内指向其他网页的链接的重要性与其在该网页中的位置有关;(2)一个网页中各链接与屏幕中心的距离越近,该链接继承本网页重要性权重越大;(3)改进的PageRank计算模型HRank如下:假设页面T1…Tn都有链接指向页面A,d是一个阻尼因子,可以是0到1之间的一个数,HR(A)即是页面A的重要性值,而p(Ti)则是页面Ti中指向页面A的那个链接Link(Ti->A)的重要性系数,Si代表链接Link(Ti->A)起始位置与屏幕中心的距离,Ti页面中有m个指向其他页面的链接,则:(math)??(mrow)?(mi)HR(/mi)?(mrow)?(mo)((/mo)?(mi)A(/mi)?(mo))(/mo)?(/mrow)?(mo)=(/mo)?(mrow)?(mo)((/mo)?(mn)1(/mn)?(mo)-(/mo)?(mi)d(/mi)?(mo))(/mo)?(/mrow)?(mo)+(/mo)?(mi)d(/mi)?(munderover)?(mi)Σ(/mi)?(mrow)?(m ...
【技术特征摘要】
1.一种基于链接在网页中所处位置的计算网页重要性的方法,其特征在于,包含(1)一个网页内指向其他网页的链接的重要性与其在该网页中的位置有关;(2)一个网页中各链接与屏幕中心的距离越近,该链接继承本网页重要性权重越大;(3)改进的I^ageRank计算模型HRank如下假设页面ΤΡ··Τη都有链接指向页面A,d是一个阻尼因子,可以是0到1之间的一个数, HR(A)即是页面A的重要性值,而ρ (Ti)则是页面Ti中指向页面A的那个链接Link(Ti-> Α)的重要性系数,Si代表链接Link (Ti-> Α)起始位置与屏幕中心的距离,Ti页面中有m 个指向其他页面的链...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。