一种基于局部搜索的网页重要性评估方法技术

技术编号:41573530 阅读:24 留言:0更新日期:2024-06-06 23:52
本发明专利技术通过网络技术领域的方法,实现了一种基于局部搜索的网页重要性评估方法。步骤S1,将网页以及网页之间的链接关系转化为图结构;步骤S2,在图结构上采样预设数量的随机游走;步骤S3,对目标节点t进行局部搜索,获得局部搜索的最终参数;步骤S4,根据步骤S2中随机游走的采样的终止节点、采样次数以及步骤S3中局部搜索的最终参数,计算目标节点t的佩奇排名分值的估计值;步骤S5,判断估计值是否足够准确;步骤S6,根据目标节点t佩奇排名分值的估计值评估与节点t对应的网页的重要性。本方案可以采用在互联网上对目标网页的局部搜索操作来评估目标网页的重要性,不需要完全依赖在互联网的全局进行随机游走实现评估。

【技术实现步骤摘要】

本专利技术涉及计算机中的网页排名,特别是关于一种基于局部搜索的网页重要性评估方法


技术介绍

1、在大数据时代,随着互联网信息量的指数级增长和用户对信息质量要求的不断提高,评估网页的重要性成为了信息检索领域的一项关键任务。这一过程不仅对搜索引擎的结果排序至关重要,也对用户体验和信息获取的效率有着直接影响。确定互联网上特定网页的价值和重要性已经变成了搜索引擎公司、大学和研究机构等众多实体极力关注的核心议题。在众多方法中,以谷歌和百度为首的搜索引擎广泛采用了佩奇排名这一指标来衡量网页的重要性,目的是为了计算互联网上某个特定网页的佩奇排名得分。但是,面对当前互联网上海量的信息存储,现行的佩奇排名计算方法在运行效率和计算准确度上存在不足,难以适应超大规模互联网数据的需求。特别是如专利cn116992153a所公开的方案中所采用的排名计算方法,虽然具有一定的性能优越性,但其只适用于将网页之间的链接关系用无向关系建模的情形,并且其未考虑结合局部搜索和随机游走采样的方法,因而其无法适用于更通用的将网页之间的链接关系建模为有向关系的情形,且其计算性能并非最优解。

<本文档来自技高网...

【技术保护点】

1.一种基于局部搜索的网页重要性评估方法,其特征在于:包括步骤S1-S6:

2.如权利要求1所述的一种基于局部搜索的网页重要性评估方法,其特征在于:所述图结构表示为G,其中包括若干与所述网页一一对应的节点以及多条与所述网页间的关系对应的有向边,目标网页对应为图结构中的目标节点t;

3.如权利要求1所述的一种基于局部搜索的网页重要性评估方法,其特征在于:所述预设数量的随机游走中,预设数量为nr=100。

4.如权利要求1所述的一种基于局部搜索的网页重要性评估方法,其特征在于:每次采样的所述随机游走的过程包含如下的步骤:

5.如权利要求1所述的...

【技术特征摘要】

1.一种基于局部搜索的网页重要性评估方法,其特征在于:包括步骤s1-s6:

2.如权利要求1所述的一种基于局部搜索的网页重要性评估方法,其特征在于:所述图结构表示为g,其中包括若干与所述网页一一对应的节点以及多条与所述网页间的关系对应的有向边,目标网页对应为图结构中的目标节点t;

3.如权利要求1所述的一种基于局部搜索的网页重要性评估方法,其特征在于:所述预设数量的随机游走中,预设数量为nr=100。

4.如权利要求1所述的一种基于局部搜索的网页重要性评估方法,其特征在于:...

【专利技术属性】
技术研发人员:魏哲巍杨铭基王涵之文继荣
申请(专利权)人:中国人民大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1