一种搜索网络信息的方法和系统技术方案

技术编号:7809397 阅读:143 留言:0更新日期:2012-09-27 08:14
本发明专利技术公开了一种搜索网络信息的方法和系统,根据当前正在浏览的网络信息,客户端将所述网络信息的标签发送给服务器端的相关内容分析模块;相关内容分析模块将所述网络信息的标签发送给标签智能关联模块;标签智能关联模块从标签数据库中获取到所有与所述网络信息的标签关联的标签,并选择关联度大于预定阈值的标签,返回给相关内容分析模块;相关内容分析模块根据接收到的标签,从内容数据库中获得标签对应的网络信息;相关内容分析模块将获得的网络信息返回给客户端。采用了本发明专利技术的技术方案,能够最大限度的将与当前内容最相关的内容展示给用户,帮助用户延伸阅读。

【技术实现步骤摘要】

本专利技术涉及海量信息检索
,尤其涉及一种网络搜索信息的方法和系统。
技术介绍
在互联网平台上,为了提高用户黏度,网站通常会在用户浏览某个内容的同时,向用户自动推荐与之相关的内容。相关内容的计算方式有很多种,不同的业务系统有不同的技术实现手段,其目的是让用户浏览内容时,可以延展到更多他可能需要的内容,并引导他去进行下一步的点击浏览,来增加用户在网站中的停留时间,提高点击率,提升站点粘性。如何用最科学最合理的手段来向用户推荐有用的相关信息,不同的应用平台其出发点并不一样,或者通过人工推荐,或者通过自动关联。针对自动关联,目前较为通用的方式是通过某个关键词来直接进行相关内容查 找,例如内容A包含关键词“旅游”,则与内容A相关的内容传统方式则根据关键词“旅游”来查找,将其它也包含“旅游”关键词的内容作为内容A的相关内容。现有的相关内容方式能够准确地找到跟当前内容具备相同关键词的内容,但是只能够看到具备相同或者相似主题的内容,并不是真正意义上的“相关内容”,其对内容的关联拓展性明显不够,例如我们在浏览“旅游”相关的内容时,传统方式的相关内容分析具备较大局限性,只能获取到包含“旅游”标签的内容,那些并不包含“旅游”标签的却与之有相关性的内容却并不能显示出来,例如“导游”、“打折机票”等。现有依靠标签方式解决的相关内容过于狭隘,很多阅读场景下,我们阅读一个内容时,并不需要看到相同主题的内容,而是在意义上存在关联度的内容。
技术实现思路
本专利技术的目的在于提出一种搜索网络信息的方法和系统,能够最大限度的将与当前内容最相关的内容展示给用户,帮助用户延伸阅读。为达此目的,本专利技术采用以下技术方案 一种搜索网络信息的方法,包括以下步骤 A、根据当前正在浏览的网络信息,客户端将所述网络信息的标签发送给服务器端的相关内容分析模块; B、相关内容分析模块将所述网络信息的标签发送给标签智能关联模块; C、标签智能关联模块从标签数据库中获取到所有与所述网络信息的标签关联的标签,并选择关联度大于预定阈值的标签,返回给相关内容分析模块;D、相关内容分析模块根据接收到的标签,从内容数据库中获得标签对应的网络信息; E、相关内容分析模块将获得的网络信息返回给客户端。步骤C中,采用随机函数,根据关联度从所有与所述网络信息的标签关联的标签中进行选择,选中概率与关联度成正比。步骤E中,相关内容分析模块将获得的网络信息组织成预设的数据格式返回给客户端。一种搜索网络信息的系统,包括客户端、相关内容分析模块、标签智能关联模块、标签数据库和内容数据库,客户端与相关内容分析模块连接,相关内容分析模块分别与标签智能关联模块和内容数据库连接,标签智能关联模块与标签数据库连接,其中, 客户端用于将网络信息的标签发送给相关内容分析模块,并接收相关内容分析模块返回的网络信息; 相关内容分析模块用于将所述网络信息的标签发送给标签智能关联模块,从标签智能关联模块获得关联度大于预定阈值的、与所述网络信息的标签关联的标签,并从内容数据库中获得标签对应的网络信息,返回给客户端; 标签智能关联模块用于从标签数据库中获取到所有与所述网络信息的标签关联的标签,并选择关联度大于预定阈值的标签,返回给相关内容分析模块; 标签数据库用于存储标签及其相互之间的关联度; 内容数据库用于存储标签对应的网络信息。采用了本专利技术的技术方案,对内容的相关性挖掘不但停留在内容所对应标签的字面相同或相似性上,更要依靠标签与标签之间的语义关联来帮助用户推荐相关内容,并通过特有的算法分析,来从一个标签相关的大量标签之中,用更合理的方式筛选出相关的一些标签,再以此来显示相关内容,从而最大限度的将与当前内容最相关的内容展示给用户,帮助用户延伸阅读。附图说明图I是本专利技术具体实施方式中搜索网络信息的系统结构示意图。图2是本专利技术具体实施方式中搜索网络信息的流程图。具体实施例方式下面结合附图并通过具体实施方式来进一步说明本专利技术的技术方案。本专利技术技术方案的主要思想是对内容的相关性挖掘不但停留在内容所对应标签的字面相同或相似性上,更要依靠标签与标签之间的语义关联来帮助用户推荐相关内容,并通过特有的算法分析,来从一个标签相关的大量标签之中,用更合理的方式筛选出相关的一些标签,再以此来显示相关内容。例如一个内容A有“牛顿”的标签,我们关联的相关内容所对应的标签可能只有“万有引力”、“经典力学”这些词汇,我们通过这种方式来帮助用户发掘与自己所浏览内容具备更广范围内关联的内容,去延伸阅读。所以首先需要设置一个标签数据库,将标签及其两两之间的关联度存储其中,为后续步骤所使用。下面描述如何建立这个标签数据库首先收集信息,对每一条信息设置不少于I个标签,用于标识信息;其次将每一条信息的任意两个标签分成一组,并将每一组的两个标签及其之间的对应关系存储到数据库中,并设置计数值对数据库中每一组标签出现次数进行计数。这个出现的次数就是两个标签的关联度。图I是本专利技术具体实施方式中搜索网络信息的系统结构示意图。如图I所示,该系统包括客户端101、相关内容分析模块102、标签智能关联模块103、标签数据库104和内容数据库105。客户端与相关内容分析模块连接,相关内容分析模块分别与标签智能关联模块和内容数据库连接,标签智能关联模块与标签数据库连接。客户端将网络信息的标签发送给相关内容分析模块,并接收相关内容分析模块返回的网络信息,相关内容分析模块将所述网络信息的标签发送给标签智能关联模块,从标签智能关联模块获得关联度大于预定阈值的、与所述网络信息的标签关联的标签,并从内容数据库中获得标签对应的网络信息,返回给客户端,标签智能关联模块从标签数据库中获取到所有与所述网络信息的标签关联的标签,并选择关联度大于预定阈值的标签,返回给相关内容分析模块,标签数据库存储标签及其相互之间的关联度,内容数据库存储标签对应的网络信息。图2是本专利技术具体实施方式中搜索网络信息的流程图。如图2所示,该流程包括以下步骤 步骤201、根据当前正在浏览的网络信息,客户端将网络信息的标签发送给服务器端的相关内容分析模块。步骤202、相关内容分析模块将网络信息的标签发送给标签智能关联模块。步骤203、标签智能关联模块从标签数据库中获取到所有与网络信息的标签关联的标签,并选择关联度大于预定阈值的标签,返回给相关内容分析模块。在大的数据量前提之下,由于任何一个标签的关联标签数目都会非常庞大,所以要限定取出来的数量。而即使如此,仍然会有为数众多的标签,受限于相关内容的总体数量,不可能显示过多的内容,因此要用一种合理的方式再从这些标签中进一步筛选,并最终将筛选出的标签返回给分析模块。因此采用随机函数,根据关联度从所有与网络信息的标签关联的标签中进行选择,选中概率与关联度成正比。例如表I显示了标签A、关联标签及两者的关联度。表 I标签名相关标签名关联度权重 j示签A标签I100 fe签A标签298 j示签A标签389 ¥¥T…… i示签A标签n40 耘签六I标签m 丨35理论上而言,标签I到m跟标签A都具备关联度,但是如果仅仅简单的取出标签1,往往会带来体验上的错觉——浏览标签A的主题内容,得到的相关内容却全部是标签I的主题,在本具体实施方式中,采用本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种搜索网络信息的方法,其特征在于,包括以下步骤 A、根据当前正在浏览的网络信息,客户端将所述网络信息的标签发送给服务器端的相关内容分析模块; B、相关内容分析模块将所述网络信息的标签发送给标签智能关联模块; C、标签智能关联模块从标签数据库中获取到所有与所述网络信息的标签关联的标签,并选择关联度大于预定阈值的标签,返回给相关内容分析模块; D、相关内容分析模块根据接收到的标签,从内容数据库中获得标签对应的网络信息; E、相关内容分析模块将获得的网络信息返回给客户端。2.根据权利要求I所述的ー种搜索网络信息的方法,其特征在于,步骤C中,采用随机函数,根据关联度从所有与所述网络信息的标签关联的标签中进行选择,选中概率与关联度成正比。3.根据权利要求I所述的ー种搜索网络信息的方法,其特征在于,步骤E中,相关内容分析模块将获得的网络信息组织成预设的数据...

【专利技术属性】
技术研发人员:官文吉
申请(专利权)人:天脉聚源北京传媒科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1