一种纵向搜索引擎的构建方法及装置制造方法及图纸

技术编号:16456210 阅读:19 留言:0更新日期:2017-10-25 20:42
本发明专利技术公开一种纵向搜索引擎的构建方法及装置,属于互联网技术领域,该方法包括:获取用户浏览网页时的搜索数据,搜索数据至少包括:若干个网页链接组,每一个网页链接组包括若干个网页链接;确定每一个网页链接组中若干个网页链接的第一权重值;将每一个网页链接组中相同的网页链接进行合并,以确定合并后的每一个网页链接的第二权重值;依据每一个所述网页链接的第二权重值获得每一组网页连接组的第三权重值;依据第三权重值将若干个网页链接组从大到小进行排序。本发明专利技术提供的方法提高了搜索效率,具有提升用户搜索体验的技术效果。

Method and device for constructing vertical search engine

Construction method and apparatus of the present invention discloses a vertical search engine, which belongs to the technical field of the Internet, the method includes: obtaining the user search data when browsing the web, search data includes at least several web link group, each link group comprises a plurality of web page links; determine the first weight of several web links each a web link in the group; the same every link in the group web links are combined to determine the weights of second after the merger of each link value; on the basis of the second weights of each of the web link value obtained third weights of each group of \connection group value basis; third the weight value of a plurality of web link group from big to small order. The method provided by the invention improves the searching efficiency, and has the technical effect of improving the user search experience.

【技术实现步骤摘要】
一种纵向搜索引擎的构建方法及装置
本专利技术属于互联网
,特别涉及一种纵向搜索引擎的构建方法及装置。
技术介绍
现有的网页搜索引擎核心,如同谷歌公司使用的page-rank算法,其是先找到与搜索关键字相关的所有网页,再对结果集进行排序,排序依据是网页之间的引用。然而,使用上述现有的搜索引擎,当用户在搜索引擎中输入若干关键字时,搜索引擎返回的结果列表是对网页进行排序的结果。这样就使得用户在具体的搜索过程中,是通过在结果列表中依次点击网页链接来完成搜索过程,具有搜索效率低的技术缺陷。
技术实现思路
本专利技术提供一种纵向搜索引擎的构建方法及装置,用以解决现有技术中由于用户具体的搜索过程,是通过在结果列表中依次点击网页链接来完成搜索过程,而导致的具有搜索效率低的技术缺陷。依据本专利技术实施例的一个方面,本专利技术实施例提供了一种纵向搜索引擎的构建方法,包括:获取用户浏览网页时的搜索数据,所述搜索数据至少包括:若干个网页链接组,每一个所述网页链接组包括若干个网页链接;确定所述每一个所述网页链接组中所述若干个网页链接的第一权重值;将所述每一个所述网页链接组中相同的网页链接进行合并,以确定合并后的每一个所述网页链接的第二权重值;依据每一个所述网页链接的所述第二权重值获得每一组所述网页连接组的第三权重值;依据所述第三权重值将若干个所述网页链接组从大到小进行排序。进一步地,所述方法还包括:将排序后所述的若干个所述网页链接组按照排序顺序进行输出。进一步地,所述方法还包括:所述搜索数据还包括若干个关键词组,每一个所述关键词组对应每一个所述网页链接组。进一步地,所述方法还包括:所述若干个网页链接组是三组,包括第一网页链接组,第二网页链接组,第三网页链接组;所述第一网页链接组中所述若干个网页链接的个数是n1;所述第二网页链接组中所述若干个网页链接的个数是n2;所述第三网页链接组中所述若干个网页链接的个数是n3;所述确定所述每一个所述网页链接组中所述若干个网页链接的第一权重值包括:对于所述第一网页链接组中,每一个网页链接的第一权重值是1/n1;对于所述第二网页链接组中,每一个网页链接的第一权重值是1/n2;对于所述第三网页链接组中,每一个网页链接的第一权重值是1/n3;其中,所述n1、所述n2和所述n3均为正整数。进一步地,所述方法还包括:所述将所述每一个所述网页链接组中相同的网页链接进行合并,以确定合并后的每一个所述网页链接的第二权重值包括:在所述若干个网页链接中,将每一个相同的所述网页链接在对应的网页链接组中的第一权重值进行相加,作为合并后所述相同的所述网页链接的第二权重值;在所述若干个网页链接中,将每一个不同的所述网页链接在对应的网页链接组中的第一权重,作为所述不同的所述网页链接的第二权重。进一步地,所述方法还包括:所述依据每一个所述网页链接的所述第二权重值获得每一组所述网页连接组的第三权重值包括:分别将每一个所述网页链接组中所述若干个所述网页链接的第二权重值相加,作为所述网页链接组的第三权重值。依据本专利技术实施例的又一个方面,本专利技术实施例还提供了一种纵向搜索引擎的构建装置,所述装置包括:搜索数据获取模块,用于获取用户浏览网页时的搜索数据,所述搜索数据至少包括:若干个网页链接组,每一个所述网页链接组包括若干个网页链接;第一权重值确定模块,用于确定所述每一个所述网页链接组中所述若干个网页链接的第一权重值;第二权重值确定模块,用于将所述每一个所述网页链接组中相同的网页链接进行合并,以确定合并后的每一个所述网页链接的第二权重值;第三权重值确定模块,用于依据每一个所述网页链接的所述第二权重值获得每一组所述网页连接组的第三权重值;排序模块,依据所述第三权重值将若干个所述网页链接组从大到小进行排序。可选的,所述装置还包括:输出模块,用于将排序后所述的若干个所述网页链接组按照排序顺序进行输出。本专利技术实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:本专利技术通过首先获取用户使用搜索引擎时的网页链接搜索数据,第一方面,计算出各个网页链接的第一权重值,第二方面,合并相同网页链接计算出相同网页的第二权重值,第三方面,依据相同网页的第二权重值计算出网页链接组的第三权重值;第四方面,依据网页链接组的第三权重值对网页链接组进行从大到小的排序。这样就使得用户在具体的搜索过程中,当输入关键词进行搜索时,反馈给用户的结果列表是已经进行了排列后的结果,即可以是与用户输入关键词所对应的网页链接组,此时的网页链接组已经是从大到小进行的排序。网页链接组依据第三权重值进行排序的含义是:包含越多重要网页链接的网页链接组其重要性越高;包含在越多网页链接组中的网页链接其重要性越高。用户根据反馈的结果,不需要依次点击网页链接来完成搜索过程,反馈的结果即是为用户提供了经验信息参考,从而使用户依据经验信息更快的完成搜索过程,提高了搜索效率,提升了用户的搜索体验效果。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一实施例提供的一种纵向搜索引擎的构建方法的流程示意图;图2为本专利技术又一实施例提供的一种纵向搜索引擎的构建装置的结构框图;图3a为一种纵向搜索引擎的构建方法中一次完整的搜索过程定义1的示意图;图3b为一种纵向搜索引擎的构建方法中一次完整的搜索过程定义2的示意图;图4a为一种纵向搜索引擎的构建方法的两种不同搜索过程中搜索路径定义1的示意图;图4b为一种纵向搜索引擎的构建方法的两种不同搜索过程中搜索路径定义2的示意图;图5为一种纵向搜索引擎的构建方法中用户搜索的操作数据例子的示意图。具体实施方式本专利技术实施例提供的一种纵向搜索引擎的构建方法及装置,用以解决现有技术中用户具体的搜索过程,是通过在结果列表中依次点击网页链接来完成搜索过程,导致具有搜索效率低的技术问题,达到了提高搜索效率,提升了用户的搜索体验的技术效果。本专利技术实施例中的技术方案,总体思路如下:一种纵向搜索引擎的构建方法,所述方法包括:获取用户浏览网页时的搜索数据,所述搜索数据至少包括:若干个网页链接组,每一个所述网页链接组包括若干个网页链接;确定所述每一个所述网页链接组中所述若干个网页链接的第一权重值;将所述每一个所述网页链接组中相同的网页链接进行合并,以确定合并后的每一个所述网页链接的第二权重值;依据每一个所述网页链接的所述第二权重值获得每一组所述网页连接组的第三权重值;依据第三权重值将若干个所述网页链接组从大到小进行排序。本专利技术实施例通过获取用户使用搜索引擎时的网页链接搜索数据,第一计算出各个网页链接的第一权重值,第二合并相同网页链接计算出相同网页链接的第二权重值,第三依据相同网页链接的第二权重值计算出网页链接组的第三权重值;第四依据网页链接组的第三权重值对网页链接组进行从大到小的排序。用户在具本文档来自技高网...
一种纵向搜索引擎的构建方法及装置

【技术保护点】
一种纵向搜索引擎的构建方法,其特征在于,所述方法包括:获取用户浏览网页时的搜索数据,所述搜索数据至少包括:若干个网页链接组,每一个所述网页链接组包括若干个网页链接;确定所述每一个所述网页链接组中所述若干个网页链接的第一权重值;将所述每一个所述网页链接组中相同的网页链接进行合并,以确定合并后的每一个所述网页链接的第二权重值;依据每一个所述网页链接的所述第二权重值获得每一组所述网页连接组的第三权重值;依据所述第三权重值将若干个所述网页链接组从大到小进行排序。

【技术特征摘要】
1.一种纵向搜索引擎的构建方法,其特征在于,所述方法包括:获取用户浏览网页时的搜索数据,所述搜索数据至少包括:若干个网页链接组,每一个所述网页链接组包括若干个网页链接;确定所述每一个所述网页链接组中所述若干个网页链接的第一权重值;将所述每一个所述网页链接组中相同的网页链接进行合并,以确定合并后的每一个所述网页链接的第二权重值;依据每一个所述网页链接的所述第二权重值获得每一组所述网页连接组的第三权重值;依据所述第三权重值将若干个所述网页链接组从大到小进行排序。2.如权利要求1所述的方法,其特征在于,还包括:将排序后所述的若干个所述网页链接组按照排序顺序进行输出。3.如权利要求1所述的方法,其特征在于:所述搜索数据还包括:若干个关键词组,每一个所述关键词组对应每一个所述网页链接组。4.如权利要求1至3中任一所述的方法,其特征在于:所述若干个网页链接组是三组,包括第一网页链接组,第二网页链接组,第三网页链接组;所述第一网页链接组中所述若干个网页链接的个数是n1;所述第二网页链接组中所述若干个网页链接的个数是n2;所述第三网页链接组中所述若干个网页链接的个数是n3;所述确定所述每一个所述网页链接组中所述若干个网页链接的第一权重值包括:对于所述第一网页链接组中,每一个网页链接的第一权重值是1/n1;对于所述第二网页链接组中,每一个网页链接的第一权重值是1/n2;对于所述第三网页链接组中,每一个网页链接的第一权重值是1/n3;其中,所述n1、所述n2和所述n3均为正整数。5.如权利要求4...

【专利技术属性】
技术研发人员:阮勇辉俞侃王丽君詹玲王方
申请(专利权)人:华中科技大学文华学院
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1