Construction method and apparatus of the present invention discloses a vertical search engine, which belongs to the technical field of the Internet, the method includes: obtaining the user search data when browsing the web, search data includes at least several web link group, each link group comprises a plurality of web page links; determine the first weight of several web links each a web link in the group; the same every link in the group web links are combined to determine the weights of second after the merger of each link value; on the basis of the second weights of each of the web link value obtained third weights of each group of \connection group value basis; third the weight value of a plurality of web link group from big to small order. The method provided by the invention improves the searching efficiency, and has the technical effect of improving the user search experience.
【技术实现步骤摘要】
一种纵向搜索引擎的构建方法及装置
本专利技术属于互联网
,特别涉及一种纵向搜索引擎的构建方法及装置。
技术介绍
现有的网页搜索引擎核心,如同谷歌公司使用的page-rank算法,其是先找到与搜索关键字相关的所有网页,再对结果集进行排序,排序依据是网页之间的引用。然而,使用上述现有的搜索引擎,当用户在搜索引擎中输入若干关键字时,搜索引擎返回的结果列表是对网页进行排序的结果。这样就使得用户在具体的搜索过程中,是通过在结果列表中依次点击网页链接来完成搜索过程,具有搜索效率低的技术缺陷。
技术实现思路
本专利技术提供一种纵向搜索引擎的构建方法及装置,用以解决现有技术中由于用户具体的搜索过程,是通过在结果列表中依次点击网页链接来完成搜索过程,而导致的具有搜索效率低的技术缺陷。依据本专利技术实施例的一个方面,本专利技术实施例提供了一种纵向搜索引擎的构建方法,包括:获取用户浏览网页时的搜索数据,所述搜索数据至少包括:若干个网页链接组,每一个所述网页链接组包括若干个网页链接;确定所述每一个所述网页链接组中所述若干个网页链接的第一权重值;将所述每一个所述网页链接组中相同的网页链接进行合并,以确定合并后的每一个所述网页链接的第二权重值;依据每一个所述网页链接的所述第二权重值获得每一组所述网页连接组的第三权重值;依据所述第三权重值将若干个所述网页链接组从大到小进行排序。进一步地,所述方法还包括:将排序后所述的若干个所述网页链接组按照排序顺序进行输出。进一步地,所述方法还包括:所述搜索数据还包括若干个关键词组,每一个所述关键词组对应每一个所述网页链接组。进一步地,所述方法还包括 ...
【技术保护点】
一种纵向搜索引擎的构建方法,其特征在于,所述方法包括:获取用户浏览网页时的搜索数据,所述搜索数据至少包括:若干个网页链接组,每一个所述网页链接组包括若干个网页链接;确定所述每一个所述网页链接组中所述若干个网页链接的第一权重值;将所述每一个所述网页链接组中相同的网页链接进行合并,以确定合并后的每一个所述网页链接的第二权重值;依据每一个所述网页链接的所述第二权重值获得每一组所述网页连接组的第三权重值;依据所述第三权重值将若干个所述网页链接组从大到小进行排序。
【技术特征摘要】
1.一种纵向搜索引擎的构建方法,其特征在于,所述方法包括:获取用户浏览网页时的搜索数据,所述搜索数据至少包括:若干个网页链接组,每一个所述网页链接组包括若干个网页链接;确定所述每一个所述网页链接组中所述若干个网页链接的第一权重值;将所述每一个所述网页链接组中相同的网页链接进行合并,以确定合并后的每一个所述网页链接的第二权重值;依据每一个所述网页链接的所述第二权重值获得每一组所述网页连接组的第三权重值;依据所述第三权重值将若干个所述网页链接组从大到小进行排序。2.如权利要求1所述的方法,其特征在于,还包括:将排序后所述的若干个所述网页链接组按照排序顺序进行输出。3.如权利要求1所述的方法,其特征在于:所述搜索数据还包括:若干个关键词组,每一个所述关键词组对应每一个所述网页链接组。4.如权利要求1至3中任一所述的方法,其特征在于:所述若干个网页链接组是三组,包括第一网页链接组,第二网页链接组,第三网页链接组;所述第一网页链接组中所述若干个网页链接的个数是n1;所述第二网页链接组中所述若干个网页链接的个数是n2;所述第三网页链接组中所述若干个网页链接的个数是n3;所述确定所述每一个所述网页链接组中所述若干个网页链接的第一权重值包括:对于所述第一网页链接组中,每一个网页链接的第一权重值是1/n1;对于所述第二网页链接组中,每一个网页链接的第一权重值是1/n2;对于所述第三网页链接组中,每一个网页链接的第一权重值是1/n3;其中,所述n1、所述n2和所述n3均为正整数。5.如权利要求4...
【专利技术属性】
技术研发人员:阮勇辉,俞侃,王丽君,詹玲,王方,
申请(专利权)人:华中科技大学文华学院,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。