一种优化聚类搜索结果的方法及其装置制造方法及图纸

技术编号:4333102 阅读:215 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种优化聚类搜索结果的方法及其装置,用以解决现有聚类搜索技术返回的搜索结果不能满足用户的个性化搜索需求的问题。具体技术方案包括:根据当前聚类搜索结果中的聚类类别,从预先保存的用户历史搜索信息中查找与所述聚类类别对应的历史权值;根据所述历史权值的查找结果以及所述聚类类别对应的当前权值,确定所述聚类类别对应的结果权值;根据所述结果权值,确定所述聚类类别返回给用户时的优先级。通过该技术方案返回的聚类搜索结果能够满足用户的个性化搜索需求,提高用户的体验度。

【技术实现步骤摘要】

本专利技术涉及互联网领域中的信息搜索技术,尤其涉及一种优化聚类搜索结果的方法及其装置
技术介绍
随着电子信息化时代的到来,互联网在人们的生活中发挥着越来越重要的作用,人们通过互联网可以快速、全面地搜索到其所需要的信息,给人们的生活、工作提供了很大的方便。 传统的基于计算机或者计算机网络的信息检索系统,对于用户查询所返回的搜索结果通常是包含了文档表示(例如文档的标题或摘要)或文档链接的一个列表,列表中的文档一般是按照文档与查询关键词之间的相关程度由高到低排序。用户在此列表中进一步查找和选取与自己要搜索的内容实际相关或有用的文档。但随着互联网的迅猛发展,互联网上的信息越来越多,系统返回给用户的搜索结果通常是成百上千的文档表示或文档链接,在大量的搜索结果中查找有用信息对用户而言是一种很大的负担,并且质量、类别等有很大不同的文档线性地罗列在一起也容易掩盖用户真正关心的文档。 针对上述问题,除了进一步提高文档检索技术(例如充分利用网页的超链接特征、文本格式化信息等),尽量将用户可能感兴趣的文档排列在靠前的位置之外,另外一种方便用户在搜索结果中进行浏览和查找的技术是系统对搜索结果进行自动分组(即对搜索结果进行聚类),将具有相似特征(例如相同主题)的文档放在同一组之中,并将聚类结果呈现给用户,提供给用户一个简单明了的用户界面,縮小了用户的查找范围,以便于用户只在感兴趣的少数类别中查找和选取所关心的文档。 现有技术提出的一种搜索结果的聚类方法中,预先记录搜索结果中被索引文档相对于其所包含的某个或者某几个关键词的一个或多个类别,然后根据预先记录的文档相对于包含在搜索请求中的某个或者某几个关键词的类别,对搜索结果中的文档进行分组,即将搜索结果中的文档归类到对应的聚类类别中。并根据搜索结果中文档归类情况为每个聚类类别设置一个权重值,该权重值用于表示聚类类别与所对应的文档的关联程度。通过该方法,可以将具有较高权重值的搜索结果聚类优先展示给用户,但是,由于网络信息的多变性,根据该方法,网络侧返回给用户的搜索结果中聚类类别的优先级往往是随网络信息的变化而变化的,因此,不能满足用户的个性化搜索需求,用户对搜索引擎的体验度差。
技术实现思路
本专利技术提供一种优化聚类搜索结果的方法及其装置,用以满足用户对搜索引擎返回的聚类搜索结果的个性化搜索需求。 本专利技术实施例通过如下技术方案实现 本专利技术实施例提供了一种优化聚类搜索结果的方法,包括 根据当前聚类搜索结果中的聚类类别,从预先保存的用户历史搜索信息中查找与4所述聚类类别对应的历史权值; 根据所述历史权值的查找结果以及所述聚类类别对应的当前权值,确定所述聚类类别对应的结果权值; 根据所述结果权值,确定所述聚类类别返回给用户时的优先级。 本专利技术实施例还提供了一种优化聚类搜索结果的装置,包括 历史权值查找单元,用于根据当前聚类搜索结果中的聚类类别,从预先保存的用户历史搜索信息中查找与所述聚类类别对应的历史权值; 结果权值确定单元,用于根据所述历史权值查找单元的查找结果以及所述聚类类别对应的当前权值,确定所述聚类类别对应的结果权值; 优先级确定单元,用于根据所述结果权值确定单元确定的结果权值,确定所述聚类类别返回给用户时的优先级。 通过上述技术方案,本专利技术实施例在将聚类搜索结果返回给用户之前,首先根据当前聚类搜索结果中的聚类类别,从预先保存的用户历史搜索信息中查找与该聚类类别对应的历史权值,并根据历史权值的查找结果以及该聚类类别对应的当前权值,确定该聚类类别对应的结果权值,进而根据结果权值,确定该聚类类别返回给用户时的优先级。本专利技术实施例能够根据用户的历史搜索行为以及当前搜索行为共同确定聚类类别返回给用户时的优先级,充分考虑了用户的个人搜索习惯以及个人喜好,从而满足了用户的个性化搜索需求,提高了用户的使用感受。附图说明 图1为本专利技术实施例中优化聚类搜索结果的流程 图2为本专利技术实施例中优化聚类搜索结果的装置示意图一 ; 图3为本专利技术实施例中优化聚类搜索结果的装置示意图二 ; 图4为本专利技术实施例中优化聚类搜索结果的装置示意图三; 图5为本专利技术实施例中优化聚类搜索结果的装置示意图四。具体实施例方式为了使聚类后的搜索结果更加符合用户的个性化搜索需求,以提高用户的使用感受,本专利技术实施例提出了一种优化聚类搜索结果的方法及其装置,下面结合说明书附图对本专利技术实施例的主要实现原理、具体实施过程及其对应能够达到的有益效果进行详细的阐述。 本专利技术实施例中,需要预先在搜索系统中建立并保存与不同用户对应的用户历史搜索信息,初始状态下,该用户历史搜索信息中默认有一种或多种聚类类别,并且分别为该一种或多种聚类类别指定对应的历史权值。其中,为聚类类别指定的历史权值可以为系统设定的默认值,该默认值可以根据用户预先在系统中选取的其感兴趣的聚类类别信息确定,例如,对于用户选取出的自己感兴趣的聚类类别,可以指定该聚类类别对应的历史权值为一个大于0的值,而对于用户未选取的聚类类别,可以指定该聚类类别对应的历史权值为O,如系统中为用户提供了三种聚类类别供其选择,分别为体育、文学、娱乐,用户根据自己的喜好选取出体育和娱乐,则根据用户的选择信息可以为体育和娱乐5对应的聚类类别分配历史权值为系统默认的一个大于o的值(如100),为文学对应的聚 类类别分配历史权值为o。 在搜索系统中,聚类类别及其对应的历史权值可以通过键-值对的方式保存, 即聚类类别与历史权值一一对应的方式。并且,在聚类类别比较多的情况下,可以通过建立 索引的方式保存用户历史搜索信息,以加快对聚类类别及其对应的历史权值的查找速度。 实际应用中,可以采用如下的数据结构保存用户历史搜索信息 <table>table see original document page 6</column></row><table> 将为不同用户建立的用户历史搜索信息存储到搜索引擎的存储系统中后,当用户登录后,系统根据该用户的user」d查找到与该用户对应的用户历史搜索信息,并将查找到的用户历史搜索信息自动加载到缓存中,以便对聚类搜索结果进行优化时使用。 下面,对本专利技术实施例中优化聚类搜索结果的具体过程进行详细描述,具体如图1所示,执行如下步骤 步骤101、根据当前聚类搜索结果中的聚类类别,从预先保存的用户历史搜索信息 中查找与该聚类类别对应的历史权值。 用户历史搜索信息中指定了聚类类别Cn与历史权值Wn的对应关系,其中,Cn(n =1、2、3……)表示第n个聚类类别,Wn(n = 1,2,3,...)表示与第n个聚类类别对应的 历史权值。该步骤IOI中,根据当前聚类搜索结果中的聚类类别Ci,从用户历史搜索信息中 查找该聚类类别Ci以及与之对应的历史权值Wi。 步骤102、判断是否查找到与当前聚类搜索结果中的聚类类别对应的历史权值,若 查找到,执行步骤103,否则执行步骤104。 步骤103、根据查找到的历史权值以及该聚类类别对应的当前权值,确定该聚类类 别对应的结果权值。 该步骤103中,可以将查找到的历史权值与该聚类类别对应的当前权值之和或平 均值,确定为该聚类类别对应的结果权值。进一步地,可以设定历史权值在对应的结果权值 中所本文档来自技高网
...

【技术保护点】
一种优化聚类搜索结果的方法,其特征在于,包括:根据当前聚类搜索结果中的聚类类别,从预先保存的用户历史搜索信息中查找与所述聚类类别对应的历史权值;根据所述历史权值的查找结果以及所述聚类类别对应的当前权值,确定所述聚类类别对应的结果权值;根据所述结果权值,确定所述聚类类别返回给用户时的优先级。

【技术特征摘要】
一种优化聚类搜索结果的方法,其特征在于,包括根据当前聚类搜索结果中的聚类类别,从预先保存的用户历史搜索信息中查找与所述聚类类别对应的历史权值;根据所述历史权值的查找结果以及所述聚类类别对应的当前权值,确定所述聚类类别对应的结果权值;根据所述结果权值,确定所述聚类类别返回给用户时的优先级。2. 如权利要求1所述的方法,其特征在于,当所述查找结果为查找到所述历史权值时, 根据所述历史权值的查找结果以及所述聚类类别对应的当前权值,确定所述聚类类别对应 的结果权值,包括根据查找到的所述历史权值以及所述聚类类别对应的当前权值,确定所述聚类类别对 应的结果权值。3. 如权利要求2所述的方法,其特征在于,当确定出所述聚类类别对应的结果权值后, 还包括利用所述聚类类别对应的结果权值更新所述用户历史搜索信息中与所述聚类类别对 应的历史权值。4. 如权利要求1所述的方法,其特征在于,当所述查找结果为未查找到所述历史权值 时,根据所述历史权值的查找结果以及所述聚类类别对应的当前权值,确定所述聚类类别 对应的结果权值,具体为将所述聚类类别对应的当前权值,确定为所述聚类类别对应的结果权值。5. 如权利要求4所述的方法,其特征在于,当确定出所述聚类类别对应的结果权值后, 还包括将所述聚类类别添加到所述用户历史搜索信息中,并将所述聚类类别对应的结果权值 确定为所述聚类类别的历史权值。6. 如权利要求1 5任一项所述的方法,其特征在于,当确定当前聚类搜索结果中所有 聚类类别返回给用户时的优先级后,还包括根据所述聚类类别返回给用户时的优先级,选取设定数目的聚类类别返回给用户。7. —种优化聚类搜索结果的装置,其特征在于,包括历史权值查...

【专利技术属性】
技术研发人员:胡珉孙宏伟罗治国
申请(专利权)人:中国移动通信集团公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1