推荐搜索短语的方法及系统技术方案

技术编号:11412701 阅读:72 留言:0更新日期:2015-05-06 12:34
本发明专利技术提供一种推荐搜索短语的方法及系统,所述方法包括:获取用户的搜索信息;提取所述获取的搜索信息的关键词;根据所述提取的关键词获取待推荐的搜索短语;将所述获取的待推荐的搜索短语显示给所述用户。通过采用本发明专利技术可以根据用户的搜索信息向该用户推荐搜索短语,从而可以使用户便捷地获取到与其可能的兴趣点相关的内容,降低搜索成本,提高用户体验度;同时以该推荐搜索短语作为流量入口,可以为搜索引入更多的流量。

【技术实现步骤摘要】
推荐搜索短语的方法及系统
本专利技术涉及通信领域,更为具体而言,涉及推荐搜索短语的方法及系统。
技术介绍
随着互联网技术的发展以及网络信息的大范围覆盖,用户在浏览信息时需要从海量的信息中选择自己感兴趣的内容,这样不仅浪费时间而且还会造成信息资源的浪费,同时也会影响用户体验;另外,从流量的角度,由于网站流量是网站的基础,流量的大小影响着该网站的竞争力,除了其自有流量以外,需要通过其他方式来给网站引入流量,然而,在现有技术中,导流产品大部分以实现商业最大化为目的,所推荐的内容为纯商业词,不能满足用户在当前页面的扩展浏览的需求。
技术实现思路
为有效地解决上述技术问题,本专利技术提供了一种推荐搜索短语的方法及系统。一方面,本专利技术的实施方式提供了一种推荐搜索短语的方法,所述方法包括:获取用户的搜索信息;提取所述获取的搜索信息的关键词;根据所述提取的关键词获取待推荐的搜索短语;将所述获取的待推荐的搜索短语显示给所述用户。另一方面,本专利技术的实施方式还提供了一种推荐搜索短语的系统,所述系统包括:第一获取模块,用于获取用户的搜索信息;提取模块,用于提取所述第一获取模块所获取的搜索信息的关键词;第二获取模块,用于根据所述提取模块所提取的关键词获取待推荐的搜索短语;显示模块,用于将所述第二获取模块所获取的待推荐的搜索短语显示给所述用户。实施本专利技术提供的推荐搜索短语的方法及系统可以根据用户的搜索信息向该用户推荐搜索短语,从而可以使用户便捷地获取到与其可能的兴趣点相关的内容,降低搜索成本,提高用户体验度;同时以该推荐搜索短语作为流量入口,可以为搜索引入更多的流量。附图说明图1是根据本专利技术实施方式的一种推荐搜索短语的方法的流程图;图2示出了图1所示的处理S120的一种实施方式;图3示出了图2所示的处理S121的一种实施方式;图4示出了图2所示的处理S122的一种实施方式;图5示出了图1所示的处理S140的一种实施方式;图6是根据本专利技术实施方式的一种推荐搜索短语的系统的结构示意图;图7示出了图6所示的提取模块120的一种实施方式;图8示出了图7所示的中心词提取单元121的一种实施方式;图9示出了图7所示的主题词提取单元122的一种实施方式;图10示出了图6所示的显示模块140的一种实施方式。具体实施方式为使本专利技术的实施例的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术作详细描述。图1是根据本专利技术实施方式的一种推荐搜索短语的方法的流程图。参见图1,该方法包括:S110:获取用户的搜索信息。其中,在本专利技术的实施方式中,该搜索信息包括:所述用户的历史搜索文本以及所述用户浏览的页面(包括历史浏览页面以及当前浏览页面)。S120:提取所述获取的搜索信息的关键词。其中,该关键词包括:所述历史搜索文本的中心词以及所述用户浏览的页面的主题词。S130:根据所述提取的关键词获取待推荐的搜索短语。其中,在本专利技术的实施方式中,所述处理S130可以通过以下方式实现:通过所述提取到的关键词检索推荐模型以获得作为所述待推荐的搜索短语的检索结果,其中,在一种实施方式中,所述推荐模型可以包括:搜索引擎的全部搜索文本的中心词以及与所述中心词对应的热门搜索短语,其中,该热门搜索短语指在预定的时间周期内,搜索量达到预定阈值的搜索短语,可以通过搜索引擎的搜索日志按时间周期统计得到。S140:将所述获取的待推荐的搜索短语显示给所述用户。其中,在本专利技术的实施方式中,为不影响用户浏览当前页面的主体内容,可以将各搜索短语显示在当前页面的底端。此外,还可以在搜索短语与该搜索短语对应的搜索结果页之间建立链接,从而使用户点击该搜索短语时直接跳转到对应的搜索结果页。需要说明的是,以上仅仅是对本专利技术的举例说明,在不脱离本专利技术原理的前提下可以进行各种修改和变形,例如,可以将各搜索短语显示在当前页面的左侧、右侧或者左上端、右上端。如图2所示,所述处理S120具体可以包括:S121:提取所述历史搜索文本的中心词;以及,S122:提取所述用户浏览的页面的主题词。本专利技术实施方式不限于此,本领域技术人员可以采用其他实施方式,只要能够提取所获取的搜索信息的关键词即可。如图3所示,所述处理S121可以通过以下方式实现:S1211:对所述历史搜索文本进行切词以生成第一切分元素集合;S1212:对所述生成的第一切分元素集合中的各元素进行词性标注以及权重标注。S1213:根据所述标注的结果提取出所述历史搜索文本的中心词,例如可以提取词性为高价值词性且权重大于或等于该第一切分元素集合中的其他高价值词性的元素的权重的元素作为该中心词,当然本专利技术不限于此,本领域的技术人员可以根据实际需要按照其他合理方式,根据标注的结果提取出该历史搜索文本的中心词。如图4所示,所述处理S122可以通过以下方式实现:S1221:获取所述用户浏览的页面的页面文本。S1222:根据所述获取的页面文本,提取所述页面的标题和页面正文;S1223:根据所述提取的标题和页面正文提取出所述页面的主题词。其中,在本专利技术的实施方式中,所述处理S1223可以通过以下方式实现:对所述提取的标题和页面正文进行切词以生成第二切分元素集合;挖掘所述生成的第二切分元素集合中的各元素之间的依存关系;将所述挖掘出的依存关系作为影响系数作用于所述各元素的权重;根据所述作用的结果,选取出权重大于或等于所述第二切分元素集合中其他任意一个元素的权重的元素作为所述页面的主题词。本专利技术实施方式不限于此,本领域技术人员可以采用其他实施方式,只要能够提取所述页面的主题词即可。为补充数据的多样性以及满足用户时效性需求,在本专利技术的一种优选的实施方式中,该方法还可以包括:获取搜索引擎的搜索日志;根据所述获取的搜索日志获取所述待推荐的搜索短语。具体地,可以根据搜索引擎的搜索日志,按照时间和/或事件维度统计出预定的时间周期内的热门搜索短语以获得实时的热门搜索短语,该实时的热门搜索短语即为所述待推荐的搜索短语。其中该预定的时间周期例如可以是1小时,即可以每经过1小时对该实时的热门搜索短语进行一次数据更新,当然本专利技术不限于此,本领域的技术人员可以根据实际需要合理设置该预定的时间周期。为使用户更为快速、便捷的搜索到与其可能的兴趣点相关的内容,如图5所示,所述处理S140可以包括:S141:对所述待推荐的搜索短语进行排序。S142:根据所述排序的结果将所述待推荐的搜索短语显示给所述用户。其中,在本专利技术的实施方式中,所述处理S141可以通过以下方式实现:根据所述用户的自然属性信息(例如性别、年龄、职业、兴趣等信息)计算所述待推荐的搜索短语的初始排序分数;根据用户行为数据(用户对显示的搜索短语进行的点击、浏览、鼠标停留等动作)以及自然冷却模型调节所述计算出的初始排序分数;根据所述调节后的排序分数对所述待推荐的搜索短语进行排序。其中,该用户的自然属性信息可以在执行根据所述用户的自然属性信息计算所述待推荐的搜索短语的初始排序分数的步骤前,根据所述用户的搜索信息的关键词,通过分类器预测出;该自然冷却模型是根据物理学上的冷却定律,建立的一个排序分数与时间之间的函数关系,使得排序分数随着时间的推移逐渐降低,有效地避免短时间爆发的高时效性的搜索短语长时间占据排序的领先位置的情况。以下结合具体的例子对本专利技术的本文档来自技高网...

【技术保护点】
一种推荐搜索短语的方法,其特征在于,所述方法包括:获取用户的搜索信息;提取所述获取的搜索信息的关键词;根据所述提取的关键词获取待推荐的搜索短语;将所述获取的待推荐的搜索短语显示给所述用户。

【技术特征摘要】
1.一种推荐搜索短语的方法,其特征在于,所述方法包括:获取用户的搜索信息;提取获取的所述搜索信息的关键词;根据提取的所述关键词获取待推荐的搜索短语;将获取的所述待推荐的搜索短语显示给所述用户;其中,根据提取的所述关键词获取待推荐的搜索短语包括:通过提取的所述关键词检索推荐模型以获得作为所述待推荐的搜索短语的检索结果,其中所述推荐模型包括:搜索引擎的全部搜索文本的中心词以及与所述中心词对应的热门搜索短语。2.如权利要求1所述的方法,其特征在于,所述搜索信息包括:所述用户的历史搜索文本以及所述用户浏览的页面。3.如权利要求2所述的方法,其特征在于,提取获取的所述搜索信息的关键词包括:提取所述用户的历史搜索文本的中心词;以及提取所述用户浏览的页面的主题词。4.如权利要求3所述的方法,其特征在于,提取所述用户的历史搜索文本的中心词包括:对所述用户的历史搜索文本进行切词以生成第一切分元素集合;对生成的所述第一切分元素集合中的各元素进行词性标注以及权重标注;根据所述标注的结果提取出所述用户的历史搜索文本的中心词。5.如权利要求3所述的方法,其特征在于,提取所述用户浏览的页面的主题词包括:获取所述用户浏览的页面的页面文本;根据获取的所述页面文本,提取所述页面的标题和页面正文;根据提取的所述标题和页面正文提取出所述页面的主题词。6.如权利要求5所述的方法,其特征在于,根据提取的所述标题和页面正文提取出所述页面的主题词包括:对提取的所述标题和页面正文进行切词以生成第二切分元素集合;挖掘生成的所述第二切分元素集合中的各元素之间的依存关系;将挖掘出的所述依存关系作为影响系数作用于所述各元素的权重;根据所述作用的结果,选取出权重大于或等于所述第二切分元素集合中其他任意一个元素的权重的元素作为所述页面的主题词。7.如权利要求1至6中任意一项所述的方法,其特征在于,所述方法还包括:获取搜索引擎的搜索日志;根据获取的所述搜索日志获取所述待推荐的搜索短语。8.如权利要求7所述的方法,其特征在于,将获取的所述待推荐的搜索短语显示给所述用户包括:对所述待推荐的搜索短语进行排序;根据所述排序的结果将所述待推荐的搜索短语显示给所述用户。9.如权利要求8所述的方法,其特征在于,对所述待推荐的搜索短语进行排序包括:根据所述用户的自然属性信息计算所述待推荐的搜索短语的初始排序分数;根据用户行为数据以及自然冷却模型调节计算出的所述初始排序分数;根据调节后的排序分数对所述待推荐的搜索短语进行排序。10.如权利要求9所述的方法,其特征在于,对所述待推荐的搜索短语进行排序还包括:在执行根据所述用户的自然属性信息计算所述待推荐的搜索短语的初始排序分数的步骤前,根据所述用户的搜索信息的关键词,通过分类器预测出所述用户的自然属性信息。11.一种推荐搜索短语的系统,其特征在于,所述系统包括:第一获取模块,用于获取用户的搜索信息;提取模块,用于提取所述第一获取模块所获取的搜索信息的关键词;第二获取模块,用于根据所述提取模块所提...

【专利技术属性】
技术研发人员:贾春鑫沈抖曹晓冬陈进生王亮魏春水许健胡晨冯立强卢晶晶王剑
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1