生成关联关键词、提供关联关键词的方法及系统技术方案

技术编号:10828609 阅读:119 留言:0更新日期:2014-12-26 17:59
本发明专利技术提供一种生成关联关键词、提供关联关键词的方法及系统。所述生成关联关键词的方法包括:基于搜索日志选取具备预定的搜索行为特征的至少一个初选搜索词;根据所述初选搜索词,从包括多个关键词的关键词匹配信息选取至少一个与所述初选搜索词在类别上相关的关联关键词;将所述初选搜索词以及所述关联关键词存储在关联关键词词典中。所述生成关联关键词、提供关联关键词的方法及系统为指定类目下的搜索词选取在类别上相关的关联关键词,从而当接收到包括所述搜索词的搜索请求时,可将所述关联关键词提供给用户,为用户提供上下级类别的推荐条目。

【技术实现步骤摘要】
生成关联关键词、提供关联关键词的方法及系统
本专利技术涉及数据处理技术,尤其涉及一种生成关联关键词、提供关联关键词的技术。
技术介绍
在搜索引擎技术中,除了提供搜索结果以外,通常搜索服务商还会在搜索结果网页的指定位置(如页面右侧)还提供一些与用户输入的搜索词相关的其他推荐信息。目前搜索服务商的推荐策略倾向于推荐同位的概念,对相关的泛需求推荐较少,并且推荐缺乏层次。 图1示出在现有技术中搜索结果网页的示例。参照图1,用户输入“迅雷游戏”进行搜索后,在搜索结果网页的左侧显示如“迅雷游戏官网首页”、“迅雷游戏盒子”等结果条目。此外,在所述搜索结果网页的右侧还提供了如“相关游戏”类和“相关软件”类的同位概念条目。 此外,搜索例如“封神无双”游戏的用户的主需求是该网页游戏,目前在搜索结果页面右侧推荐的策略是推荐同位的概念(如其他网页游戏),缺乏对其相关的上位概念(如网页游戏)的推荐,推荐维度不够丰富。
技术实现思路
本专利技术的目的在于提供一种生成关联关键词的方法、提供关联关键词的方法和使用所述方法的系统,通过对搜索日志进行挖掘,提取与指定类目下的搜索词在类别上相关的更多关键词,以将这些关键词推荐给用户,增强用户体验。 根据本专利技术的一方面,提供一种生成关联关键词的方法,所述方法包括:基于搜索日志选取具备预定的搜索行为特征的至少一个初选搜索词;根据所述初选搜索词,从包括多个关键词的关键词匹配信息选取至少一个与所述初选搜索词在类别上相关的关联关键词;将所述初选搜索词以及所述关联关键词存储在关联关键词词典中。 根据本专利技术的另一方面,提供一种生成关联关键词的系统,所述系统包括:搜索词初选模块,用于基于搜索日志选取具备预定的搜索行为特征的至少一个初选搜索词;关联关键词选取模块,用于根据搜索词初选模块选取的初选搜索词,从包括多个关键词的关键词匹配信息选取至少一个与所述初选搜索词在类别上相关的关联关键词;词典管理装置,用于将搜索词初选模块选取的初选搜索词以及关联关键词选取模块选取的关联关键词存储在关联关键词词典中。 根据本专利技术的另一方面,提供一种提供关联关键词的方法,所述方法包括:接收第一搜索词;根据所述第一搜索词从关联关键词词典提取至少一个关联关键词,所述关联关键词词典包括第二搜索词及至少一个关联关键词;发送提取的关联关键词。 根据本专利技术的另一方面,提供一种提供关联关键词的系统,所述系统包括:搜索请求接收装置,用于接收第一搜索词;搜索请求处理装置,用于根据搜索请求接收装置接收的第一搜索词从关联关键词词典提取至少一个关联关键词,所述关联关键词词典包括第二搜索词及至少一个关联关键词;推荐关键词发送装置,用于发送搜索请求处理装置提取的关联关键词。 根据本专利技术的示例性实施例的生成关联关键词的方法、提供关联关键词的方法和使用所述方法的系统可以为指定类目下的搜索词选取在类别上相关的关联关键词,从而当接收到包括所述搜索词的搜索请求时,可将所述关联关键词提供给用户,为用户提供上下级类别的推荐条目。 在此基础上,还可以为指定类目下的搜索词选取在类别上相关并且商业价值高的关联关键词,并且通过综合评估关联关键词的第二需求强度值和价目指标将综合评估值高的关联关键词排在前面,将综合价值高的关键词优先推荐给用户。 【附图说明】 图1示出在现有技术中搜索结果网页的示例; 图2是示出根据本专利技术的示例性实施例的生成关联关键词的方法的流程图; 图3是示出根据本专利技术的另一示例性实施例的生成关联关键词的方法的流程图; 图4是示出根据本专利技术的示例性实施例的提供关联关键词的方法的流程图; 图5不出本专利技术实施例的生成关联关键词的方法和提供关联关键词的方法提供的搜索结果网页的示例; 图6是示出根据本专利技术的示例性实施例的生成关联关键词的系统的逻辑框图; 图7是示出根据本专利技术的示例性实施例的提供关联关键词的系统的逻辑框图。 【具体实施方式】 本专利技术的总体构思是,通过对搜索日志进行分析,提取与指定类目相关的至少一个初选搜索词,并且通过与关键词匹配信息匹配选取从类别上与所述初选搜索词相关的关联关键词,从而将所述初选搜索词与所述关联关键词关联起来;在接收到初选搜索词的搜索请求时,提供所述关联关键词。 通过为指定类目的搜索词提供关联关键词,能够为搜索用户提供更多上位的推荐/[目息,提闻用户体验。 下面结合附图对根据本专利技术的示例性实施例的生成关联关键词的方法、提供关联关键词的方法以及实现所述方法的系统进行详细描述。 图2是示出根据本专利技术的示例性实施例的生成关联关键词的方法的流程图。 参照图2,在步骤S210,基于搜索日志选取具备预定的搜索行为特征的至少一个初选搜索词。 根据本专利技术的示例性实施例,步骤S210可包括:对搜索日志中的任一搜索词,计算其多个第一搜索行为参数;对所述任一搜索词的所述第一搜索行为参数进行加权求和,计算所述搜索词的第一需求强度值;如果所述搜索词的第一需求强度值超过第一预定需求强度阈值,则将所述搜索词选取为初选搜索词。 具体地,搜索词的所述第一搜索行为参数包括:所述搜索词是否包含预定的主类目关键词(参数I)、所述搜索词是否包含预定的子类目关键词(参数2)、所述搜索词的搜索结果中包含所述主类目关键词的搜索结果被查看的第一频率(参数3)、所述搜索词的搜索结果中包含所述子类目关键词的搜索结果被查看的第二频率(参数4)。可选地,搜索词的所述第一搜索行为参数可还包括:在使用所述搜索词搜索后使用包含所述主类目关键词的其他搜索词进行搜索的第三频率(参数5),和在使用所述搜索词搜索后使用包含所述子类目关键词的其他搜索词进行搜索的第四频率(参数6)。 这里,所述第一频率可以是,但不限于,例如,查看使用所述搜索词得到的搜索结果中标题包含所述主类目关键词的用户数量在使用所述搜索词进行搜索的全部用户数量中所占的百分比;所述第二频率可以是,但不限于,例如,查看使用所述搜索词得到的搜索结果中标题包含所述子类目关键词的用户数量在使用所述搜索词进行搜索的全部用户数量中所占的百分比;所述第三频率可以是,但不限于,例如,在使用所述搜索词搜索后使用包含所述主类目关键词的其他搜索词进行搜索的用户数量在使用所述搜索词进行搜索的全部用户数量中所占的百分比;所述第四频率可以是,但不限于,例如,在使用所述搜索词搜索后使用包含所述子类目关键词的其他搜索词进行搜索的用户数量在使用所述搜索词进行搜索的全部用户数量中所占的百分比。 此外,对于所述搜索词是否包含预定的主类目关键词的第一搜索行为参数,可使用I或O来进行赋值;对于所述搜索词是否包含预定的子类目关键词的第一搜索行为参数,也使用I或O来进行赋值。 以游戏类目为例,可预先设定主类目关键词为“游戏”,并且设定搜索频率高的“网页游戏”为子类目关键词。假设有100个用户使用搜索词“迅雷游戏”进行搜索,点击搜索结果中包含“游戏”的有30个用户,点击搜索结果中包含“网页游戏”的有20个用户,此后,又使用搜索词“网页游戏”进行搜索的有5个用户,则参数I的值为1,参数2的值为0,参数3的值为0.3,参数4的值为0.2,参数6的值为0.05。 在所述加权求和的处理中,各第一搜索行为参数的权本文档来自技高网...
生成关联关键词、提供关联关键词的方法及系统

【技术保护点】
一种生成关联关键词的方法,所述方法包括:基于搜索日志选取具备预定的搜索行为特征的至少一个初选搜索词;根据所述初选搜索词,从包括多个关键词的关键词匹配信息选取至少一个与所述初选搜索词在类别上相关的关联关键词;将所述初选搜索词以及所述关联关键词存储在关联关键词词典中。

【技术特征摘要】
1.一种生成关联关键词的方法,所述方法包括: 基于搜索日志选取具备预定的搜索行为特征的至少一个初选搜索词; 根据所述初选搜索词,从包括多个关键词的关键词匹配信息选取至少一个与所述初选搜索词在类别上相关的关联关键词; 将所述初选搜索词以及所述关联关键词存储在关联关键词词典中。2.根据权利要求1所述的方法,其特征在于,所述基于搜索日志选取具备预定的搜索行为特征的至少一个初选搜索词的处理包括: 对搜索日志中的任一搜索词,计算其以下第一搜索行为参数: 所述搜索词是否包含预定的主类目关键词, 所述搜索词是否包含预定的子类目关键词, 所述搜索词的搜索结果中包含所述主类目关键词的搜索结果被查看的第一频率,和 所述搜索词的搜索结果中包含所述子类目关键词的搜索结果被查看的第二频率。3.根据权利要求2所述的方法,其特征在于,所述第一搜索行为参数还包括: 在使用所述搜索词搜索后使用包含所述主类目关键词的其他搜索词进行搜索的第三频率,和 在使用所述搜索词搜索后使用包含所述子类目关键词的其他搜索词进行搜索的第四频率。4.根据权利要求2?3中任一项所述的方法,其特征在于,所述基于搜索日志选取具备预定的搜索行为特征的至少一个初选搜索词的处理还包括: 对所述任一搜索词的所述第一搜索行为参数进行加权求和,计算所述搜索词的第一需求强度值, 如果所述搜索词的第一需求强度值超过第一预定需求强度阈值,则将所述搜索词选取为初选搜索词。5.根据权利要求4所述的方法,其特征在于,所述关键词匹配信息还包括所述多个关键词的价目。6.根据权利要求5所述的方法,其特征在于,所述根据所述初选搜索词,从所述关键词匹配信息选取至少一个与所述初选搜索词在类别上相关的关联关键词的处理包括: 对任一初选搜索词,在关键词匹配信息中查找与所述初选搜索词匹配的关键词及其价目,如果查找到的价目超过预定的价目阈值,则将匹配到的关键词匹配信息中的关键词选取为关联关键词。7.根据权利要求6所述的方法,其特征在于,所述方法还包括: 根据所述搜索日志和所述关联关键词,为所述初选搜索词生成包括所述关联关键词及其第二需求强度值的关键词需求列表; 根据所述关键词匹配信息以及第二需求强度值,对为所述初选搜索词生成的关键词需求列表中的关联关键词排序,并且 所述将所述初选搜索词以及所述关联关键词存储在关联关键词词典中的处理包括:将所述初选搜索词及其关键词需求列表存储在关联关键词词典中。8.根据权利要求7所述的方法,其特征在于,所述根据所述搜索日志和所述关联关键词,为所述初选搜索词生成包括所述关联关键词及其第二需求强度值的关键词需求列表的处理包括: 为任一所述初选搜索词,基于每个关联关键词的以下第二搜索行为参数计算所述关联关键词的第二需求强度值: 所述初选搜索词是否包含所述关联关键词, 所述初选搜索词的搜索结果中包含所述关联关键词的搜索结果被查看的第五频率,和在使用所述初选搜索词搜索后使用包含所述关联关键词的其他搜索词进行搜索的第六频率, 将所述关联关键词及其第二需求强度值插入所述初始搜索词的关键词需求列表。9.根据权利要求8所述的方法,其特征在于,所述为任一所述初选搜索词,基于每个关联关键词的以下第二搜索行为参数计算所述关联关键词的第二需求强度值包括: 对计算的第二搜索行为参数进行加权求和,为所述初选搜索词求得所述关联关键词的第二需求强度值。10.根据权利要求8所述的方法,其特征在于,所述根据所述关键词匹配信息以及第二需求强度值,对为所述初选搜索词生成的关键词需求列表中的关联关键词排序的处理包括: 对为所述初选搜索词生成的关键词需求列表中的关联关键词,分别从所述关键词匹配信息提取其价目,对所述关联关键词的价目以及第二需求强度值进行加权求和,求得所述关联关键词的综合评估值, 根据所述综合评估值,对为所述初选搜索词生成的关键词需求列表中的关联关键词进行排序。11.根据权利要求10所述的方法,其特征在于,所述第一搜索行为参数还包括: 搜索词排除参数:所述任一搜索词是否包含预定的排除关键词,并且 在所述对所述任一搜索词的所述第一搜索行为参数进行加权求和的处理中,为所述搜索词排除参数赋予负的权值。12.—种生成关联关键词的系统,所述系统包括: 搜索词初选模块,用于基于搜索日志选取具备预定的搜索行为特征的至少一个初选搜索词; 关联关键词选取模块,用于根据搜索词初选模块选取的初选搜索词,从包括多个关键词的关键词匹配信息选取至少一个与所述初选搜索...

【专利技术属性】
技术研发人员:门聪
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1