搜索优化方法和装置制造方法及图纸

技术编号:13515250 阅读:152 留言:0更新日期:2016-08-12 01:25
本发明专利技术公开了一种搜索优化方法和装置,其中,搜索优化方法包括:获取输入的关键词,并将关键词切分为多个字段;获取每个字段对于关键词的重要度,并根据重要度获取符合预设条件的候选字段;基于倒排库对候选字段进行倒排拉链检索,并获取对应的候选关键词;基于迭代决策树GBDT模型对候选关键词进行排序,并获取排序结果;以及根据排序结果优化关键词,并根据优化后的关键词进行搜索,以获取搜索结果。本发明专利技术实施例通过对输入的关键词进行分析,并基于倒排库获取对应的候选关键词,再对候选关键词进行排序,以及根据排序结果优化关键词,最后根据优化后的关键词进行搜索获取搜索结果,从而获得更加满足用户需求的搜索结果,提升用户搜索体验。

【技术实现步骤摘要】
201610148071

【技术保护点】
一种搜索优化方法,其特征在于,包括以下步骤:获取输入的关键词,并将所述关键词切分为多个字段;获取每个字段对于所述关键词的重要度,并根据所述重要度获取符合预设条件的候选字段;基于倒排库对所述候选字段进行倒排拉链检索,并获取对应的候选关键词;基于迭代决策树GBDT模型对所述候选关键词进行排序,并获取排序结果;以及根据所述排序结果优化所述关键词,并根据优化后的关键词进行搜索,以获取搜索结果。

【技术特征摘要】
1.一种搜索优化方法,其特征在于,包括以下步骤:获取输入的关键词,并将所述关键词切分为多个字段;获取每个字段对于所述关键词的重要度,并根据所述重要度获取符合预设条件的候选字段;基于倒排库对所述候选字段进行倒排拉链检索,并获取对应的候选关键词;基于迭代决策树GBDT模型对所述候选关键词进行排序,并获取排序结果;以及根据所述排序结果优化所述关键词,并根据优化后的关键词进行搜索,以获取搜索结果。2.如权利要求1所述的方法,其特征在于,在基于倒排库对所述候选字段进行倒排拉链检索,并获取对应的候选关键词之前,还包括:建立所述倒排库。3.如权利要求2所述的方法,其特征在于,建立所述倒排库,包括:统计网络中待选关键词样本的检索次数和满意度;根据所述检索次数和所述满意度筛选出满足预设要求的关键词样本;以及根据所述关键词样本建立所述倒排库。4.如权利要求1所述的方法,其特征在于,基于迭代决策树GBDT模型对所述候选关键词进行排序,并获取排序结果,包括:对所述候选关键词进行分析,并获取所述候选关键词对应的特征,所述特征包括字面特征、语义特征、点击特征和结构特征中的一种或多种;根据所述特征获取所述关键词与所述候选关键词的相似度;根据所述相似度对所述候选关键词进行排序,并获取排序结果。5.如权利要求4所述的方法,其特征在于,根据所述特征获取所述关键词与所述候选关键词的相似度,包括:基于所述字面特征获取所述关键词与所述候选关键词的字编辑距离和/或拼音编辑距离;和/或获取相同字段对于包含所述相同字段的候选关键词的重要度。6.如权利要求4所述的方法,其特征在于,根据所述特征获取所述关键词与所述候选关键词的相似度,包括:基于所述语义特征获取所述关键词与所述候选关键词的词向量相似度;和/或基于二元语法BIGRAM模型获取所述关键词与所述候选关键词的深层神经网络DNN
\t相似度。7.如权利要求4所述的方法,其特征在于,根据所述特征获取所述关键词与所述候选关键词的相似度,包括:基于所述点击特征获取所述关键词与所述候选关键词的点击相似度。8.如权利要求4所述的方法,其特征在于,根据所述特征获取所述关键词与所述候选关键词的相似度,包括:基于所述结构特征获取所述关键词与所述候选关键词的结构相似度。9.如权利要求1所述的方法,其特征在于,基于迭代决策树GBDT模型对所述候选关键词进行排序,并获取排序结果,还包括:提取所述关键词的主干信息;获取所述关键词与所述候选关键词的第一GBDT得分;获取所述主干信息与所述候选关键词的第二GBDT得分;获取所述第一GBDT得分和所述第二GBDT得分的平均得分,并...

【专利技术属性】
技术研发人员:王丽杰徐新超刘备刘占一
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1