搜索需求分析方法和装置制造方法及图纸

技术编号:11191779 阅读:81 留言:0更新日期:2015-03-25 20:23
本发明专利技术提出一种搜索需求分析方法和装置,其中,该搜索需求分析方法包括以下步骤:获取搜索词,并获取搜索词对应的多个关联词;抽取搜索词的特征并作为原始特征,并抽取多个关联词的特征并作为关联特征;以及根据原始特征和关联特征获取搜索需求。本发明专利技术的搜索需求分析方法,能够准确地获取用户的搜索需求,从而搜索引擎根据用户的搜索需求提供更符合用户需要的搜索结果,进而在提高了搜索的准确率的同时,还提高了搜索的召回率。此外,搜索需求的分析过程与语言无关,因此可方便地在多个不同语种之间进行迁移,更加方便。

【技术实现步骤摘要】
搜索需求分析方法和装置
本专利技术涉及搜索
,特别涉及一种搜索需求分析方法和装置。
技术介绍
传统的关键词匹配搜索引擎,由于只是对搜索词query进行分词,利用得到的关 键词到索引数据中进行检索,并不真正完全理解用户的检索意图,导致检索出的结果仅是 包含搜索词中的关键词的结果,并不一定能够满足用户的检索需求。例如Query刘德华的 图片,在传统的搜索引擎中将分别用刘德华和图片两个关键词在索引数据中进行检 索,检索结果只是包含关键词刘德华或者包含关键词图片的数据,而非用户真正想获 得的刘德华图片的数据资源。 因此可进行搜索需求分析的搜索引擎,在现代搜索引擎中扮演着越来越重要的作 用。搜索需求分析即分析搜索词的结构与成分,从语义上理解搜索词的检索需求,从而识别 出用户的检索意图,从语义上理解query的检索需求,除了能够提供更精准的检索结果之 夕卜,还能够针对用户的检索需求,提供更灵活的产品形态。例如Query 刘德华的图片进 行需求识别之后,可以直接提供用户需要的刘德华图片资源。 搜索需求分析目前大多采用模板匹配或者利用Query的检索结果本文档来自技高网...
搜索需求分析方法和装置

【技术保护点】
一种搜索需求分析方法,其特征在于,包括以下步骤:获取搜索词,并获取所述搜索词对应的多个关联词;抽取所述搜索词的特征并作为原始特征,并抽取所述多个关联词的特征并作为关联特征;以及根据所述原始特征和所述关联特征获取搜索需求。

【技术特征摘要】
1. 一种搜索需求分析方法,其特征在于,包括w下步骤: 获取搜索词,并获取所述搜索词对应的多个关联词; 抽取所述搜索词的特征并作为原始特征,并抽取所述多个关联词的特征并作为关联特 征;W及 根据所述原始特征和所述关联特征获取搜索需求。2. 如权利要求1所述的搜索需求分析方法,其特征在于,所述根据所述原始特征和所 述关联特征获取搜索需求具体包括: 根据所述原始特征和所述关联特征查询搜索需求识别模型W获取所述搜索需求。3. 如权利要求1所述的搜索需求分析方法,其特征在于,所述获取所述搜索词对应的 多个关联词具体包括: W所述搜索词为中也将与所述搜索词之间的编辑距离小于预设距离的词作为所述关 联词;和/或 对所述搜索词进行语义分析,并将与所述搜索词语义近似的词作为所述关联词。4. 如权利要求1所述的搜索需求分析方法,其特征在于,所述抽取所述搜索词的特征 并作为原始特征具体包括: 提取所述搜索词中的专名、专名类别W及各个成分的语义TAG标签信息; 提取所述搜索词的组成结构; 根据所述搜索词中的专名、所述专名类别、所述各个成分的语义TAG信息W及所述组 成结构生成所述搜索词的描述模板,并将所述描述模板作为所述原始特征。5. 如权利要求1所述的搜索需求分析方法,其特征在于,所述抽取所述多个关联词的 特征并作为关联特征具体包括: 对所述关联词进行分词W抽取与所述搜索词相关且不包含所述搜索词的多个关键 词; 从所述多个关键词中选择与所述搜索词需求相关的特征词,并将所述特征词作为所述 多个关联词的特征。6. 如权利要求1所述的搜索需求分析方法,其特征在于,所述抽取所述多个关联词的 特征并作为关联特征具体包括: 获取所述多个关联词的多个搜索结果或用户点击日志;W及 从所述多个关联词的多个搜索结果或用户点击日志中抽取所述关联词的Title特征、 搜索特征和点击特征中的一种或多种,并将所述Title特征、搜索特征和点击特征中的一 种或多种作为所述关联特征。7....

【专利技术属性】
技术研发人员:付志宏周古月贺旭何径舟石磊
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1