【技术实现步骤摘要】
搜索需求分析方法和装置
本专利技术涉及搜索
,特别涉及一种搜索需求分析方法和装置。
技术介绍
传统的关键词匹配搜索引擎,由于只是对搜索词query进行分词,利用得到的关 键词到索引数据中进行检索,并不真正完全理解用户的检索意图,导致检索出的结果仅是 包含搜索词中的关键词的结果,并不一定能够满足用户的检索需求。例如Query刘德华的 图片,在传统的搜索引擎中将分别用刘德华和图片两个关键词在索引数据中进行检 索,检索结果只是包含关键词刘德华或者包含关键词图片的数据,而非用户真正想获 得的刘德华图片的数据资源。 因此可进行搜索需求分析的搜索引擎,在现代搜索引擎中扮演着越来越重要的作 用。搜索需求分析即分析搜索词的结构与成分,从语义上理解搜索词的检索需求,从而识别 出用户的检索意图,从语义上理解query的检索需求,除了能够提供更精准的检索结果之 夕卜,还能够针对用户的检索需求,提供更灵活的产品形态。例如Query 刘德华的图片进 行需求识别之后,可以直接提供用户需要的刘德华图片资源。 搜索需求分析目前大多采用模板匹配或者利用 ...
【技术保护点】
一种搜索需求分析方法,其特征在于,包括以下步骤:获取搜索词,并获取所述搜索词对应的多个关联词;抽取所述搜索词的特征并作为原始特征,并抽取所述多个关联词的特征并作为关联特征;以及根据所述原始特征和所述关联特征获取搜索需求。
【技术特征摘要】
1. 一种搜索需求分析方法,其特征在于,包括w下步骤: 获取搜索词,并获取所述搜索词对应的多个关联词; 抽取所述搜索词的特征并作为原始特征,并抽取所述多个关联词的特征并作为关联特 征;W及 根据所述原始特征和所述关联特征获取搜索需求。2. 如权利要求1所述的搜索需求分析方法,其特征在于,所述根据所述原始特征和所 述关联特征获取搜索需求具体包括: 根据所述原始特征和所述关联特征查询搜索需求识别模型W获取所述搜索需求。3. 如权利要求1所述的搜索需求分析方法,其特征在于,所述获取所述搜索词对应的 多个关联词具体包括: W所述搜索词为中也将与所述搜索词之间的编辑距离小于预设距离的词作为所述关 联词;和/或 对所述搜索词进行语义分析,并将与所述搜索词语义近似的词作为所述关联词。4. 如权利要求1所述的搜索需求分析方法,其特征在于,所述抽取所述搜索词的特征 并作为原始特征具体包括: 提取所述搜索词中的专名、专名类别W及各个成分的语义TAG标签信息; 提取所述搜索词的组成结构; 根据所述搜索词中的专名、所述专名类别、所述各个成分的语义TAG信息W及所述组 成结构生成所述搜索词的描述模板,并将所述描述模板作为所述原始特征。5. 如权利要求1所述的搜索需求分析方法,其特征在于,所述抽取所述多个关联词的 特征并作为关联特征具体包括: 对所述关联词进行分词W抽取与所述搜索词相关且不包含所述搜索词的多个关键 词; 从所述多个关键词中选择与所述搜索词需求相关的特征词,并将所述特征词作为所述 多个关联词的特征。6. 如权利要求1所述的搜索需求分析方法,其特征在于,所述抽取所述多个关联词的 特征并作为关联特征具体包括: 获取所述多个关联词的多个搜索结果或用户点击日志;W及 从所述多个关联词的多个搜索结果或用户点击日志中抽取所述关联词的Title特征、 搜索特征和点击特征中的一种或多种,并将所述Title特征、搜索特征和点击特征中的一 种或多种作为所述关联特征。7....
【专利技术属性】
技术研发人员:付志宏,周古月,贺旭,何径舟,石磊,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。