一种搜索处理方法、装置、设备和存储介质制造方法及图纸

技术编号:28623212 阅读:33 留言:0更新日期:2021-05-28 16:19
本申请公开了一种搜索处理方法、装置、设备和存储介质,涉及智能搜索技术领域。具体实现方案为:获取用户输入的查询词;基于预先建立的索引关系,确定与查询词匹配的至少一个候选关键词;索引关系是在将各关键词按照语义进行聚类后,针对聚类得到的各分类对应的关键词中的部分关键词,建立的部分关键词的分词与对应关键词之间的索引关系;确定各候选关键词与查询词的相关度,筛选出相关度满足设定条件的候选关键词;基于筛选出的候选关键词,确定与查询词匹配的目标关键词。本申请实施例通过针对聚类后每一类别的部分关键词的分词与对应关键词之间索引关系的引入和使用,减少了搜索时长,提高了搜索效率,并提高了搜索系统的召回能力。

【技术实现步骤摘要】
一种搜索处理方法、装置、设备和存储介质
本申请涉及计算机技术,尤其涉及智能搜索

技术介绍
当搜索引擎接收到用户输入的查询词后,需要根据索引表确定出与查询词相匹配的关键词,并根据匹配结果向用户进行相应信息(比如关键词对应的广告)的展示。现有技术中,在根据索引表确定与查询词相匹配的关键词时,需要通过相关性校验模型分别确定查询词与索引表中各候选关键词的相关度,并根据相关度进行关键词匹配。然而,相关性校验模型耗时较长,每次仅能计算少量候选关键词与查询词之间的相关度,极大的限制了搜索系统的召回能力。
技术实现思路
本申请实施例提供了一种搜索处理方法、装置、设备和存储介质,以减少搜索时长,提高搜索效率,同时提高搜索系统的召回能力。第一方面,本申请实施例提供了一种搜索处理方法,包括:获取用户输入的查询词;基于预先建立的索引关系,确定与所述查询词匹配的至少一个候选关键词;其中,所述索引关系是在将各关键词按照语义进行聚类后,针对聚类得到的各分类所对应的关键词中的部分关键词,建立的部分关键词的分本文档来自技高网...

【技术保护点】
1.一种搜索处理方法,其特征在于,包括:/n获取用户输入的查询词;/n基于预先建立的索引关系,确定与所述查询词匹配的至少一个候选关键词;其中,所述索引关系是在将各关键词按照语义进行聚类后,针对聚类得到的各分类所对应的关键词中的部分关键词,建立的部分关键词的分词与对应关键词之间的索引关系;/n确定各所述候选关键词与所述查询词的相关度,筛选出相关度满足设定条件的所述候选关键词;/n基于筛选出的所述候选关键词,确定与所述查询词匹配的目标关键词。/n

【技术特征摘要】
1.一种搜索处理方法,其特征在于,包括:
获取用户输入的查询词;
基于预先建立的索引关系,确定与所述查询词匹配的至少一个候选关键词;其中,所述索引关系是在将各关键词按照语义进行聚类后,针对聚类得到的各分类所对应的关键词中的部分关键词,建立的部分关键词的分词与对应关键词之间的索引关系;
确定各所述候选关键词与所述查询词的相关度,筛选出相关度满足设定条件的所述候选关键词;
基于筛选出的所述候选关键词,确定与所述查询词匹配的目标关键词。


2.根据权利要求1所述的方法,其特征在于,所述索引关系的建立方法包括:
将各关键词按照语义进行聚类;
对于聚类后得到的各个分类,选取当前分类中的一个关键词作为代表元关键词;
对所述代表元关键词进行切词处理,建立切词处理得到的各个分词与对应的代表元关键词之间的索引关系。


3.根据权利要求2所述的方法,其特征在于,在选取当前分类中的一个关键词作为代表元关键词之后,所述方法还包括:
建立各代表元关键词与对应的分类之间的索引关系;
相应的,基于筛选出的所述候选关键词,确定与所述查询词匹配的目标关键词,包括:
对于筛选出的全部或部分候选关键词,确定当前候选关键词作为代表元关键词所对应的分类;
读取所确定分类中的各关键词,并将读取的各关键词作为与所述查询词匹配的目标关键词。


4.根据权利要求3所述的方法,其特征在于,对于筛选出的部分候选关键词,确定当前候选关键词作为代表元关键词所对应的分类,包括:
确定筛选出的各候选关键词中与所述查询词的相关度最高的预设数目的候选关键词;
对于确定出的各候选关键词,确定当前候选关键词作为代表元关键词所对应的分类。


5.根据权利要求2所述的方法,其特征在于,选取当前分类中的一个关键词作为代表元关键词...

【专利技术属性】
技术研发人员:连义江傅畅
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1