搜索方法和搜索系统技术方案

技术编号:34176822 阅读:44 留言:0更新日期:2022-07-17 12:07
公开了一种搜索方法和搜索系统。所述方法包括:获取用户输入的搜索词和筛选项;基于每个筛选项与所述搜索词的相关性,求取各个筛选项的权重分;对经权重分过滤的筛选项和所述搜索词进行重述,以生成优化的搜索词。本发明专利技术公开了一种初始搜索词与补充的筛选项融合产生优化搜索词的流程化方案。该方案通过基于QPP的词权重计算和搜索词重述,生成优化的搜索词,由此提升针对用户输入内容的召回率和召回准确性,尤其适用于专业性较强的医疗垂直搜索领域。本方案不仅可以应用于交互式搜索场景,还可适用于类似需要对用户输入的初始搜索词进行补充的搜索场景。进行补充的搜索场景。进行补充的搜索场景。

【技术实现步骤摘要】
搜索方法和搜索系统


[0001]本公开涉及搜索领域,尤其涉及一种搜索方法和搜索系统。

技术介绍

[0002]搜索领域一直致力于为用户提供更符合其搜索意图,且更为准确的搜索结果。在诸如医疗的某些垂直搜索领域,由于领域的专业性,单凭用户自身提供的搜索词往往无法召回用户期望的搜索结果。为此,可以通过多轮问答等的方式让用户提供更多的信息描述,以作为初始输入的搜索词的补充或是修正。
[0003]如何利用这些信息描述来为用户提供更为准确的搜索词,成为本领域技术人员需要考虑的问题。

技术实现思路

[0004]本公开要解决的一个技术问题是提供一种初始搜索词与补充的筛选项融合产生优化搜索词的流程化方案。该方案通过基于QPP的词权重计算和搜索词重述,生成优化的搜索词,由此提升针对用户输入内容的召回率和召回准确性,尤其适用于专业性较强的医疗垂直搜索领域。本方案不仅可以应用于交互式搜索场景,还可适用于类似需要对用户输入的初始搜索词进行补充的搜索场景。
[0005]根据本公开的第一个方面,提供了一种搜索方法,包括:获取用户输入的搜索词和筛本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种搜索方法,包括:获取用户输入的搜索词和筛选项;基于每个筛选项与所述搜索词的相关性,求取各个筛选项的权重分;对经权重分过滤的筛选项和所述搜索词进行重述,以生成优化的搜索词。2.如权利要求1所述的搜索方法,其中,获取用户输入信息包括:获取所述用户输入的所述搜索词;基于所述搜索词,显示针对所述搜索词的补充描述选项;以及获取所述用户从所述补充描述选项中确定的筛选项。3.如权利要求1所述的搜索方法,还包括:对所述筛选项进行同义词处理,其中,基于每个筛选项与所述搜索词的相关性,求取各个筛选项的权重分包括:基于每个经同义词处理的筛选项与所述搜索词的相关性,求取各个筛选项的权重分。4.如权利要求1所述的搜索方法,其中,对所述筛选项进行同义词处理包括:给出所述筛选项的筛选项同义词,并且其中:同时使用所述筛选项和筛选项同义词两者来求取所述筛选项的权重分,和/或同时使用所述筛选项和筛选项同义词两者来进行重述,并且从两者中选取被判定为更优的词来生成所述优化的搜索词。5.如权利要求1所述的搜索方法,其中,对所述筛选项进行同义词处理包括:从筛选项同义词库中找出命中的筛选项同义词对,并给出所述筛选项的筛选项同义词,其中,基于在前用户查询和点击历史构建所述筛选项同义词库。6.如权利要求1所述的搜索方法,其中,基于每个筛选项与所述搜索词的相关性,求取各个筛选项的权重分包括:深度学习模型预先从搜索词与筛选项的搜索结果中学习筛选项与搜索词的相关性,并用于求取当前搜索词中各个筛选项的权重分。7.如权利要求6所述的搜索方法,其中,所述深度学习模型是上下文感知动态词权重模型,并且基于每个筛选项与所述搜索词的相关性,求取各个筛选项的权重分包括:将所述搜索词和各个筛选项送入所述上下文感知动态词权重模型;以及基于所述上下文感知动态词权重模型的预测结果求取每个筛选项的权重分,其中,基于搜索词和筛选项在所述搜索结果中的相关性构造用于训练所述上下文感知动态词权重模型的词权重标签。8.如权利要求7所述的搜索方法,其中,基于搜索词和筛选项在所述搜索结...

【专利技术属性】
技术研发人员:李泽诚马镇新
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1