【技术实现步骤摘要】
搜索召回方法、装置、设备及其存储介质
本申请涉及互联网
,尤其涉及搜索召回方法、装置、设备及其存储介质。
技术介绍
新闻资讯搜索功能为用户提供获取资讯结果的快捷渠道。搜索引擎根据用户输入的查询词语,在网络中召回与查询词语相关的查询结果,然后对查询结果进行排序,将排序靠前的查询结果展示给用户。在搜索过程中,用户获得的结果虽然形式上是与查询词语相关联的,但是其实质内容确与用户查询目的不匹配。特别是,期望搜索与专业领域相关的查询结果时,基于查询词语获取的查询结果精准度不高。
技术实现思路
鉴于现有技术中的上述缺陷或不足,期望提供一种搜索召回方法、装置、设备及其存储介质,在资讯搜索过程中通过唯一标识资讯目标的方式,提高召回结果的准确性。一方面,本申请实施例提供了一种搜索召回方法,其包括以下步骤:接收输入的查询词;对查询词进行查询意图识别得到召回特征向量,该召回特征向量包括第一特征,该第一特征是用于唯一标识查询词中的实体名的信息表示的;根据预先建立的倒排索引列表,从候选文档中召回与第一 ...
【技术保护点】
1.一种搜索召回方法,其特征在于,其包括以下步骤:/n接收输入的查询词;/n对所述查询词进行查询意图识别得到召回特征向量,所述召回特征向量包括第一特征,所述第一特征是用于唯一标识所述查询词中的实体名的信息表示的;/n根据预先建立的倒排索引列表,从候选文档中召回与所述第一特征相关的目标文档,所述倒排索引列表是预先对所述候选文档进行命名实体识别处理后建立的,所述倒排索引列表包括第一特征和至少一个文档标识之间的对应关系。/n
【技术特征摘要】
1.一种搜索召回方法,其特征在于,其包括以下步骤:
接收输入的查询词;
对所述查询词进行查询意图识别得到召回特征向量,所述召回特征向量包括第一特征,所述第一特征是用于唯一标识所述查询词中的实体名的信息表示的;
根据预先建立的倒排索引列表,从候选文档中召回与所述第一特征相关的目标文档,所述倒排索引列表是预先对所述候选文档进行命名实体识别处理后建立的,所述倒排索引列表包括第一特征和至少一个文档标识之间的对应关系。
2.根据权利要求1所述的搜索召回方法,其特征在于,所述倒排索引列表还包括第二特征和至少一个文档标识之间的对应关系,所述第二特征是用于唯一标识所述查询词中的实体名的信息和否定成分表示的,所述否定成分表示用于唯一标识所述查询词中的实体名的信息为假,则所述方法还包括:
对所述查询词进行查询意图识别得到召回特征向量,所述召回特征向量包括所述第二特征;
根据预先建立的倒排索引列表,从候选文档中召回与所述第二特征相关的目标文档。
3.根据权利要求1所述的搜索召回方法,其特征在于,在对所述查询词进行查询意图识别得到召回特征向量之后,所述方法还包括:
获取所述召回特征向量包含所述第一特征的第一数值;
获取每篇文档包含所述第一特征的第二数值,所述每篇文档是从所述候选文档中查找到的与所述第一特征相关的文档;
则所述根据预先建立的倒排索引列表,从候选文档中召回与所述第一特征相关的目标文档,还包括以下步骤:
在所述第一数值小于等于所述第二数值时,召回与所述第一特征相关的文档作为所述目标文档。
4.根据权利要求1或3所述的搜索召回方法,其特征在于,所述用于唯一标识所述查询词中的实体名的信息为股票代码,则在从候选文档中召回与所述第一特征相关的目标文档之后,所述方法还包括:
将所述目标文档构成召回文档列表;
基于所述召回特征向量抽取用户查询特征向量;
从所述召回文档列表中抽取文档特征向量;
将所述用户查询特征向量、所述文档特征向量、排序特征输入到预先训练建立的重排模型,输出重排序后的目标文档,其中,排序特征是根据所述查询词中包含股票代码的个数与待选文档中包含股票代码的个数计算得到的。
5.根据权利要求1-3任一项所述的搜索召回方法,其特征在于,所述对所述查询词进行查询意图识别得到召回特征向量包...
【专利技术属性】
技术研发人员:陈诚,冯帅,邓威,王军伟,方高林,郑楚涛,郑黄晓为,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。