一种搜索意图的识别方法、意图识别模型训练方法和装置制造方法及图纸

技术编号:24756632 阅读:34 留言:0更新日期:2020-07-04 09:16
本申请实施例公开了一种搜索意图的识别方法,为了确定待识别关键词是否具有官网意图,从待识别关键词所对应搜索结果中筛选出目标百科类条目,根据目标百科类条目与特征词的匹配结果确定待识别关键词的特征向量,由于特征词是根据与官网意图所关联百科类条目确定的,而目标百科类条目是根据待识别关键词搜索得到的,故确定出的特征向量可以体现出待识别关键词的官网意图信息,通过意图识别模型计算该特征向量对应的官网意图评分,官网意图评分能够表示出待识别关键词所对应搜索意图为官网意图的可能性,将官网意图评分作为搜索引擎判断待识别关键词的官网意图强弱的依据,能够提高优先展示待识别关键词对应官网的准确性,增强用户搜索体验。

A search intention recognition method, intention recognition model training method and device

【技术实现步骤摘要】
一种搜索意图的识别方法、意图识别模型训练方法和装置
本申请涉及数据处理领域,特别是涉及搜索意图的识别以及意图识别模型的训练。
技术介绍
用户在接触、了解到一些对象例如产品或者服务后,会有进一步获知该对象相关信息的需求,而该对象的相关信息,一般会较为准确、全面的记载在该对象的官网中,例如产品的官方主页、提供服务的公司网站等。在互联网时代,用户可以通过搜索引擎满足上述需求,例如,用户输入与待了解对象相关的关键词,搜索引擎向用户展示与该关键词关联的搜索结果。在搜索过程中,如果搜索引擎能够识别出用户的搜索意图为查询官网的意图(以下简称官网意图),那么搜索引擎可以在搜索结果中优先展示该对象官网对应的条目,从而提高用户的搜索体验。然而,目前并没有准确的识别方式用于识别搜索意图是否为官网意图。
技术实现思路
为了解决上述技术问题,本申请提供了一种搜索意图的识别以及意图识别模型的训练,将确定出的官网意图评分作为搜索引擎判断待识别关键词的官网意图强弱的依据,从而能够提高优先展示待识别关键词对应官网的准确性,增强用户搜索体验。<本文档来自技高网...

【技术保护点】
1.一种搜索意图的识别方法,其特征在于,所述方法包括:/n获取待识别关键词对应的搜索结果,所述搜索结果中包括目标百科类条目;/n根据所述目标百科类条目的内容与特征词的匹配结果确定所述待识别关键词的特征向量;所述特征词是根据与官网意图所关联百科类条目确定的;/n根据意图识别模型确定所述特征向量对应的官网意图评分,所述官网意图评分用于标识所述待识别关键词所对应搜索意图为官网意图的可能性。/n

【技术特征摘要】
1.一种搜索意图的识别方法,其特征在于,所述方法包括:
获取待识别关键词对应的搜索结果,所述搜索结果中包括目标百科类条目;
根据所述目标百科类条目的内容与特征词的匹配结果确定所述待识别关键词的特征向量;所述特征词是根据与官网意图所关联百科类条目确定的;
根据意图识别模型确定所述特征向量对应的官网意图评分,所述官网意图评分用于标识所述待识别关键词所对应搜索意图为官网意图的可能性。


2.根据权利要求1所述的方法,其特征在于,所述根据所述目标百科类条目的内容与特征词的匹配结果确定所述待识别关键词对应的特征向量,包括:
根据所述目标百科类条目的内容与特征词的匹配结果,以及所述目标百科类条目的类别标签确定所述待识别关键词对应的特征向量。


3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述目标百科类条目与所述待识别关键词间的关联程度;
根据所述关联程度调整所述特征向量,得到调整后的特征向量;
所述根据意图识别模型确定所述特征向量对应的官网意图评分,包括:
根据意图识别模型确定所述调整后的特征向量对应的官网意图评分。


4.根据权利要求1所述的方法,其特征在于,所述目标百科类条目包括多个,所述根据所述目标百科类条目的内容与特征词的匹配结果确定所述待识别关键词的特征向量,包括:
选择任意一个目标百科类条目的内容;
根据所选择的目标百科类条目的内容与所述特征词的匹配结果确定一个子特征向量;
根据多个所述目标百科类条目分别确定出的多个子特征向量计算所述待识别关键词的特征向量。


5.根据权利要求1-4任意一项所述的方法,其特征在于,所述方法还包括:
根据所述官网意图评分调整所述搜索结果中所述待识别关键词对应官网条目的展示位置。


6.一种搜索意图的识别装置,其特征在于,所述装置包括获取单元、第一确定单元和第二确定单元:
所述获取单元,用于获取待识别关键词对应的搜索结果,所述搜索结果中包括目标百科类条目;
所述第一确定单元,用于根据所述目标百科类条目的内容与特征词的匹配结果确定所述待识别关键词的特征向量;所述特征词是根据与官网意图所关联百科类条目确定的;
所述第二确定单元,用于根据意图识别模型确定所述特征向量对应的官网意图评分,所述官网意图评分用于标识所述待识别关键词所对应搜索意图为官网意图的可能性。...

【专利技术属性】
技术研发人员:张羽
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1