搜索意图识别方法、装置、电子设备和存储介质制造方法及图纸

技术编号:25835676 阅读:21 留言:0更新日期:2020-10-02 14:16
本申请公开了搜索意图识别方法、装置、电子设备和存储介质。所述方法包括:基于二分类模型识别出搜索请求的第一搜索意图集合;基于多分类模型识别出搜索请求的第二搜索意图集合,第二搜索意图集合中的搜索意图具有意图强弱值;将第一搜索意图集合与第二搜索意图集合求交集,将交集中的搜索意图作为搜索请求对应的搜索意图,并根据交集中搜索意图的意图强弱值确定搜索意图展示方式。该技术方案融合了单独二分类和统一多分类的优点,保证了意图强弱的可比较性,并将搜索意图识别和搜索意图强弱排序解耦,有利于各个搜索意图对应的业务进行各自的搜索意图识别的迭代优化。

【技术实现步骤摘要】
搜索意图识别方法、装置、电子设备和存储介质
本申请涉及搜索引擎领域,具体涉及搜索意图识别方法、装置、电子设备和存储介质。
技术介绍
搜索意图识别在搜索场景中至关重要,只有准确识别出用户的搜索意图,才能召回更好的搜索结果来满足用户。其中,搜索意图通常指搜索行为背后体现的用户真实需求,例如,搜索“羽毛球”,可能是因为用户想购买羽毛球器械,也可能是寻找羽毛球场馆,亦可能是学习羽毛球规则,等等。在这个例子中,“购买器械”、“寻找场馆”以及“学习规则”就是与“羽毛球”这个搜索关键词相关的三类不同搜索意图。用户在某一时刻、某一地点和某一场景下的搜索意图可能是唯一的,也可能是多个,目前通常将搜索意图的识别作为一个分类问题来解决,也就是预设多类搜索意图,来判断搜索请求对应于哪些类搜索意图。常用的一种方法就是进行多个单独的二分类,即分别判断搜索请求是否对应于每一类搜索意图。这样的缺点在于,各个单独二分类的结果之间没有可比性,即不可做强弱比较,但是对于某一个用户来说,在特定的时间、地点、场景上应该是有搜索意图的主次的,主要搜索意图应当强于次要搜索意图,因此现有技术无法满足用户需求。
技术实现思路
鉴于上述问题,提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的搜索意图识别方法、装置、电子设备和存储介质。依据本申请的第一方面,提供了一种搜索意图识别方法,包括:基于二分类模型识别出搜索请求的第一搜索意图集合;基于多分类模型识别出所述搜索请求的第二搜索意图集合,所述第二搜索意图集合中的搜索意图具有意图强弱值;将所述第一搜索意图集合与所述第二搜索意图集合求交集,将交集中的搜索意图作为所述搜索请求对应的搜索意图,并根据交集中搜索意图的意图强弱值确定搜索意图展示方式。可选地,上述方法中,所述基于二分类模型识别出搜索请求的第一搜索意图集合包括:基于多个二分类模型,分别对归一化处理后的所述搜索请求进行识别,其中,每个二分类模型分别对应一个预设搜索意图;获取各二分类模型的识别结果;根据各二分类模型的识别结果确定所述第一搜索意图集合。可选地,上述方法中,所述对归一化处理后的所述搜索请求进行识别包括:将归一化处理后的所述搜索请求与第一词表进行匹配;在第一词表中存在完全匹配项的情况下,将该二分类模型对应的预设搜索意图作为识别出的搜索意图。可选地,上述方法中,所述对归一化处理后的所述搜索请求进行识别包括:将归一化处理后的所述搜索请求与第二词表进行匹配;在第二词表中存在部分匹配项的情况下,将该二分类模型对应的预设搜索意图作为识别出的搜索意图。可选地,上述方法中,所述对归一化处理后的所述搜索请求进行识别包括:识别出归一化处理后的所述搜索请求的预测得分;在所述预测得分大于正负阈值的情况下,将该二分类模型对应的预设搜索意图作为识别出的搜索意图。可选地,上述方法中,所述基于多分类模型识别出搜索请求的第二搜索意图集合包括:生成所述搜索请求的搜索意图特征;利用所述多分类模型对所述搜索意图特征进行识别,得到所述第二搜索意图集合。可选地,所述根据交集中搜索意图的意图强弱值确定搜索意图展示方式包括:根据交集中的搜索意图生成搜索结果聚块,根据搜索聚块中各搜索意图的意图强弱值确定搜索聚块的展示优先级。可选地,所述根据交集中搜索意图的意图强弱值确定搜索意图展示方式包括:根据交集中搜索意图的意图强弱值确定搜索意图的展示顺序。可选地,所述第一搜索意图集合中的搜索意图具有意图强弱调整参数;所述根据交集中搜索意图的意图强弱值确定搜索意图展示方式包括:根据交集中搜索意图的意图强弱调整参数和意图强弱值确定意图调整值,根据交集中搜索意图的意图强弱调整值确定搜索意图展示方式。可选地,所述方法还包括:在所述第一搜索意图集合中的搜索意图命中冷启动规则的情况下,根据命中的冷启动规则对相应搜索意图的意图强弱调整参数进行更新。依据本申请的第二方面,提供了一种搜索意图识别装置,包括:第一识别单元,用于基于二分类模型识别出搜索请求的第一搜索意图集合;第二识别单元,用于基于多分类模型识别出所述搜索请求的第二搜索意图集合,所述第二搜索意图集合中的搜索意图具有意图强弱值;融合单元,用于将所述第一搜索意图集合与所述第二搜索意图集合求交集,将交集中的搜索意图作为所述搜索请求对应的搜索意图,并根据交集中搜索意图的意图强弱值确定搜索意图展示方式。可选地,上述装置中,所述第一识别单元,用于基于多个二分类模型,分别对归一化处理后的所述搜索请求进行识别,其中,每个二分类模型分别对应一个预设搜索意图;获取各二分类模型的识别结果;根据各二分类模型的识别结果确定所述第一搜索意图集合。可选地,上述装置中,所述第一识别单元,用于将归一化处理后的所述搜索请求与第一词表进行匹配;在第一词表中存在完全匹配项的情况下,将该二分类模型对应的预设搜索意图作为识别出的搜索意图。可选地,上述装置中,所述第一识别单元,用于将归一化处理后的所述搜索请求与第二词表进行匹配;在第二词表中存在部分匹配项的情况下,将该二分类模型对应的预设搜索意图作为识别出的搜索意图。可选地,上述装置中,所述第一识别单元,用于识别出归一化处理后的所述搜索请求的预测得分;在所述预测得分大于正负阈值的情况下,将该二分类模型对应的预设搜索意图作为识别出的搜索意图。可选地,上述装置中,所述第二识别单元,用于生成所述搜索请求的搜索意图特征;利用所述多分类模型对所述搜索意图特征进行识别,得到所述第二搜索意图集合。可选地,所述融合单元,用于根据交集中的搜索意图生成搜索结果聚块,根据搜索聚块中各搜索意图的意图强弱值确定搜索聚块的展示优先级。可选地,所述融合单元,用于根据交集中搜索意图的意图强弱值确定搜索意图的展示顺序。可选地,所述第一搜索意图集合中的搜索意图具有意图强弱调整参数;所述融合单元,用于根据交集中搜索意图的意图强弱调整参数和意图强弱值确定意图调整值,根据交集中搜索意图的意图强弱调整值确定搜索意图展示方式。可选地,所述装置还包括:冷启动调整单元,用于在所述第一搜索意图集合中的搜索意图命中冷启动规则的情况下,根据命中的冷启动规则对相应搜索意图的意图强弱调整参数进行更新。依据本申请的又一方面,提供了一种电子设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行如上述任一所述的方法。依据本申请的再一方面,提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现如上述任一所述的方法。由上述可知,本申请的技术方案,基于二分类模型识别出搜索请求的第一搜索意图集合,第一搜索意图集合中的搜索意图具有意图强弱粗属性;基于多分类模型识别出搜索请求的第二搜索意图集合,第二搜索意图集合中的搜索意图具有意图强弱值;将第一搜索意图集合与第二搜索意图集合求交集,将交集中的搜索意图作为搜索请求对应的搜索意图,并根据交集中搜索本文档来自技高网...

【技术保护点】
1.一种搜索意图识别方法,其特征在于,包括:/n基于二分类模型识别出搜索请求的第一搜索意图集合;/n基于多分类模型识别出所述搜索请求的第二搜索意图集合,所述第二搜索意图集合中的搜索意图具有意图强弱值;/n将所述第一搜索意图集合与所述第二搜索意图集合求交集,将交集中的搜索意图作为所述搜索请求对应的搜索意图,并根据交集中搜索意图的意图强弱值确定搜索意图展示方式。/n

【技术特征摘要】
1.一种搜索意图识别方法,其特征在于,包括:
基于二分类模型识别出搜索请求的第一搜索意图集合;
基于多分类模型识别出所述搜索请求的第二搜索意图集合,所述第二搜索意图集合中的搜索意图具有意图强弱值;
将所述第一搜索意图集合与所述第二搜索意图集合求交集,将交集中的搜索意图作为所述搜索请求对应的搜索意图,并根据交集中搜索意图的意图强弱值确定搜索意图展示方式。


2.如权利要求1所述的方法,其特征在于,所述基于二分类模型识别出搜索请求的第一搜索意图集合包括:
基于多个二分类模型,分别对归一化处理后的所述搜索请求进行识别,其中,每个二分类模型分别对应一个预设搜索意图;
获取各二分类模型的识别结果;
根据各二分类模型的识别结果确定所述第一搜索意图集合。


3.如权利要求2所述的方法,其特征在于,所述对归一化处理后的所述搜索请求进行识别包括:
将归一化处理后的所述搜索请求与第一词表进行匹配;
在第一词表中存在完全匹配项的情况下,将该二分类模型对应的预设搜索意图作为识别出的搜索意图。


4.如权利要求2所述的方法,其特征在于,所述对归一化处理后的所述搜索请求进行识别包括:
将归一化处理后的所述搜索请求与第二词表进行匹配;
在第二词表中存在部分匹配项的情况下,将该二分类模型对应的预设搜索意图作为识别出的搜索意图。


5.如权利要求2所述的方法,其特征在于,所述对归一化处理后的所述搜索请求进行识别包括:
识别出归一化处理后的所述搜索请求的预测得分;
在所述预测得分大于正负阈值的情况下,将该二分类模型对应的预设搜索意图作为识别出的搜索意图。


6.如权利要求1所述的方法,其特征在于,所述基于多分类模型识别出搜索请求的第二搜索意图集合包括:
生成所述搜索请求的搜索意图特征;
利用所述多分类模型对所述搜索意图特征进行识别,得到所述第二搜索意图集合。


...

【专利技术属性】
技术研发人员:汪祖海刘铭许鑫吕梅李超仙云森
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1