【技术实现步骤摘要】
建立排序模型的方法、查询自动补全的方法及对应装置
本申请涉及计算机应用
,特别涉及智能搜索
的一种建立排序模型的方法、查询自动补全的方法及对应装置。
技术介绍
QAC(QueryAuto-Completion,查询自动补全)目前已被主流的通用搜索引擎和垂直搜索引擎广泛采用。例如,在地图类应用中,当用户输入query(查询)以搜索某个POI(PointofInterest,兴趣点)时,从用户输入不完整query开始(在本申请中将用户输入的不完整query称为查询前缀),搜索引擎可以在候选列表中实时向用户推荐一系列候选的POI以供用户选择作为query的补全结果(在本申请中将候选列表中推荐的query称为查询补全建议)。一旦用户在候选列表中发现其意向的POI,则通过从候选列表中选择该POI即可补全query,从而发起该POI的检索。举个例子,如图1中所示,当用户在地图类应用的检索框中输入查询前缀“百度”时,能够以候选列表的形式向用户推荐诸如“百度大厦”、“百度大厦-C座”、“百度科技园”等等候选POI以供用户选择,一旦用户从中选择了“百度大厦”,则完成query的补全,发起针对“百度大厦”的检索。然而,现有的查询自动补全方案中,针对相同的查询前缀提供的建议均是相同的,例如均是在候选列表中基于各POI的检索热度进行排序,并没有考虑到用户对查询前缀的输入习惯。例如,用户习惯性地在输入查询前缀“ba”时,从查询补全建议中点击“百度大厦A座”进行检索。但由于查询补全建议中各POI是按照检索热度排序的, ...
【技术保护点】
1.一种建立用于查询自动补全的排序模型的方法,其特征在于,该方法包括:/n从POI查询日志中获取用户从查询补全建议中选择POI时已输入的查询前缀、该查询前缀对应的查询补全建议中的各POI以及查询补全建议中被用户选择的POI;/n利用同一查询前缀对应的查询补全建议中被用户选择的POI以及未被用户选择的POI构成正例负例对;/n利用查询前缀以及查询前缀对应的正例负例对训练得到排序模型;/n所述排序模型的训练目标为:最大化查询前缀的向量表示与对应的正例POI的向量表示的相似度以及查询前缀的向量表示与对应负例POI的向量表示的相似度之间的差值。/n
【技术特征摘要】
1.一种建立用于查询自动补全的排序模型的方法,其特征在于,该方法包括:
从POI查询日志中获取用户从查询补全建议中选择POI时已输入的查询前缀、该查询前缀对应的查询补全建议中的各POI以及查询补全建议中被用户选择的POI;
利用同一查询前缀对应的查询补全建议中被用户选择的POI以及未被用户选择的POI构成正例负例对;
利用查询前缀以及查询前缀对应的正例负例对训练得到排序模型;
所述排序模型的训练目标为:最大化查询前缀的向量表示与对应的正例POI的向量表示的相似度以及查询前缀的向量表示与对应负例POI的向量表示的相似度之间的差值。
2.根据权利要求1所述的方法,其特征在于,所述排序模型包括前缀嵌入网络、POI嵌入网络以及排序网络;
所述前缀嵌入网络用于获得查询前缀的向量表示,所述POI嵌入网络用于获得各POI的向量表示,所述排序网络用于确定查询前缀的向量表示与对应POI的向量表示之间的相似度。
3.根据权利要求2所述的方法,其特征在于,所述前缀嵌入网络包括循环神经网络;
所述获得查询前缀的向量表示包括:
将所述查询前缀中各字符对应的字符向量依次输入循环神经网络,利用所述循环神经网络输出的针对最后一个字符的特征向量得到所述查询前缀的向量表示;或者,
将所述用户的属性特征向量与所述查询前缀中各字符对应的字符向量分别进行拼接后依次输入循环神经网络,利用所述循环神经网络输出的最后一个字符对应的特征向量得到所述查询前缀的向量表示。
4.根据权利要求2所述的方法,其特征在于,所述获得各POI的向量表示包括:
对POI的属性信息进行编码,得到POI的向量表示。
5.根据权利要求4所述的方法,其特征在于,所述POI嵌入网络包括:卷积神经网络、前馈神经网络和全连接层;
所述对POI的属性信息进行编码包括:
将POI的名称和地址信息采用卷积神经网络进行编码;
将POI的其他属性信息采用前馈神经网络进行编码;
将同一POI的编码结果进行拼接后,经过全连接层的映射,得到该POI的向量表示。
6.根据权利要求2所述的方法,其特征在于,在训练所述排序模型的过程中,利用所述排序网络的输出确定三元组损失函数,利用三元组损失函数进行前向反馈以更新所述前缀嵌入网络、POI嵌入网络以及排序网络的模型参数,直至所述三元组损失函数满足预设要求,或者达到预设的模型参数更新次数。
7.一种查询自动补全的方法,其特征在于,该方法包括:
获取用户当前输入的查询前缀,以及确定与所述查询前缀对应的候选兴趣点POI;
将所述查询前缀与所述候选POI输入排序模型,得到所述排序模型对各候选POI的评分,所述候选POI的评分依据所述查询前缀的向量表示与候选POI的向量表示之间的相似度得到的;
依据各候选POI的评分确定向所述用户推荐的查询补全建议;
其中,所述排序模型采用如权利要求1至6中任一项所述的方法预先训练得到。
8.根据权利要求7所述的方法,其特征在于,所述查询前缀的向量表示采用如下方式得到:
在所述排序模型中,将所述查询前缀中各字符对应的字符向量依次输入循环神经网络,利用所述循环神经网络输出的针对最后一个字符的特征向量得到所述查询前缀的向量表示;或者,
在所述排序模型中,将所述用户的属性特征向量与所述查询前缀中各字符对应的字符向量分别进行拼接后依次输入循环神经网络,利用所述循环神经网络输出的最后一个字符对应的特征向量得到所述查询前缀的向量表示。
9.根据权利要求1所述的方法,其特征在于,所述各POI的向量表示采用以下方式确定:
在所述排序模型中,各POI的属性信息进行编码,得到POI的向量表示。
10.根据权利要求9所述的方法,其特征在于,所述对POI的属性信息进行编码包括:
在所述排序模型中,将POI的名称和地址信息采用卷积神经网络进行编码;
将POI的其他属性信息采用前馈神经网络进行编码;
将同一POI的编码结果进行拼接后,经过全连接层的映射,得到该POI的向量表示。
11.一种建立用于查询自动补全的排序模型的装置,其特征在于,该装置包括:
第一获取单元,用于从POI查询日志中获取用户从查询补全建议中选择POI时已输入的查询前缀、该查询前缀对应的查询补全建议中的各POI以及查询补全建议中被用户选择的POI;
第二获取单元,用于利用同一查询前缀对应的查询补全建议中被用...
【专利技术属性】
技术研发人员:黄际洲,王海峰,范淼,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。