【技术实现步骤摘要】
查询自动补全的方法、装置、设备和计算机存储介质
本申请涉及计算机应用
,特别涉及智能搜索
的一种查询自动补全的方法、装置、设备和计算机存储介质。
技术介绍
QAC(QueryAuto-Completion,查询自动补全)目前已被主流的通用搜索引擎和垂直搜索引擎广泛采用。例如,在地图类应用中,当用户输入query(查询)以搜索某个POI(PointofInterest,兴趣点)时,从用户输入不完整query开始(在本申请中将用户输入的不完整query称为查询前缀),搜索引擎可以在候选列表中实时向用户推荐一系列候选的POI以供用户选择作为query的补全结果(在本申请中将候选列表中推荐的query称为查询补全建议)。一旦用户在候选列表中发现其意向的POI,则通过从候选列表中选择该POI即可补全query,从而发起该POI的检索。举个例子,如图1中所示,当用户在地图类应用的检索框中输入查询前缀“百度”时,能够以候选列表的形式向用户推荐诸如“百度大厦”、“百度大厦-C座”、“百度科技园”等等候选POI以供用户选择 ...
【技术保护点】
1.一种查询自动补全的方法,其特征在于,该方法包括:/n获取用户当前输入的查询前缀,以及确定与所述查询前缀对应的候选兴趣点POI;/n获取所述用户的查询历史信息的向量表示以及各候选POI的向量表示;/n将所述用户的查询历史信息的向量表示以及各候选POI的向量表示输入预先训练得到的排序模型,得到对各候选POI的评分;/n依据各候选POI的评分确定向所述用户推荐的查询补全建议。/n
【技术特征摘要】
1.一种查询自动补全的方法,其特征在于,该方法包括:
获取用户当前输入的查询前缀,以及确定与所述查询前缀对应的候选兴趣点POI;
获取所述用户的查询历史信息的向量表示以及各候选POI的向量表示;
将所述用户的查询历史信息的向量表示以及各候选POI的向量表示输入预先训练得到的排序模型,得到对各候选POI的评分;
依据各候选POI的评分确定向所述用户推荐的查询补全建议。
2.根据权利要求1所述的方法,其特征在于,获取所述用户的查询历史信息的向量表示包括:
获取所述用户的查询历史信息,所述查询历史信息包括所述用户在第一时长内查询或点击过的POI以及所述用户在第二时长内查询或点击过的高频POI,所述第二时长大于所述第一时长;
利用POI的向量表示获取所述用户的查询历史信息的向量表示。
3.根据权利要求1或2所述的方法,其特征在于,各POI的向量表示采用如下方式预先得到:
获取大规模用户的POI查询日志,将各用户查询或点击的POI分别按照时序进行排列,得到各POI序列;
按照预设的滑动窗口大小,对各POI序列进行切片,各切片包括中心POI和该中心POI的上下文POI;
利用各切片进行跳字skip-gram模型的训练;
训练结束后,从skip-gram模型获得各POI的向量表示。
4.根据权利要求3所述的方法,其特征在于,所述利用各切片进行skip-gram模型的训练包括:
利用skip-gram模型对各POI的属性信息进行编码,得到各POI的向量表示,以各切片中中心POI的向量表示预测同一切片中上下文POI的向量表示,依据预测结果的误差迭代更新skip-gram模型的模型参数。
5.根据权利要求4所述的方法,其特征在于,对各POI的属性信息进行编码包括:
将POI的名称和地址信息采用卷积神经网络进行编码;
将POI的其他属性信息采用前馈神经网络进行编码;
将同一POI的编码结果进行拼接后,经过全连接层的映射,得到该POI的向量表示。
6.根据权利要求1所述的方法,其特征在于,所述排序模型在对各候选POI进行评分时,进一步利用所述用户的属性特征向量表示和各候选POI的热度特征向量表示。
7.一种建立用于查询自动补全的排序模型的方法,其特征在于,该方法包括:
从POI查询日志中获取用户标识、用户从查询补全建议中选择POI时已输入的查询前缀、该查询前缀对应的查询补全建议中的各POI以及查询补全建议中被用户选择的POI;
获取用户在输入查询前缀之前的查询历史信息的向量表示以及查询补全建议中各POI的向量表示;
将用户在输入查询前缀之前的查询历史信息的向量表示以及对应查询补全建议中被用户选择的POI的向量表示作为正例,用户在输入查询前缀之前的查询历史信息的向量表示以及对应查询补全建议中未被用户选择的POI作为负例,训练神经网络模型,得到所述排序模型,其中训练目标为:最大化神经网络模型对正例POI的评分与负例POI的评分之间的差值。
8.根据权利要求7所述的方法,其特征在于,所述获取用户在输入查询前缀之前的查询历史信息的向量表示包括:
获取用户在输入所述查询前缀之前的查询历史信息,所述查询历史信息包括用户在输入所述查询前缀之前第一时长内查询或点击过的POI以及第二时长内查询或点击过的高频POI,所述第二时长大于所述第一时长;
利用POI的向量表示获取所述用户在输入查询前缀之前的查询历史信息的向量表示。
9.根据权利要求7或8所述的方法,其特征在于,各POI的向量表示采用如下方式预先得到:
获取大规模用户的POI查询日志,将各用户查询或点击的POI分别按照时序进行排列,得到各POI序列;
按照预设的滑动窗口大小,对各POI序列进行切片,各切片包括中心POI和该中心POI的上下文POI;
利用各切片进行跳字skip-gram模型的训练;
训练结束后,从skip-gram模型获得各POI的向量表示。
10.根据权利要求9所述的方法,其特征在于,所述利用各切片进行skip-gram模型的训练包括:
利用skip-gram模型对各POI的属性信息进行编码,得到各POI的向量表示,以各切片中中心POI的向量表示预测同一切片中上下文POI的向量表示,依据预测结果的误差迭代更新ski...
【专利技术属性】
技术研发人员:李莹,黄际洲,范淼,王海峰,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。