查询方法和装置制造方法及图纸

技术编号:16399320 阅读:105 留言:0更新日期:2017-10-17 19:41
本申请公开了查询方法和装置。该方法的一具体实施方式包括:从历史查询语句集合中获取目标历史查询语句;基于查询日志,对所述目标历史查询语句进行扩展,生成与所述目标历史查询语句相关联的扩展语句片段;将所述扩展语句片段作为与所述目标历史查询语句相关联的语句片段特征添加到预设模型的语句片段特征库;响应于接收到查询语句,基于所述预设模型的语句片段特征库生成查询语句对应的查询结果。本申请实施例将扩展语句片段作为与目标历史查询语句相关联的语句片段特征添加到预设模型的语句片段特征库,能够生成更准确的查找结果。

Query method and device

The query method and device are disclosed in this application. One embodiment of the method includes: a sentence collection target of history query from the query; based on query log, the goal of history query expansion, generation and the goal of history query related extended statement pieces linked; the extended statement fragment as a fragment of sentence feature database relevant statement statement the fragment feature added to the preset model and the target query history; in response to receiving the query statement fragments the preset feature library model generates queries corresponding to the query results based on. In this application, the extended statement fragment is added to the feature fragment of the sentence fragment of the preset model, which can generate more accurate search results.

【技术实现步骤摘要】
查询方法和装置
本申请涉及计算机
,具体涉及互联网
,尤其涉及查询方法和装置。
技术介绍
随着信息技术的发展,越来越多的用户使用互联网进行信息查询。用户使用互联网进行查询时,往往很难在一次查询后得到预期的查询结果。也即由查询引擎得到的信息通常有准确度较低的问题。
技术实现思路
本申请的目的在于提出一种改进的查询方法和装置,来解决以上
技术介绍
部分提到的技术问题。第一方面,本申请实施例提供了一种查询方法,该方法包括:从历史查询语句集合中获取目标历史查询语句;基于查询日志,对目标历史查询语句进行扩展,生成与目标历史查询语句相关联的扩展语句片段;将扩展语句片段作为与目标历史查询语句相关联的语句片段特征添加到预设模型的语句片段特征库,其中,预设模型包括领域识别模型和/或意图槽位识别模型,领域识别模型用以表征查询语句和查询语句的语义所属的预设领域的对应关系,意图槽位识别模型用以表征查询语句和查询语句所指示的查询目的、对查询目的的限定关键词的对应关系;响应于接收到查询语句,基于预设模型的语句片段特征库生成查询语句对应的查询结果。在一些实施例中,基于查询日志,对目标历史查询语句进行扩展,得到本文档来自技高网...
查询方法和装置

【技术保护点】
一种查询方法,其特征在于,所述方法包括:从历史查询语句集合中获取目标历史查询语句;基于查询日志,对所述目标历史查询语句进行扩展,生成与所述目标历史查询语句相关联的扩展语句片段;将所述扩展语句片段作为与所述目标历史查询语句相关联的语句片段特征添加到预设模型的语句片段特征库,其中,所述预设模型包括领域识别模型和/或意图槽位识别模型,所述领域识别模型用以表征查询语句和查询语句的语义所属的预设领域的对应关系,所述意图槽位识别模型用以表征查询语句和查询语句所指示的查询目的、对查询目的的限定关键词的对应关系;响应于接收到查询语句,基于所述预设模型的语句片段特征库生成查询语句对应的查询结果。

【技术特征摘要】
1.一种查询方法,其特征在于,所述方法包括:从历史查询语句集合中获取目标历史查询语句;基于查询日志,对所述目标历史查询语句进行扩展,生成与所述目标历史查询语句相关联的扩展语句片段;将所述扩展语句片段作为与所述目标历史查询语句相关联的语句片段特征添加到预设模型的语句片段特征库,其中,所述预设模型包括领域识别模型和/或意图槽位识别模型,所述领域识别模型用以表征查询语句和查询语句的语义所属的预设领域的对应关系,所述意图槽位识别模型用以表征查询语句和查询语句所指示的查询目的、对查询目的的限定关键词的对应关系;响应于接收到查询语句,基于所述预设模型的语句片段特征库生成查询语句对应的查询结果。2.根据权利要求1所述的查询方法,其特征在于,所述基于查询日志,对所述目标历史查询语句进行扩展,得到扩展语句片段,包括:利用多种预设分词方式,对所述目标历史查询语句进行分词,生成多个语句片段;从所述多个语句片段中,确定按照用户选择概率由最高到低的顺序的选取预设数量的语句片段作为扩展语句片段,或者选取用户选择概率高于概率阈值的语句片段作为扩展语句片段,其中,用户选择概率是由每组语句片段中的每个语句片段在查询日志所记录的查询结果的历史点击次数确定的。3.根据权利要求1所述的查询方法,其特征在于,所述基于查询日志,对所述目标历史查询语句进行扩展,得到扩展语句片段,包括:利用多种预设分词方式,对所述目标历史查询语句进行分词,生成多个语句片段;对于所述多个语句片段中的语句片段,确定作为查询语句的该语句片段所对应的历史用户选择网页的标题;对所述标题进行分词,生成所述标题的至少两个语句片段;确定所述标题的每个语句片段的权重值,并将权重值高于预设权重阈值的语句片段作为扩展语句片段。4.根据权利要求1所述的查询方法,其特征在于,所述基于查询日志,对所述目标历史查询语句进行扩展,得到扩展语句片段,包括:响应于确定所述目标历史查询语句中的第一目标片段和所述目标历史查询语句所对应的历史用户选择网页的标题中的第二目标片段在句中单侧的语境一致的概率大于第一预设阈值,或者两侧的语境一致的概率大于第二预设阈值,则确定第一目标片段和第二目标片段是同义片段,并将第二目标片段确定为扩展语句片段,其中,所述历史用户选择网页被选择的记录记录于查询日志中。5.根据权利要求1所述的查询方法,其特征在于,所述基于查询日志,对所述目标历史查询语句进行扩展,得到扩展语句片段,包括:响应于确定在指定历史时间段内,所述第一目标片段位于目标历史查询语句中并且第二目标片段位于所述目标历史查询语句所对应的多个历史用户选择网页的标题中的概率大于预设阈值,则确定第一目标片段和第二目标片段是同义片段,并将第二目标片段确定为扩展语句片段,其中,所述历史用户选择网页被选择的记录记录于查询日志中。6.根据权利要求1所述的查询方法,其特征在于,所述基于查询日志,对所述目标历史查询语句进行扩展,得到扩展语句片段,包括:基于深度神经网络,确定所述目标历史查询语句中的第一目标片段和所述目标历史查询语句所对应的历史用户选择网页的标题中的第二目标片段的语义相似度,其中,所述历史用户选择网页被选择的记录记录于查询日志中;响应于确定语义相似度在预设相似度阈值以上,则确定第一目标片段和第二目标片段是同义片段,并将第二目标片段确定为扩展语句片段。7.根据权利要求4-6之一所述的查询方法,其特征在于,在确定第一目标片段和第二目标片段是同义片段之后,所述基于查询日志,对所述目标历史查询语句进行扩展,得到扩展语句片段,还包括:向客户端推送包括第一目标片段和第二目标片段的同义片段待确认信息;响应于接收到所述客户端返回同义片段确认信息,确定所述第一目标片段和第二目标片段是确认同义片段。8.根据权利要求1所述的查询方法,其特征在于,所述方法还包括:响应于确定所述目标历史查询语句包括待确定语句片段和预设查询目的片段集合中的查询目的片段,确定查询日...

【专利技术属性】
技术研发人员:陈立玮周晓于佃海赵世奇
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1