The invention discloses an information inquiry method and a device, belonging to the network technical field. The methods include: receiving a query word, obtaining the target query word of the query word from a plurality of historical query words, the target query word and the query word used to describe the same event or related event; output the information query result, the information query result is queried according to the query word and the target query word. Here it is. By obtaining the target query word from multiple historical query words, the target query word is used as an extended query word. Because the extended query word corresponds to the same event or related event, the extended query words can meet the user's real intention and improve the extension accuracy.
【技术实现步骤摘要】
信息查询方法及装置
本专利技术涉及网络
,尤其涉及一种信息查询方法及装置。
技术介绍
随着互联网的快速发展,网络上所传播的信息越来越多,如何从网络上的大量信息中查询到自己所需要的信息成为了用户越来越关心的问题。目前,信息查询方法可以包括:当用户需要查看网络上的信息时,可以在搜索引擎提供的查询入口中输入查询词(query),并将该查询词提交给搜索引擎。该查询词可以是一个词,如“词语A”,也可以是多个词组成的短串,如“词语A词语B词语C”。搜索引擎可以根据该查询词,获取与该查询词的字面相似度较大(相同的字或词较多)的词作为该查询词的扩展查询词,然后,获取该查询词和该扩展查询词的信息查询结果后返回给用户。在实现本专利技术的过程中,专利技术人发现现有技术至少存在以下问题:上述技术仅仅按照字面相似度对用户输入的查询词进行扩展,得到的扩展查询词可能并不符合用户的真实意图,扩展准确率低。
技术实现思路
本专利技术实施例提供了一种信息查询方法及装置,可以解决现有技术扩展准确率低的问题。所述技术方案如下:一方面,提供了一种信息查询方法,所述方法包括:接收查询词;从多个历史查询词中获取所述查询词的目标查询词,所述目标查询词与所述查询词用于描述同一事件或相关事件;输出信息查询结果,所述信息查询结果为根据所述查询词和所述目标查询词进行查询得到。一方面,提供了一种信息查询方法,所述方法包括:通过搜索框获取查询词;将所述查询词输入至搜索引擎,通过所述搜索引擎基于多个历史查询词进行查询词扩展,得到所述查询词的目标查询词,所述目标查询词与所述查询词用于描述同一事件或相关事件;输出信息查 ...
【技术保护点】
1.一种信息查询方法,其特征在于,所述方法包括:接收查询词;从多个历史查询词中获取所述查询词的目标查询词,所述目标查询词与所述查询词用于描述同一事件或相关事件;输出信息查询结果,所述信息查询结果为根据所述查询词和所述目标查询词进行查询得到。
【技术特征摘要】
1.一种信息查询方法,其特征在于,所述方法包括:接收查询词;从多个历史查询词中获取所述查询词的目标查询词,所述目标查询词与所述查询词用于描述同一事件或相关事件;输出信息查询结果,所述信息查询结果为根据所述查询词和所述目标查询词进行查询得到。2.根据权利要求1所述的方法,其特征在于,所述从多个历史查询词中获取所述查询词的目标查询词包括:根据所述查询词遍历所述多个历史查询词对应的多个关键词,每个历史查询词对应于描述同一事件或相关事件的多个关键词;当任一个历史查询词对应的多个关键词中包括所述查询词时,将所述历史查询词作为所述目标查询词。3.根据权利要求1所述的方法,其特征在于,所述多个历史查询词的获取过程包括:采用多个指定查询词的信息查询结果中被点击过的网页内容,对所述多个指定查询词进行文本扩展;根据所述多个指定查询词的文本扩展结果,基于多个指定查询词的文本和语义对所述多个指定查询词进行聚类;从多个第一类簇的每个第一类簇中选取一个指定查询词作为所述每个第一类簇的历史查询词,从所述被点击过的网页内容中获取所述每个第一类簇的多个关键词。4.根据权利要求3所述的方法,其特征在于,所述根据所述多个指定查询词的文本扩展结果,基于多个指定查询词的文本和语义对所述多个指定查询词进行聚类,包括:基于词袋模型和文本向量模型,根据所述多个指定查询词的文本扩展结果,获取所述多个指定历史查询词的文本向量和语义向量;基于所述多个指定历史查询词的文本向量和语义向量,对所述多个指定查询词进行聚类。5.根据权利要求3所述的方法,其特征在于,所述多个指定查询词的获取过程包括:计算查询日志中每个历史查询词的时新性,所述时新性用于指示查询词在当前时间点的热门程度,所述查询日志用于记录多个用户的历史查询词;将时新性大于指定阈值的历史查询词获取为所述多个指定查询词。6.根据权利要求3所述的方法,其特征在于,所述多个第一类簇的获取过程包括:计算所述多个指定查询词聚类得到的每个类簇中查询词的数量和质量,查询词的质量基于查询词与类簇中心的相似度确定;将查询词的数量大于指定数量且质量大于第一预设阈值的类簇获取为所述多个第一类簇。7.根据权利要求1所述的方法,其特征在于,所述从多个历史查询词中获取所述查询词的目标查询词之后,所述方法还包括:当所述目标查询词的数量小于预设数量时,根据所述查询词和预先建立的倒排索引表,从候选查询词集合中获取目标候选查询词,所述候选查询词集合包括通过聚类得到的多个第二类簇的查询词,所述目标候选查询词与所述查询词的相似度大于第二预设阈值;执行输出信息查询结果的步骤,所述信息查询结果为根据所述查询词、所述目标查询词和所述目标候选查询词进行查询得到。8.根据权利要求7所述的方法,...
【专利技术属性】
技术研发人员:谢润泉,连凤宗,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。