信息查询方法及装置制造方法及图纸

技术编号:18497154 阅读:28 留言:0更新日期:2018-07-21 20:12
本发明专利技术公开了一种信息查询方法及装置,属于网络技术领域。所述方法包括:接收查询词;从多个历史查询词中获取所述查询词的目标查询词,所述目标查询词与所述查询词用于描述同一事件或相关事件;输出信息查询结果,信息查询结果为根据所述查询词和所述目标查询词进行查询得到。本发明专利技术通过从多个历史查询词中获取目标查询词,将该目标查询词作为扩展查询词,由于该扩展查询词与该查询词对应于同一事件或相关事件,使得获取的扩展查询词能够符合用户的真实意图,提高了扩展准确率。

Information query method and device

The invention discloses an information inquiry method and a device, belonging to the network technical field. The methods include: receiving a query word, obtaining the target query word of the query word from a plurality of historical query words, the target query word and the query word used to describe the same event or related event; output the information query result, the information query result is queried according to the query word and the target query word. Here it is. By obtaining the target query word from multiple historical query words, the target query word is used as an extended query word. Because the extended query word corresponds to the same event or related event, the extended query words can meet the user's real intention and improve the extension accuracy.

【技术实现步骤摘要】
信息查询方法及装置
本专利技术涉及网络
,尤其涉及一种信息查询方法及装置。
技术介绍
随着互联网的快速发展,网络上所传播的信息越来越多,如何从网络上的大量信息中查询到自己所需要的信息成为了用户越来越关心的问题。目前,信息查询方法可以包括:当用户需要查看网络上的信息时,可以在搜索引擎提供的查询入口中输入查询词(query),并将该查询词提交给搜索引擎。该查询词可以是一个词,如“词语A”,也可以是多个词组成的短串,如“词语A词语B词语C”。搜索引擎可以根据该查询词,获取与该查询词的字面相似度较大(相同的字或词较多)的词作为该查询词的扩展查询词,然后,获取该查询词和该扩展查询词的信息查询结果后返回给用户。在实现本专利技术的过程中,专利技术人发现现有技术至少存在以下问题:上述技术仅仅按照字面相似度对用户输入的查询词进行扩展,得到的扩展查询词可能并不符合用户的真实意图,扩展准确率低。
技术实现思路
本专利技术实施例提供了一种信息查询方法及装置,可以解决现有技术扩展准确率低的问题。所述技术方案如下:一方面,提供了一种信息查询方法,所述方法包括:接收查询词;从多个历史查询词中获取所述查询词的目标查询词,所述目标查询词与所述查询词用于描述同一事件或相关事件;输出信息查询结果,所述信息查询结果为根据所述查询词和所述目标查询词进行查询得到。一方面,提供了一种信息查询方法,所述方法包括:通过搜索框获取查询词;将所述查询词输入至搜索引擎,通过所述搜索引擎基于多个历史查询词进行查询词扩展,得到所述查询词的目标查询词,所述目标查询词与所述查询词用于描述同一事件或相关事件;输出信息查询结果,所述信息查询结果为根据所述查询词和所述目标查询词进行查询得到。一方面,提供了一种信息查询装置,所述装置包括:接收模块,用于接收查询词;获取模块,用于从多个历史查询词中获取所述查询词的目标查询词,所述目标查询词对应的关键词包括所述查询词,所述目标查询词与所述查询词用于描述同一事件或相关事件;输出模块,用于输出信息查询结果,所述信息查询结果为根据所述查询词和所述目标查询词进行查询得到。一方面,提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、至少一段程序、代码集或指令集由所述处理器加载并执行以实现上述信息查询方法所执行的操作。一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如上述信息查询方法所执行的操作。本专利技术实施例提供的技术方案带来的有益效果是:针对待查询的查询词,通过从多个历史查询词中获取目标查询词,将该目标查询词作为扩展查询词,由于该扩展查询词与该查询词对应于同一事件或相关事件,使得获取的扩展查询词能够符合用户的真实意图,提高了扩展准确率。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种信息查询方法的实施环境示意图;图2是本专利技术实施例提供的一种获取多个历史查询词的流程图;图3是本专利技术实施例提供的一种获取候选查询词集合的流程图;图4是本专利技术实施例提供的一种类簇以及对应的查询词的示意图;图5是本专利技术实施例提供的一种信息查询方法的流程图。图6是本专利技术实施例提供的一种信息查询方法的流程图。图7是本专利技术实施例提供的一种信息查询装置的结构示意图;图8是本专利技术实施例提供的一种信息查询装置的结构示意图;图9是本专利技术实施例提供的一种信息查询装置的结构示意图;图10是本专利技术实施例提供的一种服务器的框图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地详细描述。图1是本专利技术实施例提供的一种信息查询方法的实施环境示意图,参见图1,该实施环境可以包括:多个终端101、用于为该多个终端提供服务的服务器102。其中,多个终端101通过无线或者有线网络和服务器102连接,该多个终端101可以为能够访问服务器102的电子设备,该电子设备可以为电脑、智能手机、平板电脑或者其他电子设备。服务器102可以为一个或者多个网站服务器,该服务器102可以作为信息的载体,该服务器102可以根据其用户通过终端对信息进行的查询操作,向用户提供相应信息。另外,该服务器102还可以配置至少一个数据库,如,信息数数据库、用户数据库等等。信息数数据库用于存储已发布的信息,用户数据库用于存储该服务器102所服务的用户的用户名、密码以及用户关系链等个人数据。本专利技术实施例所涉及的信息可以是指文章、图片以及视频等任一种信息,这类信息可以具有地址链接,从而使得用户通过终端对该地址链接进行点击操作时,能够实现对信息的查看。本专利技术实施例中所涉及的公众号,实际上是指在社交应用平台或是信息分享平台上注册的一种区别于普通用户账号的账号,该账号可以为其他账号所订阅,平台可以将该账号所发布的信息(例如公众号文章)推送至订阅该账号的其他账号,使得形成了一个一对多的类似广播的消息机制,且,这种账号还可以具有账号内查询历史信息、账号内咨询以及一些其他信息服务功能。需要说明的是,该公众号可以由任何团体和个人经平台验证通过后注册,本专利技术实施例对此不做限定。为了能够对用户所使用的查询词进行更加准确的扩展,本专利技术实施例可以结合大量用户在实际查询中所使用的查询词以及相关的信息查询结果,来获取多个可用于扩展的历史查询词,参见图2,图2是本专利技术实施例提供的一种获取多个历史查询词的流程图,下面以图2所示的过程为例对上述获取历史查询词的过程进行具体描述:201、服务器从查询日志中获取多个指定查询词。其中,指定查询词是指时新性满足预设条件的查询词,例如,该预设条件可以是时新性大于指定阈值。查询日志可用于记录多个用户的历史查询词、记录每个历史查询词的查询时间(如用户提交查询词的时间)以及每个历史查询词的信息查询结果的点击信息,该点击信息包括信息查询结果中被点击过的网页链接、网页内容以及该网页内容的标题等至少一项。本专利技术实施例对查询日志中记录的信息不做具体限定。例如,上述查询日志的生成方式可以如下:用户在终端上输入某个查询词后,由终端向服务器提交该查询词,服务器可以根据该查询词进行信息查询,并将该查询词的信息查询结果返回给终端并由终端进行显示,终端可以根据用户的选择来显示相应信息查询结果的网页内容。在上述过程中,服务器可以采用将用户提交的查询词、查询时间以及用户对信息查询结果的点击信息等记录至查询日志。在一种可能实现方式中,该多个指定查询词的获取过程可以包括步骤201A和步骤201B:201A、服务器计算查询日志中每个历史查询词的时新性,该时新性用于指示查询词在当前时间点的热门程度。在一种可能实现方式中,服务器可以统计预设时间段内每个历史查询词被查询的次数,根据每个历史查询词被查询的次数与所有历史查询词被查询的总次数计算时新性,其中,该预设时间段可以是与当前时间点相隔预设时间间本文档来自技高网...

【技术保护点】
1.一种信息查询方法,其特征在于,所述方法包括:接收查询词;从多个历史查询词中获取所述查询词的目标查询词,所述目标查询词与所述查询词用于描述同一事件或相关事件;输出信息查询结果,所述信息查询结果为根据所述查询词和所述目标查询词进行查询得到。

【技术特征摘要】
1.一种信息查询方法,其特征在于,所述方法包括:接收查询词;从多个历史查询词中获取所述查询词的目标查询词,所述目标查询词与所述查询词用于描述同一事件或相关事件;输出信息查询结果,所述信息查询结果为根据所述查询词和所述目标查询词进行查询得到。2.根据权利要求1所述的方法,其特征在于,所述从多个历史查询词中获取所述查询词的目标查询词包括:根据所述查询词遍历所述多个历史查询词对应的多个关键词,每个历史查询词对应于描述同一事件或相关事件的多个关键词;当任一个历史查询词对应的多个关键词中包括所述查询词时,将所述历史查询词作为所述目标查询词。3.根据权利要求1所述的方法,其特征在于,所述多个历史查询词的获取过程包括:采用多个指定查询词的信息查询结果中被点击过的网页内容,对所述多个指定查询词进行文本扩展;根据所述多个指定查询词的文本扩展结果,基于多个指定查询词的文本和语义对所述多个指定查询词进行聚类;从多个第一类簇的每个第一类簇中选取一个指定查询词作为所述每个第一类簇的历史查询词,从所述被点击过的网页内容中获取所述每个第一类簇的多个关键词。4.根据权利要求3所述的方法,其特征在于,所述根据所述多个指定查询词的文本扩展结果,基于多个指定查询词的文本和语义对所述多个指定查询词进行聚类,包括:基于词袋模型和文本向量模型,根据所述多个指定查询词的文本扩展结果,获取所述多个指定历史查询词的文本向量和语义向量;基于所述多个指定历史查询词的文本向量和语义向量,对所述多个指定查询词进行聚类。5.根据权利要求3所述的方法,其特征在于,所述多个指定查询词的获取过程包括:计算查询日志中每个历史查询词的时新性,所述时新性用于指示查询词在当前时间点的热门程度,所述查询日志用于记录多个用户的历史查询词;将时新性大于指定阈值的历史查询词获取为所述多个指定查询词。6.根据权利要求3所述的方法,其特征在于,所述多个第一类簇的获取过程包括:计算所述多个指定查询词聚类得到的每个类簇中查询词的数量和质量,查询词的质量基于查询词与类簇中心的相似度确定;将查询词的数量大于指定数量且质量大于第一预设阈值的类簇获取为所述多个第一类簇。7.根据权利要求1所述的方法,其特征在于,所述从多个历史查询词中获取所述查询词的目标查询词之后,所述方法还包括:当所述目标查询词的数量小于预设数量时,根据所述查询词和预先建立的倒排索引表,从候选查询词集合中获取目标候选查询词,所述候选查询词集合包括通过聚类得到的多个第二类簇的查询词,所述目标候选查询词与所述查询词的相似度大于第二预设阈值;执行输出信息查询结果的步骤,所述信息查询结果为根据所述查询词、所述目标查询词和所述目标候选查询词进行查询得到。8.根据权利要求7所述的方法,...

【专利技术属性】
技术研发人员:谢润泉连凤宗
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1