一种搜索词的分类方法、装置、服务器及存储介质制造方法及图纸

技术编号:19388880 阅读:31 留言:0更新日期:2018-11-10 02:01
本发明专利技术实施例公开了一种搜索词的分类方法、装置、服务器及存储介质。所述方法包括:获取用户在预设时间段内输入的各个搜索词以及各个搜索词对应的搜索时间;根据各个搜索词以及各个搜索词对应的搜索时间确定所述预设时间段内的各个搜索词组;根据各个搜索词组中的各个搜索词以及各个搜索词对应的搜索时间确定各个搜索词组对应的权重值;根据各个搜索词组以及各个搜索词组对应的权重值对所述预设时间段内的搜索词进行分类。可以实现分类结果与搜索需求更加贴合,有利于分析搜索质量和优化搜索结果。

Classification method, device, server and storage medium for search terms

The embodiment of the invention discloses a classification method, a device, a server and a storage medium for search terms. The method includes: acquiring the search terms entered by the user in the preset time period and the corresponding search time of each search word; determining the search phrases in the preset time period according to the search terms and the corresponding search time of each search word; and according to the search terms in each search phrase and each search word. The corresponding search time of search words determines the corresponding weight values of each search phrase; according to the corresponding weight values of each search phrase and each search phrase, the search words in the preset period are classified. The classification results can be more in line with the search requirements, which is conducive to the analysis of search quality and optimization of search results.

【技术实现步骤摘要】
一种搜索词的分类方法、装置、服务器及存储介质
本专利技术实施例涉及互联网
,尤其涉及一种搜索词的分类方法、装置、服务器及存储介质。
技术介绍
随着电子信息化时代的到来,对于搜索引擎或者其他互联网产品的搜索模块来说,有效的搜索词分类是展开众多业务的重要基础。例如,在对搜索词进行分类之后,可以分析搜索质量和优化搜索结果。现有的搜索词的分类方法,普遍是基于各类自然语言处理算法,分析搜索词的语义进而完成分类。具体地,现有的搜索词的分类方法通常包括以下步骤:第一、在各个搜索词中提取文本特征;根据各个搜索词的文本特征将各个搜索词转换为与其对应的搜索向量;第二、根据各个搜索词对应的搜索向量对各个搜索词进行分类。在实现本专利技术的过程中,专利技术人发现现有技术中至少存在如下问题:在现有的搜索词的分类方法中,用户为了完成同一个搜索目标会连续输入的多个搜索词,而这些多个搜索词之间可能不具备相同的文本特征,采用现有的搜索词的分类方法,则会将这些多个搜索词划分到不同的类别中,这样就无法反映出用户的搜索需求,不利于分析搜索质量和优化搜索结果。
技术实现思路
有鉴于此,本专利技术实施例提供一种搜索词的分类方法、装置、服务器及存储介质,可以实现分类结果与搜索需求更加贴合,有利于分析搜索质量和优化搜索结果。第一方面,本专利技术实施例提供了一种搜索词的分类方法,所述方法包括:获取用户在预设时间段内输入的各个搜索词以及各个搜索词对应的搜索时间;根据各个搜索词以及各个搜索词对应的搜索时间确定所述预设时间段内的各个搜索词组;根据各个搜索词组中的各个搜索词以及各个搜索词对应的搜索时间确定各个搜索词组对应的权重值;根据各个搜索词组以及各个搜索词组对应的权重值对所述预设时间段内的搜索词进行分类。第二方面,本专利技术实施例提供了一种搜索词的分类装置,所述装置包括:获取模块、确定模块和分类模块;其中,所述获取模块,用于获取用户在预设时间段内输入的各个搜索词以及各个搜索词对应的搜索时间;所述确定模块,用于根据各个搜索词以及各个搜索词对应的搜索时间确定所述预设时间段内的各个搜索词组;根据各个搜索词组中的各个搜索词以及各个搜索词对应的搜索时间确定各个搜索词组对应的权重值;所述分类模块,用于根据各个搜索词组以及各个搜索词组对应的权重值对所述预设时间段内的搜索词进行分类。第三方面,本专利技术实施例提供了一种服务器,包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本专利技术任意实施例所述的搜索词的分类方法。第四方面,本专利技术实施例提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现本专利技术任意实施例所述的搜索词的分类方法。本专利技术实施例提出了一种搜索词的分类方法、装置、服务器及存储介质,先获取用户在预设时间段内输入的各个搜索词以及各个搜索词对应的搜索时间;然后根据各个搜索词以及各个搜索词对应的搜索时间确定预设时间段内的各个搜索词组;再根据各个搜索词组中的各个搜索词以及各个搜索词对应的搜索时间确定各个搜索词组对应的权重值;最后根据根据各个搜索词组以及各个搜索词组对应的权重值对预设时间段内的搜索词进行分类。也就是说,在本专利技术的技术方案中,可以根据各个搜索词组以及各个搜索词组对应的权重值对预设时间段内的搜索词进行分类。在现有的搜索词的分类方法中,用户为了完成同一个搜索目标会连续输入的多个搜索词,而这些多个搜索词之间可能不具备相同的文本特征,采用现有的搜索词的分类方法,则会将这些多个搜索词划分到不同的类别中,而采用本专利技术的技术方案,则可以将这些多个搜索词划分到相同的类别中。因此,和现有技术相比,本专利技术实施例提出的搜索词的分类方法、装置、服务器及存储介质,可以实现分类结果与搜索需求更加贴合,有利于分析搜索质量和优化搜索结果;并且,本专利技术实施例的技术方案实现简单方便、便于普及,适用范围更广。附图说明图1是本专利技术实施例一提供的搜索词的分类方法的流程图;图2是本专利技术实施例二提供的搜索词的分类方法的流程图;图3是本专利技术实施例三提供的搜索词的分类方法的流程图;图4是本专利技术实施例四提供的搜索词的分类装置的结构示意图;图5是本专利技术实施例五提供的服务器的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部内容。实施例一图1为本专利技术实施例一提供的搜索词的分类方法的流程图,该方法可以由搜索词的分类装置或者服务器来执行,该装置或者服务器可以由软件和/或硬件的方式实现,该装置或者服务器可以集成在任何具有网络通信功能的智能设备中。如图1所示,搜索词的分类方法可以包括:S101、获取用户在预设时间段内输入的各个搜索词以及各个搜索词对应的搜索时间。在本专利技术的具体实施例中,服务器可以获取用户在预设时间段内输入的各个搜索词以及各个搜索词对应的搜索时间。具体地,假设用户在预设时间段内输入了M个搜索词,分别为:搜索词1、搜索词2、…、搜索词M;搜索词1对应的搜索时间为搜索时间1、搜索词2对应的搜索时间为搜索时间2、…、搜索词M对应的搜索时间为搜索时间M;其中,M为大于1的自然数。服务器可以获取用户在预设时间段内输入的搜索词1、搜索词2、…、搜索词M以及搜索词1对应的搜索时间1、搜索词2对应的搜索时间2、…搜索词M对应的搜索时间M。例如,假设用户在12:00-12:10内输入了5个搜索词,分别为:搜索词1、搜索词2、搜索词3、搜索词4和搜索词5;搜索词1对应的搜索时间为12:01、搜索词2对应的搜索时间为搜索时间12:03、搜索词3对应的搜索时间为搜索时间12:05、搜索词4对应的搜索时间为搜索时间12:08、搜索词5对应的搜索时间为搜索时间12:10。服务器可以获取用户在12:00-12:10内输入的搜索词1、搜索词2、搜索词3、搜索词4和搜索词5以及搜索词1对应的搜索时间为搜索时间12:01、搜索词2对应的搜索时间为搜索时间12:03、搜索词3对应的搜索时间为搜索时间12:05、搜索词4对应的搜索时间为搜索时间12:08、搜索词5对应的搜索时间为搜索时间12:10。S102、根据各个搜索词以及各个搜索词对应的搜索时间确定预设时间段内的各个搜索词组。在本专利技术的具体实施例中,服务器可以根据各个搜索词以及各个搜索词对应的搜索时间确定预设时间段内的各个搜索词组。具体地,服务器在获取到用户在预设时间段内输入的各个搜索词以及各个搜索词对应的搜索时间之后,服务器可以先根据各个搜索词对应的搜索时间对预设时间段内的搜索词进行排序;然后根据排序结果将全部搜索词中每N个相邻两个搜索词确定为一个搜索词组;其中,N为大于1的自然数。例如,假设用户在12:00-12:10内输入了5个搜索词,分别为:搜索词1、搜索词2、搜索词3、搜索词4和搜索词5;搜索词1对应的搜索时间为12:01、搜索词2对应的搜索时间为搜索时间12:03、搜索词3对应的搜索时间为搜索时间12:05、搜索词4对应的搜索时间为搜索时间12:08、搜索词5对应的搜索时间为搜索时间12:10。在本步骤中,服务器可以根据搜索词1对应本文档来自技高网...

【技术保护点】
1.一种搜索词的分类方法,其特征在于,所述方法包括:获取用户在预设时间段内输入的各个搜索词以及各个搜索词对应的搜索时间;根据各个搜索词以及各个搜索词对应的搜索时间确定所述预设时间段内的各个搜索词组;根据各个搜索词组中的各个搜索词以及各个搜索词对应的搜索时间确定各个搜索词组对应的权重值;根据各个搜索词组以及各个搜索词组对应的权重值对所述预设时间段内的搜索词进行分类。

【技术特征摘要】
1.一种搜索词的分类方法,其特征在于,所述方法包括:获取用户在预设时间段内输入的各个搜索词以及各个搜索词对应的搜索时间;根据各个搜索词以及各个搜索词对应的搜索时间确定所述预设时间段内的各个搜索词组;根据各个搜索词组中的各个搜索词以及各个搜索词对应的搜索时间确定各个搜索词组对应的权重值;根据各个搜索词组以及各个搜索词组对应的权重值对所述预设时间段内的搜索词进行分类。2.根据权利要求1所述的方法,其特征在于,所述根据各个搜索词以及各个搜索词对应的搜索时间确定所述预设时间段内的各个搜索词组,包括:将各个搜索词划分到与其对应的语义单元中;根据各个搜索词对应的语义单元以及各个搜索词对应的搜索时间确定所述预设时间段内的各个语义单元组;将所述预设时间段内的各个语义单元组确定为所述预设时间段内的各个搜索词组。3.根据权利要求2所述的方法,其特征在于,所述根据各个搜索词对应的语义单元以及各个搜索词对应的搜索时间确定所述预设时间段内的各个语义单元组,包括:根据各个搜索词对应的语义单元以及各个搜索词对应的搜索时间对所述预设时间段内的语义单元进行排序;根据排序结果将全部语义单元中每N个相邻两个语义单元确定为一个语义单元组;其中,N为大于1的自然数。4.根据权利要求2所述的方法,其特征在于,所述根据各个搜索词组中的各个搜索词以及各个搜索词对应的搜索时间确定各个搜索词组对应的权重值,包括:判断每两个语义单元组中每两个对应的语义单元是否相同;当所述每两个语义单元组中任意两个对应的语义单元不相同时,根据所述每两个语义单元组中各个语义单元对应的搜索时间分别计算所述每两个语义单元组对应的权重值。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:当所述每两个语义单元组中每两个对应的语义单元均相同时,根据所述每两个语义单元组中各个语义单元对应的搜索时间分别计算所述每两个语义单元组对应的权重值;将所述每两个语义单元组合并为一个语义单元组,并将合并后的语义单元组对应的权重值确定为所述每两个语义单元组对应的权重值之和。6.一种搜索词的分类装置,其特征在于,所述装置包括:获取模块、确定模块和分类模块;其中,所述获取模块,用于获取用户在预设时间段内输入的各个搜...

【专利技术属性】
技术研发人员:沈珅
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1