The embodiment of the invention discloses a classification method, a device, a server and a storage medium for search terms. The method includes: acquiring the search terms entered by the user in the preset time period and the corresponding search time of each search word; determining the search phrases in the preset time period according to the search terms and the corresponding search time of each search word; and according to the search terms in each search phrase and each search word. The corresponding search time of search words determines the corresponding weight values of each search phrase; according to the corresponding weight values of each search phrase and each search phrase, the search words in the preset period are classified. The classification results can be more in line with the search requirements, which is conducive to the analysis of search quality and optimization of search results.
【技术实现步骤摘要】
一种搜索词的分类方法、装置、服务器及存储介质
本专利技术实施例涉及互联网
,尤其涉及一种搜索词的分类方法、装置、服务器及存储介质。
技术介绍
随着电子信息化时代的到来,对于搜索引擎或者其他互联网产品的搜索模块来说,有效的搜索词分类是展开众多业务的重要基础。例如,在对搜索词进行分类之后,可以分析搜索质量和优化搜索结果。现有的搜索词的分类方法,普遍是基于各类自然语言处理算法,分析搜索词的语义进而完成分类。具体地,现有的搜索词的分类方法通常包括以下步骤:第一、在各个搜索词中提取文本特征;根据各个搜索词的文本特征将各个搜索词转换为与其对应的搜索向量;第二、根据各个搜索词对应的搜索向量对各个搜索词进行分类。在实现本专利技术的过程中,专利技术人发现现有技术中至少存在如下问题:在现有的搜索词的分类方法中,用户为了完成同一个搜索目标会连续输入的多个搜索词,而这些多个搜索词之间可能不具备相同的文本特征,采用现有的搜索词的分类方法,则会将这些多个搜索词划分到不同的类别中,这样就无法反映出用户的搜索需求,不利于分析搜索质量和优化搜索结果。
技术实现思路
有鉴于此,本专利技术实施例提供一种搜索词的分类方法、装置、服务器及存储介质,可以实现分类结果与搜索需求更加贴合,有利于分析搜索质量和优化搜索结果。第一方面,本专利技术实施例提供了一种搜索词的分类方法,所述方法包括:获取用户在预设时间段内输入的各个搜索词以及各个搜索词对应的搜索时间;根据各个搜索词以及各个搜索词对应的搜索时间确定所述预设时间段内的各个搜索词组;根据各个搜索词组中的各个搜索词以及各个搜索词对应的搜索时间确定各个搜索 ...
【技术保护点】
1.一种搜索词的分类方法,其特征在于,所述方法包括:获取用户在预设时间段内输入的各个搜索词以及各个搜索词对应的搜索时间;根据各个搜索词以及各个搜索词对应的搜索时间确定所述预设时间段内的各个搜索词组;根据各个搜索词组中的各个搜索词以及各个搜索词对应的搜索时间确定各个搜索词组对应的权重值;根据各个搜索词组以及各个搜索词组对应的权重值对所述预设时间段内的搜索词进行分类。
【技术特征摘要】
1.一种搜索词的分类方法,其特征在于,所述方法包括:获取用户在预设时间段内输入的各个搜索词以及各个搜索词对应的搜索时间;根据各个搜索词以及各个搜索词对应的搜索时间确定所述预设时间段内的各个搜索词组;根据各个搜索词组中的各个搜索词以及各个搜索词对应的搜索时间确定各个搜索词组对应的权重值;根据各个搜索词组以及各个搜索词组对应的权重值对所述预设时间段内的搜索词进行分类。2.根据权利要求1所述的方法,其特征在于,所述根据各个搜索词以及各个搜索词对应的搜索时间确定所述预设时间段内的各个搜索词组,包括:将各个搜索词划分到与其对应的语义单元中;根据各个搜索词对应的语义单元以及各个搜索词对应的搜索时间确定所述预设时间段内的各个语义单元组;将所述预设时间段内的各个语义单元组确定为所述预设时间段内的各个搜索词组。3.根据权利要求2所述的方法,其特征在于,所述根据各个搜索词对应的语义单元以及各个搜索词对应的搜索时间确定所述预设时间段内的各个语义单元组,包括:根据各个搜索词对应的语义单元以及各个搜索词对应的搜索时间对所述预设时间段内的语义单元进行排序;根据排序结果将全部语义单元中每N个相邻两个语义单元确定为一个语义单元组;其中,N为大于1的自然数。4.根据权利要求2所述的方法,其特征在于,所述根据各个搜索词组中的各个搜索词以及各个搜索词对应的搜索时间确定各个搜索词组对应的权重值,包括:判断每两个语义单元组中每两个对应的语义单元是否相同;当所述每两个语义单元组中任意两个对应的语义单元不相同时,根据所述每两个语义单元组中各个语义单元对应的搜索时间分别计算所述每两个语义单元组对应的权重值。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:当所述每两个语义单元组中每两个对应的语义单元均相同时,根据所述每两个语义单元组中各个语义单元对应的搜索时间分别计算所述每两个语义单元组对应的权重值;将所述每两个语义单元组合并为一个语义单元组,并将合并后的语义单元组对应的权重值确定为所述每两个语义单元组对应的权重值之和。6.一种搜索词的分类装置,其特征在于,所述装置包括:获取模块、确定模块和分类模块;其中,所述获取模块,用于获取用户在预设时间段内输入的各个搜...
【专利技术属性】
技术研发人员:沈珅,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。