一种获取搜索词对应商品类目的方法和装置制造方法及图纸

技术编号:17704924 阅读:20 留言:0更新日期:2018-04-14 17:54
本发明专利技术公开了一种获取搜索词对应商品类目的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:接收用户输入的搜索词;判断离线数据中是否存在与所述搜索词匹配的商品类目信息,若存在则获取与所述搜索词匹配的商品类目信息;否则对所述搜索词进行分词处理以获得分词词组,并在离线数据中获取与所述词组匹配的商品类目信息。该实施方式能够快速、准确地匹配到搜索词对应的商品类目信息。

【技术实现步骤摘要】
一种获取搜索词对应商品类目的方法和装置
本专利技术涉及计算机
,尤其涉及一种获取搜索词对应商品类目的方法和装置。
技术介绍
目前,在一个商品搜索系统中,决定搜索结果的因子有很多,其中用户提交的搜索词所对应的商品类目是一个关键因素,会直接影响到搜索结果,然而如何从用户千奇百怪的搜索数据中获取正确的商品类目(所述类目为商品对应的类目,可以不止一级类目。),是一个复杂的问题。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:现有确定用户输入的搜索词对应的各商品类目,从中选择出用户所偏好的商品类目,并基于用户输入的搜索词和选择出的商品类目下的所有商品的标题词,重新确定搜索词,采用重新确定的搜索词进行搜索。但该方案没有说明如何在已有的离线数据中,不存在某个词到某个商品类目的映射关系的条件下,是怎样确定用户输入的词关联到其商品类目的。并且,现有技术需要重构搜索词,很难保证重构的精准性,最终的重构结果与用户的搜索意图很可能不一致,导致结果的偏差。同时,现有技术是离线进行数据挖掘,但在离线数据无法覆盖用户搜索时,查询无结果。
技术实现思路
有鉴于此,本专利技术实施例提供一种获取搜索词对应商品类目的方法和装置,能够快速、准确地匹配到搜索词对应的商品类目。为实现上述目的,根据本专利技术实施例的一个方面,提供了一种获取搜索词对应商品类目的方法,包括接收用户输入的搜索词;判断离线数据中是否存在与所述搜索词匹配的商品类目信息,若存在则获取与所述搜索词匹配的商品类目信息;否则对所述搜索词进行分词处理以获得分词词组,并在离线数据中获取与所述词组匹配的商品类目信息。可选地,所述在离线数据中获取与所述词组匹配的商品类目信息的步骤中,还包括:将所述词组中的词进行全组合,遍历全组合后的词组以获得匹配的商品类目信息。可选地,所述在遍历全组合后的词组以获得匹配的商品类目信息的步骤中,包括:按照字典序对所述全组合后的词组进行排序以生成词组串,然后遍历所述词组串中的词组,在离线数据中进行匹配查找;其中,当遍历到的所述词组串中的词组长度与遍历的上一个所述词组串中的词组长度不同时,判断是否存在中间查询结果,若存在则结束遍历并获取所述中间结果作为匹配的商品类目信息,否则继续遍历所述词组串中的词组。可选地,所述获取与所述搜索词匹配的商品类目信息或者获取与所述词组匹配的商品类目信息之后,还包括:根据预设的产品词分类补充词表和预设的品牌词分类补充词表,确定所述搜索词中存在产品词或/和品牌词,以重新确定匹配的商品类目信息。可选地,所述获取与所述搜索词匹配的商品类目信息的同时获取所述商品类目信息对应的权值;或者所述获取与所述词组匹配的商品类目信息的同时获取所述商品类目信息对应的权值。可选地,所述重新确定匹配的商品类目信息,包括:分别调用接口查询所述搜索词中存在的产品词的商品类目信息、品牌词的商品类目信息;将所述产品词的商品类目信息和所述品牌词的商品类目信息与所述搜索词或词组匹配的商品类目信息中的相同商品类目信息存放到相同类目信息中,剩余的所述产品词的商品类目信息和所述品牌词的商品类目信息存放在产品类目信息中,剩余的所述搜索词或词组匹配的商品类目信息存放在搜索类目信息中;将产品类目信息和搜索类目信息的内容合并为补充类目信息,将相同类目信息中各类目的权重值乘以系数0.8,并以计算结果作为相同类目信息中各类目的新权重值;将相同类目信息中各项类目的权重值之和乘以系数0.2,再除以补充类目信息中的类目总数,然后将计算结果分别与补充类目信息中各类目的权重值相加,作为补充类目信息中各类目的新权重值。另外,根据本专利技术实施例的一个方面,提供了一种获取搜索词对应商品类目的装置,包括接收模块,用于接收用户输入的搜索词;判断模块,用于判断离线数据中是否存在与所述搜索词匹配的商品类目信息;匹配模块,用于根据所述判断模块的判断结果,获取与所述搜索词匹配的商品类目信息或者对所述搜索词进行分词处理以获得分词词组,并在离线数据中获取与所述词组匹配的商品类目信息。可选地,所述匹配模块在离线数据中获取与所述词组匹配的商品类目信息的步骤中,还包括:将所述词组中的词进行全组合,遍历全组合后的词组以获得匹配的商品类目信息。可选地,所述匹配模块在遍历全组合后的词组以获得匹配的商品类目信息的步骤中,包括:按照字典序对所述全组合后的词组进行排序以生成词组串,然后遍历所述词组串中的词组,在离线数据中进行匹配查找;其中,当遍历到的所述词组串中的词组长度与遍历的上一个所述词组串中的词组长度不同时,判断是否存在中间查询结果,若存在则结束遍历并获取所述中间结果作为匹配的商品类目信息,否则继续遍历所述词组串中的词组。可选地,所述匹配模块获取与所述搜索词匹配的商品类目信息或者获取与所述词组匹配的商品类目信息之后,还用于:根据预设的产品词分类补充词表和预设的品牌词分类补充词表,确定所述搜索词中存在产品词或/和品牌词,以重新确定匹配的商品类目信息。可选地,所述匹配模块获取与所述搜索词匹配的商品类目信息的同时获取所述商品类目信息对应的权值;或者所述匹配模块获取与所述词组匹配的商品类目信息的同时获取所述商品类目信息对应的权值。可选地,所述匹配模块重新确定匹配的商品类目信息的步骤中,包括:分别调用接口查询所述搜索词中存在的产品词的商品类目信息、品牌词的商品类目信息;将所述产品词的商品类目信息和所述品牌词的商品类目信息与所述搜索词或词组匹配的商品类目信息中的相同商品类目信息存放到相同类目信息中,剩余的所述产品词的商品类目信息和所述品牌词的商品类目信息存放在产品类目信息中,剩余的所述搜索词或词组匹配的商品类目信息存放在搜索类目信息中;将产品类目信息和搜索类目信息的内容合并为补充类目信息,将相同类目信息中各类目的权重值乘以系数0.8,并以计算结果作为相同类目信息中各类目的新权重值;将相同类目信息中各项类目的权重值之和乘以系数0.2,再除以补充类目信息中的类目总数,然后将计算结果分别与补充类目信息中各类目的权重值相加,作为补充类目信息中各类目的新权重值。根据本专利技术实施例的另一个方面,还提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任一实施例所述的方法。根据本专利技术实施例的另一个方面,还提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任一实施例所述的方法。上述专利技术中的一个实施例具有如下优点或有益效果:因为采用了对搜索词进行分词处理以获得分词词组,并在离线数据中获取与所述词组匹配的商品类目信息的技术手段,进而实现了快速获取对应商品的类目信息,有效的提高了搜索的准确性。上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。附图说明附图用于更好地理解本专利技术,不构成对本专利技术的不当限定。其中:图1是根据本专利技术实施例获取搜索词对应商品类目的方法的主要流程的示意图;图2是根据本专利技术可参考实施例获取搜索词对应商品类目的方法的主要流程的示意图;图3是根据本专利技术实施例获取搜索词对应商品类目的装置的主要模块的示意图;图4是本专利技术实施例可以应用于其中的示例性系统架构图;图5是适于用来实现本专利技术实施本文档来自技高网...
一种获取搜索词对应商品类目的方法和装置

【技术保护点】
一种获取搜索词对应商品类目的方法,其特征在于,包括:接收用户输入的搜索词;判断离线数据中是否存在与所述搜索词匹配的商品类目信息,若存在则获取与所述搜索词匹配的商品类目信息;否则对所述搜索词进行分词处理以获得分词词组,并在离线数据中获取与所述词组匹配的商品类目信息。

【技术特征摘要】
1.一种获取搜索词对应商品类目的方法,其特征在于,包括:接收用户输入的搜索词;判断离线数据中是否存在与所述搜索词匹配的商品类目信息,若存在则获取与所述搜索词匹配的商品类目信息;否则对所述搜索词进行分词处理以获得分词词组,并在离线数据中获取与所述词组匹配的商品类目信息。2.根据权利要求1所述的方法,其特征在于,所述在离线数据中获取与所述词组匹配的商品类目信息的步骤中,还包括:将所述词组中的词进行全组合,遍历全组合后的词组以获得匹配的商品类目信息。3.根据权利要求2所述的方法,其特征在于,所述在遍历全组合后的词组以获得匹配的商品类目信息的步骤中,包括:按照字典序对所述全组合后的词组进行排序以生成词组串,然后遍历所述词组串中的词组,在离线数据中进行匹配查找;其中,当遍历到的所述词组串中的词组长度与遍历的上一个所述词组串中的词组长度不同时,判断是否存在中间查询结果,若存在则结束遍历并获取所述中间结果作为匹配的商品类目信息,否则继续遍历所述词组串中的词组。4.根据权利要求1所述的方法,其特征在于,所述获取与所述搜索词匹配的商品类目信息或者获取与所述词组匹配的商品类目信息之后,还包括:根据预设的产品词分类补充词表和预设的品牌词分类补充词表,确定所述搜索词中存在产品词或/和品牌词,以重新确定匹配的商品类目信息。5.根据权利要求4所述的方法,其特征在于,所述获取与所述搜索词匹配的商品类目信息的同时获取所述商品类目信息对应的权值;或者所述获取与所述词组匹配的商品类目信息的同时获取所述商品类目信息对应的权值。6.根据权利要求5所述的方法,其特征在于,所述重新确定匹配的商品类目信息,包括:分别调用接口查询所述搜索词中存在的产品词的商品类目信息、品牌词的商品类目信息;将所述产品词的商品类目信息和所述品牌词的商品类目信息与所述搜索词或词组匹配的商品类目信息中的相同商品类目信息存放到相同类目信息中,剩余的所述产品词的商品类目信息和所述品牌词的商品类目信息存放在产品类目信息中,剩余的所述搜索词或词组匹配的商品类目信息存放在搜索类目信息中;将产品类目信息和搜索类目信息的内容合并为补充类目信息,将相同类目信息中各类目的权重值乘以系数0.8,并以计算结果作为相同类目信息中各类目的新权重值;将相同类目信息中各项类目的权重值之和乘以系数0.2,再除以补充类目信息中的类目总数,然后将计算结果分别与补充类目信息中各类目的权重值相加,作为补充类目信息中各类目的新权重值。7.一种获取搜索词对应商品类目的装置,其特征在于,包括:接收模块,用于接收用户输入的搜索词;判断模块,用于判断离线数据中是否存在与所述搜索词匹配的商品类目信息;匹配模块,用于根据所述判断模块的判断结果,获取与所述搜索词匹配...

【专利技术属性】
技术研发人员:段赫邵荣防郝晖谢群群
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1