一种搜索对象类别的确定方法及装置制造方法及图纸

技术编号:23363351 阅读:16 留言:0更新日期:2020-02-18 17:24
本申请提供一种搜索对象类别的确定方法及装置,涉及电子商务技术领域,可以从与搜索关键词关联的多个候选对象类别中确定至少一个搜索对象类别。该方法包括:根据搜索关键词确定与所述搜索关键词关联的多个候选对象类别;通过关联度计算模型分别确定所述搜索关键词与所述多个候选对象类别中每个候选对象类别的关联度;根据所述每个候选对象类别的关联度,对所述多个候选对象类别进行排序;根据所述多个候选对象类别的排列顺序确定至少一个搜索对象类别,至少一个搜索对象类别为所述多个候选对象类别中排列顺序满足预设条件的搜索对象类别。

A method and device to determine the category of search object

【技术实现步骤摘要】
一种搜索对象类别的确定方法及装置
本申请涉及电子商务
,尤其涉及一种搜索对象类别的确定方法及装置。
技术介绍
随着电子商务的蓬勃发展。电商平台中商品的数据量越来越庞大,商品类别的覆盖范围也越来越广泛。为提升用户体验,在商品搜索场景下,需要识别用户搜索意图、确定用户所搜索商品的类别,从而对不同用户作出针对性的商品推荐、有效促进商品成交额的提升。现有技术中,一种搜索对象类别的确定方法为:根据历史数据中记录的用户对搜索关键词索引的所有搜索对象类别的选择概率确定所述搜索关键词对应的目标搜索对象类别,其中,搜索对象类别的选择概率是指历史数据中该目标搜索对象类别的历史点击次数在与该搜索关键词相关的总点击次数中所占的比例。由于上述方法只考虑到了每个搜索对象类别点击次数的累加,因此,会造成选择概率大的搜索对象类别被选择的概率越来越高,而选择概率小的搜索对象类别被选择的概率越来越低。
技术实现思路
本申请提供一种搜索对象类别的确定方法及装置,可以从与搜索关键词关联的多个候选对象类别中确定至少一个搜索对象类别。为达到上述目的,本申请采用如下技术方案:第一方面,本申请提供一种搜索对象类别的确定方法,包括:根据搜索关键词确定与所述搜索关键词关联的多个候选对象类别;通过关联度计算模型分别确定所述搜索关键词与所述多个候选对象类别中每个候选对象类别的关联度;根据所述每个候选对象类别的关联度,对所述多个候选对象类别进行排序;根据所述多个候选对象类别的排列顺序确定至少一个搜索对象类别,所述至少一个搜索对象类别为所述多个候选对象类别中排列顺序满足预设条件的搜索对象类别。第二方面,本申请提供一种搜索对象类别的确定装置,所述装置包括:处理单元,用于根据搜索关键词确定与所述搜索关键词关联的多个候选对象类别;所述处理单元,还用于分别确定所述搜索关键词与所述多个候选对象类别中每个候选对象类别的关联度;所述处理单元,还用于根据所述每个候选对象类别的关联度,对所述多个候选对象类别进行排序;所述处理单元,还用于根据所述多个候选对象类别的排列顺序确定至少一个搜索对象类别,所述至少一个搜索对象类别为所述多个候选对象类别中排列顺序满足预设条件的搜索对象类别。第三方面,本申请提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当计算机执行该指令时,该计算机执行上述第一方面的方法。第四方面,本申请提供一种包含指令的计算机程序产品,当该计算机程序产品在计算机上运行时,使得该计算机执行上述第一方面的方法。第五方面,提供一种芯片,包括:处理器和通信接口,该通信接口和该处理器耦合,该处理器用于运行计算机程序或指令,以执行上述第一方面的方法。本申请提供了一种搜索对象类别的确定方法及装置,先通过搜索关键词确定多个候选对象类别,再通过关联度计算模型分别确定搜索关键词与多个候选对象类别中每个候选对象类别的关联度,根据每个候选对象类别的关联度,对多个候选对象类别进行排序后,从多个候选对象类别中确定至少一个搜索对象类别。通过搜索关键词确定多个候选对象类别可以缩小候选对象类别的范围,降低后续操作的数据处理量;通过关联度计算模型确定关联度可以将选择标准数字化,便于选择符合条件的搜索对象类别;通过对多个候选对象类别进行排序便于从多个候选对象类别中确定至少一个搜索对象类别。从而实现搜索关键词与至少一个搜索对象类别的匹配。附图说明图1为本申请实施例提供的搜索对象类别的确定方法的流程示意图一;图2为本申请实施例提供的搜索对象类别的确定方法的流程示意图二;图3为本申请实施例提供的搜索对象类别的确定方法的应用场景示意图一;图4为本申请实施例提供的搜索对象类别的确定方法的应用场景示意图二;图5为使用本申请实施例提供的搜索对象类别的确定方法之前的搜索对象列表示意图;图6为使用本申请实施例提供的搜索对象类别的确定方法之后的搜索对象列表示意图;图7为本申请实施例提供的搜索对象类别的确定装置的结构示意图一;图8为本申请实施例提供的搜索对象类别的确定装置的结构示意图二。具体实施方式下面结合附图对本申请实施例提供的搜索对象类别的确定方法及装置进行详细地描述。在本申请的描述中,除非另有说明,“/”表示“或”的意思,例如,A/B可以表示A或B。本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。此外,“至少一个”是指一个或多个,“多个”是指两个或两个以上。此外,本申请的描述中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括其他没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。需要说明的是,本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。为了便于理解本申请的技术方案,下面对一些技术术语进行介绍。1、马太效应马太效应:是指强者愈强、弱者愈弱的现象。在本申请实施例中,马太效应表现为热门商品类别的关注度越来越高,而冷门商品类别逐渐被系统遗忘。2、长尾效应长尾效应:正态曲线中间的突起部分叫“头”;两边相对平缓的部分叫“尾”。长尾效应是指大多数的需求会集中在头部,而分布在尾部的需求是个性化的,零散的小量的需求。而这部分差异化的、少量的需求会在需求曲线上面形成一条长长的“尾巴”。当用户在搜索平台的搜索引擎上输入搜索对象名称时,返回结果可能包含多种类别的搜索对象,为了提高用户的搜索效率,可以根据通过搜索对象名称得到的搜索关键词计算用户想要查询的搜索对象对应的类别的可能性。现有技术中,可以基于类别点击词典实现对搜索对象类别的预测,类别点击词典是根据用户的历史搜索词以及该历史搜索关键词对应的候选对象类别的点击情况,统计得到的各个搜索关键词的搜索对象类别点击分布记录。以搜索对象为商品为例,当需要对用户输入的搜索关键词进行类别预测时:首先确定商品类别候选集。示例性的,当搜索关键词为“笔记本”,则商品类别候选集中包括电子产品类商品和办公用品类商品。然后,根据类别点击词典统计商品类别候选集中搜索关键词对应商品类别的点击分布记录,从搜索关键词对应的商品别目中选取商品类别相关性最高的商品类别作为该搜索关键词的商品类别。例如,当用户输入的搜索关键词为“笔记本”时,类别点击词典中记录了搜索关键词“笔记本”对应电子产品的点击次数是300次,对应办公用品的点击次数是700次,因此,搜索关键词“笔记本”对应的搜索对象类别的计算结果可以是:商品类别为电子产品的可能本文档来自技高网...

【技术保护点】
1.一种搜索对象类别的确定方法,其特征在于,所述方法包括:/n根据搜索关键词确定与所述搜索关键词关联的多个候选对象类别;/n通过关联度计算模型分别确定所述搜索关键词与所述多个候选对象类别中每个候选对象类别的关联度;/n根据所述每个候选对象类别的关联度,对所述多个候选对象类别进行排序;/n根据所述多个候选对象类别的排列顺序确定至少一个搜索对象类别,所述至少一个搜索对象类别为所述多个候选对象类别中排列顺序满足预设条件的搜索对象类别。/n

【技术特征摘要】
1.一种搜索对象类别的确定方法,其特征在于,所述方法包括:
根据搜索关键词确定与所述搜索关键词关联的多个候选对象类别;
通过关联度计算模型分别确定所述搜索关键词与所述多个候选对象类别中每个候选对象类别的关联度;
根据所述每个候选对象类别的关联度,对所述多个候选对象类别进行排序;
根据所述多个候选对象类别的排列顺序确定至少一个搜索对象类别,所述至少一个搜索对象类别为所述多个候选对象类别中排列顺序满足预设条件的搜索对象类别。


2.根据权利要求1所述的方法,其特征在于,所述根据搜索关键词确定与所述搜索关键词关联的多个候选对象类别之前,所述方法还包括:
获取用户输入的搜索词条;
通过分词器从所述搜索词条中确定所述搜索关键词。


3.根据权利要求2所述的方法,其特征在于,所述根据搜索关键词确定与所述搜索关键词关联的多个候选对象类别,包括:
根据所述搜索关键词从多个召回器中确定目标召回器,所述目标召回器用于根据所述搜索关键词确定所述多个候选对象类别,所述搜索关键词的文本信息与所述目标召回器的筛选机制对应;
通过将所述搜索关键词输入所述目标召回器确定所述多个候选对象类别。


4.根据权利要求1-3中任一项所述的方法,其特征在于,所述根据搜索关键词确定与所述搜索关键词关联的多个候选对象类别,包括:
根据搜索关键词确定多个搜索对象类别;
过滤掉所述多个搜索对象类别中包括敏感词的搜索对象类别,得到所述多个候选对象类别。


5.根据权利要求1-3任一项所述的方法,其特征在于,对于第一候选对象类别,所述第一候选对象类别为所述多个候选对象类别中的任一个,
所述通过关联度计算模型确定所述搜索关键词与所述第一候选对象类别的关联度,包括:
根据公式计算所述搜索关键词与所述第一候选对象类别的第一关联值,其中,Xab表示用户历史行为数据中与所述搜索关键词对应的所述第一候选对象类别的点击次数,q表示幂运算系数,Xa表示用户历史行为数据中与所述搜索关键词对应的所述多个候选对象类别的点击次数之和,Xb表示所述用户历史行为数据中所述第一候选对象类别的总点击次数;F表示所述搜索关键词与所述第一候选对象类别的第一关联值;
根据所述第一候选对象类别的第一关联值权重确定所述搜索关键词与所述第一候选对象类别的第二关联值,第一关联值权重由所述搜索关键词与所述第一候选对象类别之间的文本相似性确定;
对所述搜索关键词与所述第一候选对象类别的第二关联值进行归一化处理确定所述搜索关键词与所述第一候选对象类别的关联度。


6.根据权利要求5所述的方法,其特征在于,所述用户历史行为数据包括用户信息、搜索对象信息和搜索信息,所述用户信息用于记录用户的个性化信息,所述搜索对象信息用于记录搜索对象类别,所述搜索信息用于记录用户的点击行为和所述点击行为的上下文特征。


7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
向用户展示所述至少一个搜索对象类别对应的搜索对象列表,所述搜索对象列表中的搜索对象按照所述搜索对象对应的候选对象类别的排列顺序排序。


8.一种搜索对象类别的确定装置,其特征在于,所述装置包括:
处理单元,用于根据搜索关键词确定与所述搜索关键词关联的多个候选对象类别;
所述处理单元,还用于分别确定所述搜索关键词与所述多个候选对象类别中每个候选对象类别的关联度;
所述处理单元,还用于...

【专利技术属性】
技术研发人员:张宾武斌周晶尹硕李慧超
申请(专利权)人:国网电子商务有限公司英大商务服务有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1