物品召回方法、系统、电子设备及可读存储介质技术方案

技术编号:25439230 阅读:32 留言:0更新日期:2020-08-28 22:27
本发明专利技术公开了一种物品召回方法、系统、电子设备及可读存储介质,所述物品召回方法包括:获取用户的行为数据,行为数据包括点击和/或购买的物品及每个物品的物品信息;输入一检索类目词;从行为数据中提取包含检索类目词的目标行为数据;逆向关联获取目标行为数据中每个物品的检索词及每个检索词的检索频次;对目标行为数据中物品信息进行分词,得到多个物品分词;计算所有检索词与多个物品分词的相似度;判断相似度是否大于第一预设阈值,若是,则提取所有检索词中检索频次大于预设频次的检索词作为检索类目词的扩展词;根据检索类目词和扩展词进行物品召回。本发明专利技术利用获取的行为数据提取得到物品类目词的扩展词,提高了召回物品的覆盖率。

【技术实现步骤摘要】
物品召回方法、系统、电子设备及可读存储介质
本专利技术属于大数据处理领域,特别涉及一种物品召回方法、系统、电子设备及可读存储介质。
技术介绍
在电商领域中,经常出现需要基于物品类目去做物品召回的类似场景,比如基于类目(例如“连衣裙”)去召回一批符合要求的物品的类似场景,为了后续筛选或者排序算法可以有更大的发挥空间,我们需要在不失准确的基础上,召回尽可能多的物品。现有技术会用到文字匹配的相关方法,但对于同一物品,可能存在描述上的差异,不一定会包含该类目词,导致无法被召回。
技术实现思路
本专利技术要解决的技术问题是为了克服现有技术中由于描述差异导致物品召回效果差的缺陷,提供一种物品召回方法、系统、电子设备及可读存储介质。本专利技术是通过下述技术方案来解决上述技术问题:一种物品召回方法,所述物品召回方法包括:获取用户的行为数据,所述行为数据包括点击和/或购买的物品及每个物品的物品信息;输入一检索类目词;从所述行为数据中提取包含所述检索类目词的目标行为数据;逆向关联获取所述目标行为数本文档来自技高网...

【技术保护点】
1.一种物品召回方法,其特征在于,所述物品召回方法包括:/n获取用户的行为数据,所述行为数据包括点击和/或购买的物品及每个物品的物品信息;/n输入一检索类目词;/n从所述行为数据中提取包含所述检索类目词的目标行为数据;/n逆向关联获取所述目标行为数据中每个物品的检索词及每个检索词的检索频次;/n对所述目标行为数据中物品信息进行分词,得到多个物品分词;/n计算所有检索词与所述多个物品分词的相似度;/n判断所述相似度是否大于第一预设阈值,若是,则提取所述所有检索词中检索频次大于预设频次的检索词作为所述检索类目词的扩展词;/n根据所述检索类目词和所述扩展词进行物品召回。/n

【技术特征摘要】
1.一种物品召回方法,其特征在于,所述物品召回方法包括:
获取用户的行为数据,所述行为数据包括点击和/或购买的物品及每个物品的物品信息;
输入一检索类目词;
从所述行为数据中提取包含所述检索类目词的目标行为数据;
逆向关联获取所述目标行为数据中每个物品的检索词及每个检索词的检索频次;
对所述目标行为数据中物品信息进行分词,得到多个物品分词;
计算所有检索词与所述多个物品分词的相似度;
判断所述相似度是否大于第一预设阈值,若是,则提取所述所有检索词中检索频次大于预设频次的检索词作为所述检索类目词的扩展词;
根据所述检索类目词和所述扩展词进行物品召回。


2.如权利要求1所述的物品召回方法,其特征在于,所述逆向关联获取所述目标行为数据中每个物品的检索词及每个检索词的检索频次的步骤具体包括:
根据所述行为数据生成关系列表,所述关系列表用于表征检索词与点击和/或购买的物品的对应关系;
基于所述关系列表获取所述目标行为数据中每个物品的检索词及每个检索词的检索频次。


3.如权利要求1所述的物品召回方法,其特征在于,所述计算所有检索词与所述多个物品分词的相似度的步骤具体包括:
对所有的检索词进行去重生成检索词集合;
对所述多个物品分词进行去重生成物品分词集合;
基于Jaccard算法计算所述检索词集合和所述物品分词集合的相似度。


4.如权利要求1所述的物品召回方法,其特征在于,所述根据所述检索类目词和所述扩展词进行物品召回物品的步骤之前,所述物品召回方法还包括:
构建语料库,所述语料库包括物品推荐文章和物品基本信息;
基于word2vec对所述语料库进行训练,得到一词向量库,所述词向量库存储有多个物品特征词及与每个物品特征词对应的特征向量;
基于相似度算法计算所述检索类目词与每个物品特征词的相似度;
提取与所述检索类目词的相似度大于第二预设阈值的物品特征词加入所述扩展词。


5.如权利要求4所述的物品召回方法,其特征在于,所述根据所述检索类目词和所述扩展词进行物品召回物品的步骤之前,所述物品召回方法还包括:
预设一物品类目列表,所述物品类目列表包括多个物品类目及每个物品类目下所有物品的属性;
判断所述扩展词是否包含在所述物品类目列表中,若是,则滤除包含在所述类目列表的扩展词;
所述根据所述检索类目词和所述扩展词进行物品召回的步骤具体包括:
根据滤除后的扩展词和所述检索类目词进行物品召回。


6.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5任一项所述的物品召回方法。


7.一种可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至5任一项所述的物品召回方...

【专利技术属性】
技术研发人员:胡忆桐高云王娜左丽丽张亚红
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1