【技术实现步骤摘要】
用于输出信息的方法和装置
本申请实施例涉及计算机
,具体涉及互联网
,尤其涉及用于输出信息的方法和装置。
技术介绍
随着互联网技术的高速发展,通过网络展示的物品的品类、数量变得非常庞大,物品SKU(StockKeepingUnit,库存量单位)数量已经达到千万级。如此庞大的SKU量级的物品运营,仅凭借组建大量的人工运营团队也很难做到很好的运营选品。并且人工运营成本将随着物品SKU数量的增加变得越来越高。面对大量的物品,其同质化非常严重,同一品牌的某款物品,在颜色、尺寸、款式套装等方面都有很多选择,称这些物品同属一款物品SPU(StandardProductUnit,标准产品单位),对服饰鞋业方面的物品尤其明显,往往同一款物品SPU中的物品SKU多达上百种,甚至上千种,然而对终端用户而言,这些物品无论是在价格上、还是物品的其他属性上都是同一款物品,如果将这些物品都展示给用户,将无法保障用户的购物体验。因此物品的去重过滤将是一个重要的过程。
技术实现思路
本申请实施例的目的在于提出一种用于输出信息的方法和装置。第一方面,本申请实施例提供了一种用于输出信息的方法,该方法包括:接收待筛选的物品的属性信息,其中,属性信息包括类别;确定与类别匹配的至少一个候选物品;获取至少一个候选物品中每个候选物品的属性信息,并组成候选属性信息集合;确定候选属性信息集合中每个候选属性信息与物品的属性信息之间的相似度,得到相似度集合;若相似度集合中的每个相似度小于预定相似度阈值,则将物品的属性信息添加到候选属性信息集合中,并输出添加后的候选属性信息集合。在一些实施例中,确定候选 ...
【技术保护点】
1.一种用于输出信息的方法,所述方法包括:接收待筛选的物品的属性信息,其中,所述属性信息包括类别;确定与所述类别匹配的至少一个候选物品;获取所述至少一个候选物品中每个候选物品的属性信息,并组成候选属性信息集合;确定所述候选属性信息集合中每个候选属性信息与所述物品的属性信息之间的相似度,得到相似度集合;若所述相似度集合中的每个相似度小于预定相似度阈值,则将所述物品的属性信息添加到所述候选属性信息集合中,并输出添加后的候选属性信息集合。
【技术特征摘要】
1.一种用于输出信息的方法,所述方法包括:接收待筛选的物品的属性信息,其中,所述属性信息包括类别;确定与所述类别匹配的至少一个候选物品;获取所述至少一个候选物品中每个候选物品的属性信息,并组成候选属性信息集合;确定所述候选属性信息集合中每个候选属性信息与所述物品的属性信息之间的相似度,得到相似度集合;若所述相似度集合中的每个相似度小于预定相似度阈值,则将所述物品的属性信息添加到所述候选属性信息集合中,并输出添加后的候选属性信息集合。2.根据权利要求1所述的方法,其中,所述确定所述候选属性信息集合中每个候选属性信息与所述物品的属性信息之间的相似度,包括:基于最小编辑距离确定所述候选属性信息集合中每个候选属性信息与所述物品的属性信息之间的相似度。3.根据权利要求1所述的方法,其中,所述确定所述候选属性信息集合中每个候选属性信息与所述物品的属性信息之间的相似度,包括:将所述物品的属性信息和所述候选属性信息集合中每个候选属性信息分别转换成标量;基于欧式距离确定转换成标量后的所述物品的属性信息与转换成标量后的所述候选属性信息集合中每个候选属性信息之间的相似度。4.根据权利要求1所述的方法,其中,所述确定所述候选属性信息集合中每个候选属性信息与所述物品的属性信息之间的相似度,包括:将所述物品的属性信息和所述候选属性信息集合中每个候选属性信息分别进行编码;将编码后的所述物品的属性信息的长度和编码后的所述候选属性信息集合中每个候选属性信息的长度进行对齐;基于汉明距离确定对齐后的所述物品的属性信息与对齐后的所述候选属性信息集合中每个候选属性信息之间的相似度。5.根据权利要求1所述的方法,其中,所述将所述物品的属性信息添加到所述候选属性信息集合中,包括:确定所述候选属性信息集合对应的候选物品的数量是否超过预定数量阈值;若未超过,则将所述物品的属性信息添加到所述候选属性信息集合中;若超过,则确定所述相似度集合中最高的相似度对应的候选属性信息,并用所述物品的属性信息替换确定出的候选属性信息。6.根据权利要求1所述的方法,其中,所述属性信息包括有效时间和/或价格;以及所述接收待筛选的物品的属性信息,包括:根据所述有效时间检测所述属性信息是否过期,若过期,则过滤掉所述属性信息;和/或根据所述价格检测所述属性信息的价格变化量是否超过预定变化量阈值,若超过,则过滤掉所述属性信息。7.根据权利要求1所述的方法,其中,所述属性信息包括有效时间和/或价格;以及所述方法还包括:根据所述有效时间检测出所述候选属性信息集合中过期的候选属性信息,从所述候选属性信息集合中删除所述过期的候选属性信息;和/或根据所述价格检测出所述候选属性信息集合中价格变化量超过预定变化量阈值的候选属性信息,并从所述候选属性信息集合中删除所述价格变化量超过预定变化量阈值的候选属性信息。8.一种用于输出信息的装置,所述装置包括:接收单元,用于接收待筛选的物品的属性信息,其中,所述...
【专利技术属性】
技术研发人员:李中林,
申请(专利权)人:北京京东尚科信息技术有限公司,北京京东世纪贸易有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。