一种商品分类方法、装置、电子设备及存储介质制造方法及图纸

技术编号:24687757 阅读:25 留言:0更新日期:2020-06-27 09:10
本申请实施例提供的一种商品分类方法、装置、电子设备及存储介质,获取商品交易数据,根据商品交易数据生成表示商品之间关联关系的商品关联图,根据商品关联图得到各商品的词向量,可以量化商品之间的关系,采用预设的聚类算法,对商品的词向量进行聚类,得到各个商品对应的类别。采用本方案可以利用客户在电商平台产生的交易数据,自动完成对商品的分类,无需人为参与,与现有的专家分类相比,节约了人力。

A commodity classification method, device, electronic equipment and storage medium

【技术实现步骤摘要】
一种商品分类方法、装置、电子设备及存储介质
本申请涉及数据处理领域,尤其涉及一种商品分类方法、装置、电子设备及存储介质。
技术介绍
近年来,随着电子商务和移动互联网的高速发展,越来越多的交易在线上完成,网上商城的商品种类也越来越多,为了方便消费者购买,网上商城都会对商品进行分类,现在主要是通过用途、类型等维度进行专家分类,比如手机和配件可以分成一类,然后可以细分成手机壳和手机。商品分类涉及到对各类产品的认知,而且经常变动,所以非常复杂,基于专家经验进行的商品分类因为无法考虑太多因素,所以会有一些不足:因为分类是专家定的,所以如果新的商品上线了,那么就需要人工进行分类,因为现在商品的迭代是比较快的,这就导致需要经常进行分类的补充,并且要通知到相关的团队。而且如果出现人员变动,则整个分类逻辑都可能变动。
技术实现思路
为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种商品分类方法、装置、电子设备及存储介质。第一方面,本申请提供了一种商品分类方法,包括:获取预设时间段内的商品交易数本文档来自技高网...

【技术保护点】
1.一种商品分类方法,其特征在于,包括:/n获取预设时间段内的商品交易数据;/n根据所述交易数据生成以商品为节点,以商品之间的关联关系为边的商品关联图;/n根据所述商品关联图生成各商品的词向量;/n采用预设的聚类算法,对商品的词向量进行聚类,得到各个商品对应的类别。/n

【技术特征摘要】
1.一种商品分类方法,其特征在于,包括:
获取预设时间段内的商品交易数据;
根据所述交易数据生成以商品为节点,以商品之间的关联关系为边的商品关联图;
根据所述商品关联图生成各商品的词向量;
采用预设的聚类算法,对商品的词向量进行聚类,得到各个商品对应的类别。


2.根据权利要求1所述的方法,其特征在于,所述交易数据包括商品信息、商品购买时间和客户信息;
根据所述交易数据生成以商品为节点,以商品之间的关联关系为边的商品关联图,包括:
根据所述交易数据生成多个商品购买序列,一个商品购买序列包含一个客户在一个预设的购买周期内购买的所有商品的信息;
分别对各个商品购买序列中的商品购买时间进行聚类,得到聚类结果;
根据所述聚类结果生成以商品为节点,以商品之间的关联关系为边的商品关联图。


3.根据权利要求2所述的方法,其特征在于,根据所述聚类结果生成以商品为节点,以商品之间的关联关系为边的商品关联图,包括:
根据所述聚类结果将商品购买时间属于同一个类的商品按照购买时间的先后顺序采用有向连接线进行有向连接,所述有向连接线表示商品之间的关联关系;
生成以商品为节点、以商品之间的有向连接线为边、以任意两件商品之间的同一种有向连接线出现的次数为与所述有向连接线对应的边的权重的有向带权图;
将所述有向带权图作为商品关联图。


4.根据权利要求2所述的方法,其特征在于,对商品购买序列中的商品购买时间进行聚类,得到聚类结果,包括:
确定购买时段个数的多个候选值;
分别根据各个候选值,对商品购买序列中的商品购买时间采用重心法进行聚类;
根据聚类结果按照预设的第一公式计算各个候选值对应的sim值;
确定对应的sim值最大的候选值作为购买时段个数的预设值;
将根据所述预设值对商品购买序列中的商品购买时间采用重心法进行聚类得到的聚类结果,作为最终的聚类结果。


5.根据权利要求4所述的方法,其特征在于,
所述第一公式如下所示;



其中,m表示购买时段个数的候选值,μi表示聚类结果中商品购买时间属于第i类的商品的相似度,Ni表示聚类结果中商品购买时间属于第i类的商品的数量,di表示聚类结果中商品购买时间属于第i类的商品间的购买时间距离。


6.根据权利要求1所述的方法,其特征在于,根据所述商品关联图生成各商品的词向量,包括:
对所述商品关联图执行随机游走,得到随机游走序列;
选取任意一条随机游走序列中的任一商品作为第一商品;
根据所述交易数据,选取购买过所述第一商品的任一客户作为第一客户;
获取所述第一客户的画像特征;
抽取所述交易数据中除了所述第一商品外的多个商品分别作为第二商品;
根据所述第一商品、第一客户的画像特征和第二商品训练所述第一商品的词向量。


7.根据权利要求6所述方法,其特征在于,对所述商品关联图执行随机游走,得到随机游走序列,包括:
分别采用深度优先搜索算法和广度优先搜索算法对所述商品关联图执行随机游走,得到随机游走序列。


8.根据权利要求6所述方法,其特征在于,根据所述第一商品、第一客户的画像特征和第二商品训练所述第一商品的词向量,包括:
确定下式中L(u...

【专利技术属性】
技术研发人员:黄志翔张一凡彭南博程建波
申请(专利权)人:京东数字科技控股有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1