【技术实现步骤摘要】
一种物品关键属性生成方法、物品分类方法和装置
本专利技术涉及计算机领域,尤其涉及一种物品关键属性生成方法、物品分类方法和装置。
技术介绍
为了方便用户对电商网站内的物品进行浏览和筛选,各电商公司需要参考1987年国家颁布的国家标准GB7635-87《全国工农业产品(商品、物资)分类与代码》对物品进行分类。但是,当前最细粒度的品类中,依然包含成千上百种物品。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:(1)现有技术中物品分类的粒度较粗,最细粒度的品类中包含成千上百种物品,在实际管理运营过程中,需要人工进行大量的细分操作,效率低;(2)人工细分的主观性较强,细分标准难以统一,导致细分得到的归属于同一分类的物品之间关联性差,客户体验差。
技术实现思路
有鉴于此,本专利技术实施例提供一种物品关键属性生成方法、物品分类方法和装置,通过关键属性的属性值在搜索日志中的出现次数确定该关键属性的权重,后续使用权重调整聚类算法的相似度度量公式,以对待分类物品的属性向量进行聚类,实 ...
【技术保护点】
1.一种物品关键属性生成方法,其特征在于,包括:/n获取物品不同级别的属性,根据搜索日志中包含所述属性的频次,得到所述属性的初始权重;/n根据所述属性的父属性的初始权重和子属性的初始权重,更新所述属性的初始权重,得到对应的最终权重;其中,所述属性的父属性、子属性基于属性之间的归属关系得到;/n按照所述最终权重的大小,选择最终权重大的前N个属性作为关键属性。/n
【技术特征摘要】
1.一种物品关键属性生成方法,其特征在于,包括:
获取物品不同级别的属性,根据搜索日志中包含所述属性的频次,得到所述属性的初始权重;
根据所述属性的父属性的初始权重和子属性的初始权重,更新所述属性的初始权重,得到对应的最终权重;其中,所述属性的父属性、子属性基于属性之间的归属关系得到;
按照所述最终权重的大小,选择最终权重大的前N个属性作为关键属性。
2.根据权利要求1所述的方法,其特征在于,根据所述属性的父属性的初始权重和子属性的初始权重,更新所述属性的初始权重,得到对应的最终权重,包括:
将所述属性的父属性的初始权重与归属于所述父属性的属性数量相除,得到相除结果;
将所述属性的初始权重、所述相除结果以及所述属性的子属性的初始权重之和相加,得到所述属性的最终权重。
3.根据权利要求1所述的方法,其特征在于,获取物品不同级别的属性的步骤之后,所述方法还包括:
根据属性之间的归属关系,为归属于同一品类的多个所述物品构建属性结构树;其中,所述属性结构树包括多个节点,一个所述节点对应一个所述属性;
结合所述属性结构树,确定所述属性的父属性和子属性;其中,所述父属性为所述属性对应节点的父节点的属性,所述子属性为所述属性对应节点的子节点的属性。
4.根据权利要求1至3的任一项所述的方法,其特征在于,所述方法用于信息搜索、信息查询和信息分类。
5.一种物品分类方法,其特征在于,包括:
将多个待分类物品的关键属性的属性值分别进行标准化处理,拼接标准化处理结果得到所述多个待分类物品的属性向量;其中,所述多个待分类物品归属于同一品类,所述关键属性按照权利要求1-3中任一项所述的方法生成;
为所述多个待分类物品构建与所述属性向量的长度相同的权重向量,其中,所述权重向量的分量为所述属性向量的分量对应的关键属性的权重,所述权重为按照权利要求1-3中任一项所述的方法得到的最终权重或者所述最终权重的归一化处理结果;
将所述属性向量输入聚类算法,通过所述聚类算法计算所述待分类物品的属性向量与聚类中心的相似度,以按照所述相似度高低,对所述多个待分类物品的属性向量进行聚类得到聚类结果;其中,所述相似度是利用所述权重向量调整所述待分类物品的属性向量到所述聚类中心的距离得到。
6.根据权利要求5所述的方法,其特征在于,利用所述权重向量调整所述待分类物品的属性向量到所述聚类中心的距离,以得到所述待分类物品的属性向量与所述聚类中心的相似度,包括:
...
【专利技术属性】
技术研发人员:蒋士淼,
申请(专利权)人:北京京邦达贸易有限公司,北京京东乾石科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。