类目信息生成方法、装置、电子设备和计算机可读介质制造方法及图纸

技术编号:29400998 阅读:21 留言:0更新日期:2021-07-23 22:38
本申请实施例公开了类目信息生成方法、装置、电子设备和计算机可读介质。该方法的实施例包括:获取目标物品信息,目标物品信息所指示的物品不属于已有的类目信息所指示的类目;对所获取的目标物品信息进行聚类,得到多个类簇;分别从各类簇的目标物品信息中提取特征信息,并基于所提取的特征信息,生成各类簇的目标物品信息的类目信息。该实施方式降低了人力成本且提高了类目信息的准确性。

【技术实现步骤摘要】
类目信息生成方法、装置、电子设备和计算机可读介质
本申请实施例涉及计算机
,具体涉及类目信息生成方法、装置、电子设备和计算机可读介质。
技术介绍
随着互联网技术的发展,各类服务平台需要维护的数据越来越多。例如,一些物品信息管理平台通常存储有大量的物品信息,以供用户查询。为方便数据管理和查询,这些平台通常需要对其所维护的各物品信息对应的类目进行设定。现有技术中,物品信息对应的类目信息通常由运营人员根据经验人工选择,如将物品“XX果汁”的类目信息选为“酒饮/营养冲调-饮料-果蔬汁软料”等。然而,针对一些新品,往往不存在合适的类目信息供选择,此时需要人工创建新的类目信息,不仅人力成本较高,且类目信息的准确性也无法得到保证。
技术实现思路
本申请实施例提出了类目信息生成方法、装置、电子设备和计算机可读介质,以解决现有技术中人力成本较高且类目信息准确性较低技术问题。第一方面,本申请实施例提供了一种类目信息生成方法,该方法包括:获取目标物品信息,所述目标物品信息所指示的物品不属于已有的类目信息所指示的类目;对所获取本文档来自技高网...

【技术保护点】
1.一种类目信息生成方法,其特征在于,所述方法包括:/n获取目标物品信息,所述目标物品信息所指示的物品不属于已有的类目信息所指示的类目;/n对所获取的目标物品信息进行聚类,得到多个类簇;/n分别从各类簇的目标物品信息中提取特征信息,并基于所提取的特征信息,生成所述各类簇的目标物品信息的类目信息。/n

【技术特征摘要】
1.一种类目信息生成方法,其特征在于,所述方法包括:
获取目标物品信息,所述目标物品信息所指示的物品不属于已有的类目信息所指示的类目;
对所获取的目标物品信息进行聚类,得到多个类簇;
分别从各类簇的目标物品信息中提取特征信息,并基于所提取的特征信息,生成所述各类簇的目标物品信息的类目信息。


2.根据权利要求1所述的方法,其特征在于,所述获取目标物品信息,包括:
获取类目信息集合和已关联有类目信息的已分类物品信息集合;
基于所述类目信息集合和所述已分类物品信息集合,从全量物品信息集合中筛选目标物品信息。


3.根据权利要求2所述的方法,其特征在于,所述基于所述类目信息集合和所述已分类物品信息集合,从全量物品信息集合中筛选目标物品信息,包括:
确定所述全量物品信息集合中的各物品信息与所述类目信息集合中的各类目信息的第一相似度以及与所述已分类物品信息集合中的各已分类物品信息的第二相似度;
从所述已分类物品信息集合中,分别选取与所述全量物品信息集合中的各物品信息具有相同产品编码的参考物品信息,并确定所述参考物品信息所关联的类目信息的离散程度值;
基于所述第一相似度、所述第二相似度以及所述离散程度值,确定所述全量物品信息集合中的各物品信息的分值;
从所述全量物品信息集合中选取分值小于预设阈值的物品信息,作为目标物品信息。


4.根据权利要求3所述的方法,其特征在于,所述确定所述全量物品信息集合中的各物品信息与所述类目信息集合中的各类目信息的第一相似度以及与所述已分类物品信息集合中的各已分类物品信息的第二相似度,包括:
对所述全量物品信息集合中的各物品信息进行分词;
基于分词后所得到的各词语所属字段的预设权重以及所述各词语的分布信息,确定所述各词语的权重;
对于所述全量物品信息集合中的每一个物品信息,基于该物品信息中的各词语的权重,确定该物品信息与所述类目信息集合中的各类目信息的第一相似度以及与...

【专利技术属性】
技术研发人员:石志新徐晟翔刘子厚宋一格饶亚民何旭杜李超罗德涛彭雪黄硕
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1