用于生成信息的方法和装置制造方法及图纸

技术编号:24208576 阅读:29 留言:0更新日期:2020-05-20 15:47
本申请实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:获取至少两个待分类产品的产品标识,得到产品标识集合;针对产品标识集合中的产品标识,确定该产品标识指示的待分类产品与产品标识集合中除该产品标识之外的其他产品标识指示的待分类产品之间的产品相似度,其中,产品相似度用于表征产品的属性信息之间的相似程度;基于所确定的产品相似度,对产品标识集合中的产品标识指示的待分类产品进行分类,生成分类结果。该实施方式提高了产品分类的灵活性。

Methods and devices for generating information

【技术实现步骤摘要】
用于生成信息的方法和装置
本申请实施例涉及计算机
,具体涉及用于生成信息的方法和装置。
技术介绍
现有产品分类体系较为固定(例如,现有技术通常参考我国颁布的国家标准GB7635-87《全国工农业产品(商品、物资)分类与代码》对产品进行分类),仅在一定程度上能够帮助用户对产品进行浏览和挑选。然而,当前产品分类的最细粒度依然较粗,通常包含成百上千种产品。
技术实现思路
本申请实施例提出了用于生成信息的方法和装置。第一方面,本申请实施例提供了一种用于生成信息的方法,该方法包括:获取至少两个待分类产品的产品标识,得到产品标识集合;针对产品标识集合中的产品标识,确定该产品标识指示的待分类产品与产品标识集合中除该产品标识之外的其他产品标识指示的待分类产品之间的产品相似度,其中,产品相似度用于表征产品的属性信息之间的相似程度;基于所确定的产品相似度,对产品标识集合中的产品标识指示的待分类产品进行分类,生成分类结果。在一些实施例中,基于所确定的产品相似度,对产品标识集合中的产品标识指示的待分类产品进行分类,包括本文档来自技高网...

【技术保护点】
1.一种用于生成信息的方法,包括:/n获取至少两个待分类产品的产品标识,得到产品标识集合;/n针对所述产品标识集合中的产品标识,确定该产品标识指示的待分类产品与所述产品标识集合中除该产品标识之外的其他产品标识指示的待分类产品之间的产品相似度,其中,产品相似度用于表征产品的属性信息之间的相似程度;/n基于所确定的产品相似度,对所述产品标识集合中的产品标识指示的待分类产品进行分类,生成分类结果。/n

【技术特征摘要】
1.一种用于生成信息的方法,包括:
获取至少两个待分类产品的产品标识,得到产品标识集合;
针对所述产品标识集合中的产品标识,确定该产品标识指示的待分类产品与所述产品标识集合中除该产品标识之外的其他产品标识指示的待分类产品之间的产品相似度,其中,产品相似度用于表征产品的属性信息之间的相似程度;
基于所确定的产品相似度,对所述产品标识集合中的产品标识指示的待分类产品进行分类,生成分类结果。


2.根据权利要求1所述的方法,其中,所述基于所确定的产品相似度,对所述产品标识集合中的产品标识指示的待分类产品进行分类,包括:
采用基于密度的聚类方法,基于所确定的产品相似度,对所述产品标识集合中的产品标识指示的待分类产品进行分类。


3.根据权利要求1或2所述的方法,其中,产品相似度是通过产品之间的属性相似度和关系相似度确定的,属性相似度表征属性信息的文字之间的相似程度,关系相似度表征属性信息的关系之间的相似程度。


4.根据权利要求3所述的方法,其中,属性相似度是基于产品的属性信息的文字之间的编辑距离得到的。


5.根据权利要求3所述的方法,其中,属性信息包括至少一个属性;以及
所述方法还包括:
将所述产品标识集合中的产品标识指示的待分类产品的属性信息通过树结构表征,其中,树的节点表征属性,节点与节点之间的边表征属性之间的隶属关系;
对于第一待分类产品的属性信息包括的属性,将该属性和第二待分类产品的属性信息包括的、与该属性对应的属性进行组合,得到属性对,其中,所述第一待分类产品为所述产品标识集合中的产品标识指示的待分类产品,所述第二待分类产品为所述产品标识集合中除所述第一待分类产品的产品标识之外的其他产品标识指示的待分类产品,所述第二待分类产品的属性信息包括的、与该属性对应的属性是所述第二待分类产品的属性信息包括的属性中与该属性的编辑距离最小的属性;
对于所述第二待分类产品的属性信息包括的属性,将该属性和所述第一待分类产品的属性信息包括的、与该属性对应的属性进行组合,得到属性对,其中,所述第一待分类产品的属性信息包括的、与该属性对应的属性是所述第一待分类产品的属性信息包括的属性中与该属性的编辑距离最小的属性。


6.根据权利要求5所述的方法,其中,所述第一待分类产品与所述第二待分类产品之间的属性相似度是通过如下步骤得到的:
确定所得到的属性对包括的属性间的编辑距离的和;
确定所述第一待分类产品的属性信息中包括的属性的数量与所述第二待分类产品的属性信息中包括的属性的数量的积;
将所述和与所述积的商确定为所述第一待分类产品与所述第二待分类产品之间的属性相似度。


7.根据权利要求5所述的方法,其中,所述第一待分类产品与所述第二待分类产品之间的关系相似度是通过所述第一待分类产品的树结构的边的数量与所述第二待分类产品的树结构的边的数量确定的。


8.根据权利要求7所述的方法,其中,所述第一待分类产品与所述第二待分类产品之间的关系相似度是通过如下步骤得到的:
确定所述第一待分类产品的树结构的边的数量和所述第二待分类产品的树结构的边的数量之和;
对于所述第一待分类产品的树结构中包括的边,分别确定该边连接的节点表征的属性所属的属性对中包括的、属于所述第二待分类产品的属性信息中的属性,响应于确定所确定的属性之间存在隶属关系,将该边确定为目标边;
对于所述第二待分类产品的树结构中包括的边,分别确定该边连接的节点表征的属性所属的属性对中包括的、属于所述第一待分类产品的属性信息中的属性,响应于确定所确定的属性之间存在隶属关系,将该边确定为目标边;
确定所确定的目标边的数量;
将所述目标边的数量与所述和的商确定为所述第一待分类产品与所述第二待分类产品之间的关系相似度。


9.一种用于生成信息的装置,包括:
获取单元,被配置成获取至少两个待分类产品的产品标识,得到产品标识集合;
确定单元,被配置成针对所述产品标识集合中的产品标识,确定该产品标识指示的待分类产品与所述产品标识集合...

【专利技术属性】
技术研发人员:蒋士淼
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1