商品对象自动分类方法及其装置、设备、介质、产品制造方法及图纸

技术编号:31377185 阅读:15 留言:0更新日期:2021-12-15 11:15
本申请涉及电商信息技术领域,公开一种商品对象自动分类方法及其装置、设备、介质、产品,所述方法包括:获取商品对象,提取其相对应的摘要文本及商品图片;分别对所述摘要文本及所述商品图片进行特征提取,相应获得文本特征向量及图片特征向量,将文本特征向量与图片特征向量拼接为综合特征向量;基于所述综合特征向量进行多层次分类处理,获得所述商品对象相对应的标签集,所述标签集包括多层次分类结构中多个构成层次隶属关系的分类标签;为所述商品对象标记所述标签集中的各个分类标签。本申请能够实现对电商平台的商品对象的准确高效分类,有利于提升电商平台中海量数据的存储和访问效率,具有广阔的应用场景。具有广阔的应用场景。具有广阔的应用场景。

【技术实现步骤摘要】
商品对象自动分类方法及其装置、设备、介质、产品


[0001]本申请涉及电商信息
,尤其涉及一种商品对象自动分类方法及其相应的装置、计算机设备、计算机可读存储介质,以及计算机程序产品。

技术介绍

[0002]电商平台内涉及的商品繁多,商品数量往往达到千位级、万位级以上,通常需借助多级类目才能对其进行高效的组织。多级类目之间,子类目通常隶属于父类目,逐层展开,构成“类目树”。考虑类目树的层级越深,流失量越大,因此,类目树通常包括三级、四级,一般不超过五级。在数据层面,类目树以其多层次分类结构实现对电商平台中海量商品对象的组织,方便新增、查询、更新等维护。
[0003]对于电商平台的商户而言,尤其是对于基于独立站的跨境电商平台的商户而言,每家商户实际经营的商品是有限的,通常隶属于少量类别,这种情况下,如果需要商户自行标注其上传的商品对象的类别信息,便会对商户所掌握的关于电商平台的类目树的先验知识提出较高要求,或者由于文字多义性的缘故,常会导致商户标注出错,为此,对于电商平台而言,最好能智能化地为用户上线的商品对象提供商品分类相关的推荐信息,以提升商品对象的自动分类效率。
[0004]现有技术中,多通过相关神经网络模型对商品对象相关的图片信息进行深层语义学习,然后依据从图片信息中提取的特征信息来确定商品对象相应的分类标签,以所述分类标签对商品对象进行分类标注。现有技术通常只在图片的基础上针对少量甚至单个分类级别进行分类,实现逻辑简单,但在应对电商平台这种具有海量的商品对象的应用场景而言,显得捉襟见肘,而且往往也难以实现商品对象的准确分类。

技术实现思路

[0005]本申请的首要目的在于解决上述问题至少之一而提供一种商品对象自动分类方法及其相应的装置、计算机设备、计算机可读存储介质、计算机程序产品。
[0006]为满足本申请的各个目的,本申请采用如下技术方案:
[0007]适应本申请的目的之一而提供的一种商品对象自动分类方法,包括如下步骤:
[0008]获取商品对象,提取其相对应的摘要文本及商品图片;
[0009]分别对所述摘要文本及所述商品图片进行特征提取,相应获得文本特征向量及图片特征向量,将文本特征向量与图片特征向量拼接为综合特征向量;
[0010]基于所述综合特征向量进行多层次分类处理,获得所述商品对象相对应的标签集,所述标签集包括多层次分类结构中多个构成层次隶属关系的分类标签;
[0011]为所述商品对象标记所述标签集中的各个分类标签。
[0012]深化的实施例中,获取商户实例的商品对象,提取该其相对应的摘要文本及商品图片,包括如下步骤:
[0013]向商户实例的管理用户推送商品对象创建页面;
[0014]接收用户在该创建页面提交的关于商品对象的摘要文本及商品图片,所述摘要文本包括该商品对象的标题信息及属性信息。
[0015]深化的实施例中,分别对所述摘要文本及所述商品图片进行特征提取,相应获得文本特征向量及图片特征向量,将文本特征向量与图片特征向量拼接为综合特征向量,包括如下步骤:
[0016]分别对所述摘要文本、商品图片进行格式预处理;
[0017]调用预设的文本特征提取模型,对预处理后的摘要文本进行特征提取,获得经其编码的文本特征向量;
[0018]调用预设的图片特征提取模型,对预处理后的商品图片进行特征提取,获得经其编码的图片特征向量;
[0019]将图片特征向量归一化为维度与所述文本特征向量相同的单个高维行向量后,与该文本特征向量进行拼接获得综合特征向量。
[0020]深化的实施例中,基于所述综合特征向量进行多层次分类处理,获得所述商品对象相对应的标签集,所述标签集包括多层次分类结构中多个构成层次隶属关系的分类标签,包括如下步骤:
[0021]由多层次标签分类模型基于所述综合特征向量提取各个层次相对应的分类特征信息,将最后一个层次对应的分类特征信息进行全连接获得全局特征信息,其中每个层次的分类特征信息均基于前一层次的分类特征信息与所述综合特征向量的拼接特征信息生成;
[0022]由多层次标签分类模型分别提取出各个所述的分类特征信息,将所有分类特征信息拼接为局部特征信息;
[0023]由多层次标签分类模型将所述全局特征信息与所述局部特征信息进行融合,获得综合分类信息,所述综合分类信息包括映射到所述多层次分类结构的每个节点的评分信息;
[0024]根据所述综合分类信息中的评分信息确定出构成其标签集的多个分类标签,多个分类标签之间构成所述多层次分类结构中的层次隶属关系。
[0025]深化的实施例中,为所述商品对象标记所述标签集中的各个分类标签,包括如下步骤:
[0026]将所述标签集中的各个分类标签添加为所述商品对象的分类属性;
[0027]将所述商品对象的分类属性、摘要文本以及商品对象以映射关系数据存储于商品数据库中;
[0028]响应该商品对象存储于商品数据库的存储事件,更新各个分类标签相对应的索引数据。
[0029]扩展的实施例中,本方法还包括如下步骤:
[0030]响应包含所述标签集中的任意一个分类标签的商品类别检索请求,根据该检索请求中的分类标签,获取标记有该分类标签的商品对象的摘要文本与商品图片;
[0031]构造包含所述摘要文本及商品图片的商品详情页面,推送该商品详情页面以应答该请求。
[0032]适应本申请的目的之一而提供的一种商品对象自动分类装置,包括:信息获取模
块、特征编码模块、分类处理模块,以及分类标记模块,其中,所述信息获取模块,用于获取商品对象,提取其相对应的摘要文本及商品图片;所述特征编码模块,用于分别对所述摘要文本及所述商品图片进行特征提取,相应获得文本特征向量及图片特征向量,将文本特征向量与图片特征向量拼接为综合特征向量;所述分类处理模块,用于基于所述综合特征向量进行多层次分类处理,获得所述商品对象相对应的标签集,所述标签集包括多个具有级别隶属关系的分类标签;所述分类标记模块,用于为所述商品对象标记所述标签集中的各个分类标签。
[0033]深化的实施例中,所述信息获取模块包括:页面推送子模块,用于向商户实例的管理用户推送商品对象创建页面;信息接收子模块,用于接收用户在该创建页面提交的关于商品对象的摘要文本及商品图片,所述摘要文本包括该商品对象的标题信息及属性信息。
[0034]深化的实施例中,所述特征编码模块包括:格式处理子模块,用于分别对所述摘要文本、商品图片进行格式预处理;文本提取子模块,用于调用预设的文本特征提取模型,对预处理后的摘要文本进行特征提取,获得经其编码的文本特征向量;图片提取子模块,用于调用预设的图片特征提取模型,对预处理后的商品图片进行特征提取,获得经其编码的图片特征向量;特征拼接子模块,用于将图片特征向量归一化为维度与所述文本特征向量相同的单个高维行向量后,与该文本特征向量进行拼接获得综合特征向量。
[003本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种商品对象自动分类方法,其特征在于,包括如下步骤:获取商品对象,提取其相对应的摘要文本及商品图片;分别对所述摘要文本及所述商品图片进行特征提取,相应获得文本特征向量及图片特征向量,将文本特征向量与图片特征向量拼接为综合特征向量;基于所述综合特征向量进行多层次分类处理,获得所述商品对象相对应的标签集,所述标签集包括多层次分类结构中多个构成层次隶属关系的分类标签;为所述商品对象标记所述标签集中的各个分类标签。2.根据权利要求1所述的商品对象自动分类方法,其特征在于,获取商户实例的商品对象,提取该其相对应的摘要文本及商品图片,包括如下步骤:向商户实例的管理用户推送商品对象创建页面;接收用户在该创建页面提交的关于商品对象的摘要文本及商品图片,所述摘要文本包括该商品对象的标题信息及属性信息。3.根据权利要求1所述的商品对象自动分类方法,其特征在于,分别对所述摘要文本及所述商品图片进行特征提取,相应获得文本特征向量及图片特征向量,将文本特征向量与图片特征向量拼接为综合特征向量,包括如下步骤:分别对所述摘要文本、商品图片进行格式预处理;调用预设的文本特征提取模型,对预处理后的摘要文本进行特征提取,获得经其编码的文本特征向量;调用预设的图片特征提取模型,对预处理后的商品图片进行特征提取,获得经其编码的图片特征向量;将图片特征向量归一化为维度与所述文本特征向量相同的单个高维行向量后,与该文本特征向量进行拼接获得综合特征向量。4.根据权利要求1所述的商品对象自动分类方法,其特征在于,基于所述综合特征向量进行多层次分类处理,获得所述商品对象相对应的标签集,所述标签集包括多层次分类结构中多个构成层次隶属关系的分类标签,包括如下步骤:由多层次标签分类模型基于所述综合特征向量提取各个层次相对应的分类特征信息,将最后一个层次对应的分类特征信息进行全连接获得全局特征信息,其中每个层次的分类特征信息均基于前一层次的分类特征信息与所述综合特征向量的拼接特征信息生成;由多层次标签分类模型分别提取出各个所述的分类特征信息,将所有分类特征信息拼接为局部特征信息;由多层次标签分类模型将所述全局特征信息与所述局部特征信息进行融合,...

【专利技术属性】
技术研发人员:王锋郭东波徐进添叶朝鹏石志伟
申请(专利权)人:广州华多网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1