商品类目分类方法及其装置、设备、介质、产品制造方法及图纸

技术编号:31490153 阅读:25 留言:0更新日期:2021-12-18 12:26
本申请公开一种商品类目分类方法及其装置、设备、介质、产品,所述方法包括:获取商品对象相对应的标题文本;调用文本特征提取模型从所述标题文本中提取出文本特征信息;其中,所述文本特征提取模型的训练过程中,以同一训练样本对商品分类相对应的类目树的层次结构逐层训练,每一层训练时以当前层的实际损失值修正该文本特征提取模型的权重参数直至该文本特征提取模型被训练至收敛状态,所述实际损失值由当前层的损失函数值融合先训练层的实际损失值获得;基于所述文本特征信息进行分类,以分类结果标记所述商品对象的分类属性,所述分类结果包括所述类目树中具有层次隶属关系的各层次的类目标签。本申请的模型易于高效训练至收敛。练至收敛。练至收敛。

【技术实现步骤摘要】
商品类目分类方法及其装置、设备、介质、产品


[0001]本申请涉及电商信息
,尤其涉及一种商品类目分类方法及其相应的装置、计算机设备、计算机可读存储介质,以及计算机程序产品。

技术介绍

[0002]电商平台内涉及的商品繁多,商品数量往往达到千位级、万位级以上,通常需借助多级类目才能对其进行高效的组织。多级类目之间,子类目通常隶属于父类目,逐层展开,构成“类目树”。考虑类目树的层级越深,流失量越大,因此,类目树通常包括三级、四级,一般不超过五级。在数据层面,类目树以其多层次分类结构实现对电商平台中海量商品对象的组织,方便新增、查询、更新等维护。
[0003]商品的标题文本可以用做分类的依据,借助基于自然语言处理技术的深层语义模型,可以实现对标题文本的深层语义特征信息的提取,根据这一特征信息可以实现对相应的商品对象的分类。但是,随着类目树中层次的增加,叶子类目几何级增长,其中部分叶子类目所对应的商品对象较多,而部分叶子类目所对应的商品对象较少,也就是说,商品对象在叶子类目中的分布并不均匀。这就为基于深层语义的神经网络模型的训练带来了困难。众所周知,神经网络模型的训练需要依赖大量的标注训练样本进行训练,如果单纯针对从类目树顶层到达叶子类目的路径,利用商品对象的标题文本进行训练,由于部分叶子类目训练样本较少的原因,最终容易导致模型出现过拟合,预测结果不准确,模型也就不可用。
[0004]因此,针对这种情况,需要改进用于依据商品标题文本进行类目树分类的深层语义模型的训练过程,以确保由其训练而成的模型能够更准确预测分类结果,而服务于电商平台的商品对象智能分类服务。

技术实现思路

[0005]本申请的首要目的在于解决上述问题至少之一而提供一种商品类目分类方法及其相应的装置、计算机设备、计算机可读存储介质、计算机程序产品,以实现辅助音乐创作。
[0006]为满足本申请的各个目的,本申请采用如下技术方案:
[0007]适应本申请的目的之一而提供的一种商品类目分类方法,包括如下步骤:
[0008]获取商品对象相对应的标题文本;
[0009]调用文本特征提取模型从所述标题文本中提取出文本特征信息;其中,所述文本特征提取模型的训练过程中,以同一训练样本对商品分类相对应的类目树的层次结构逐层训练,每一层训练时以当前层的实际损失值修正该文本特征提取模型的权重参数直至该文本特征提取模型被训练至收敛状态,所述实际损失值由当前层的损失函数值融合先训练层的实际损失值获得;
[0010]基于所述文本特征信息进行分类,以分类结果标记所述商品对象的分类属性,所述分类结果包括所述类目树中具有层次隶属关系的各层次的类目标签。
[0011]深化的实施例中,所述文本特征提取模型的训练过程中,包括如下步骤:
[0012]创建多个训练任务以实施针对所述类目树中各个层的训练;
[0013]为各个训练任务输入同一训练样本以启动训练;
[0014]控制各个训练任务依照类目树的层次结构自顶层至底层传递各先训练层的实际损失值,以使相应层融合该实际损失值而实现对相应的训练任务中的文本特征模型进行权重参数修正。
[0015]深化的实施例中,所述文本特征提取模型的训练过程,包括针对类目树的分类结构中每一层训练的步骤:
[0016]从所述训练样本中提取出文本特征信息;
[0017]将所述文本特征信息输入分类模型进行分类,获得与当前层相对应的分类结果;
[0018]将当前层的损失函数值与所有先训练层各自的实际损失值进行加权求和获得当前层的实际损失值;
[0019]利用当前层的实际损失值反向传播修正文本特征提取模型的权重参数实现梯度更新。
[0020]深化的实施例中,调用文本特征提取模型从所述标题文本中提取出文本特征信息,包括如下步骤:
[0021]构造所述标题文本中各个分词相对应的嵌入向量;
[0022]为每个嵌入向量拼接表征其上下文语义的左侧向量和右侧向量,构造出中间特征向量;
[0023]对所述中间特征向量执行池化操作,获得表征该标题文本的语义的向量,作为所述的文本特征信息。
[0024]深化的实施例中,以分类结果标记所述商品对象的分类属性,包括如下步骤:
[0025]根据分类结果确定多个类目标签;
[0026]查询预设的词典获得与所述多个类目标签相对应的类目文本;
[0027]将所述类目文本赋值为所述商品对象的分类属性。
[0028]较佳的实施例中,所述文本特征提取模型的训练过程中,各层次的训练过程以多任务触发运行。
[0029]适应本申请的目的之一而提供的一种商品类目分类装置,包括:标题获取模块、特征提取模块,以及分类标记模块;其中,所述标题获取模块,用于获取商品对象相对应的标题文本;所述特征提取模块,用于调用文本特征提取模型从所述标题文本中提取出文本特征信息;其中,所述文本特征提取模型的训练过程中,以同一训练样本对商品分类相对应的类目树的层次结构逐层训练,每一层训练时以当前层的实际损失值修正该文本特征提取模型的权重参数直至该文本特征提取模型被训练至收敛状态,所述实际损失值由当前层的损失函数值融合先训练层的实际损失值获得;所述分类标记模块,用于基于所述文本特征信息进行分类,以分类结果标记所述商品对象的分类属性,所述分类结果包括所述类目树中具有层次隶属关系的各层次的类目标签。
[0030]深化的实施例中,所述文本特征提取模型的训练过程中,运行于如下结构:任务创建模块,用于创建多个训练任务以实施针对所述类目树中各个层的训练;训练启动模块,为各个训练任务输入同一训练样本以启动训练;传播控制模块,用于控制各个训练任务依照类目树的层次结构自顶层至底层传递各先训练层的实际损失值,以使相应层融合该实际损
失值而实现对相应的训练任务中的文本特征模型进行权重参数修正。
[0031]深化的实施例中,所述文本特征提取模型的训练过程,包括针对类目树的分类结构中每一层训练的运行结构:特征提取实例模块,用于从所述训练样本中提取出文本特征信息;分类实例模块,用于将所述文本特征信息输入分类模型进行分类,获得与当前层相对应的分类结果;损失叠加实例模块,用于将当前层的损失函数值与所有先训练层各自的实际损失值进行加权求和获得当前层的实际损失值;修正模块,用于利用当前层的实际损失值反向传播修正文本特征提取模型的权重参数实现梯度更新。
[0032]深化的实施例中,所述特征提取模块,调用文本特征提取模型从所述标题文本中提取出文本特征信息,包括:向量构造子模块,用于构造所述标题文本中各个分词相对应的嵌入向量;语义引用子模块,用于为每个嵌入向量拼接表征其上下文语义的左侧向量和右侧向量,构造出中间特征向量;池化抽象子模块,用于对所述中间特征向量执行池化操作,获得表征该标题文本的语义的向量,作为所述的文本特征信息。
[0033]深化的实施例中,所述分类标记模块包括:标签转换子模块,用于根据分类结果确本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种商品类目分类方法,其特征在于,包括如下步骤:获取商品对象相对应的标题文本;调用文本特征提取模型从所述标题文本中提取出文本特征信息;其中,所述文本特征提取模型的训练过程中,以同一训练样本对商品分类相对应的类目树的层次结构逐层训练,每一层训练时以当前层的实际损失值修正该文本特征提取模型的权重参数直至该文本特征提取模型被训练至收敛状态,所述实际损失值由当前层的损失函数值融合先训练层的实际损失值获得;基于所述文本特征信息进行分类,以分类结果标记所述商品对象的分类属性,所述分类结果包括所述类目树中具有层次隶属关系的各层次的类目标签。2.根据权利要求1所述的商品类目分类方法,其特征在于,所述文本特征提取模型的训练过程中,包括如下步骤:创建多个训练任务以实施针对所述类目树中各个层的训练;为各个训练任务输入同一训练样本以启动训练;控制各个训练任务依照类目树的层次结构自顶层至底层传递各先训练层的实际损失值,以使相应层融合该实际损失值而实现对相应的训练任务中的文本特征模型进行权重参数修正。3.根据权利要求1所述的商品类目分类方法,其特征在于,所述文本特征提取模型的训练过程,包括针对类目树的分类结构中每一层训练的步骤:从所述训练样本中提取出文本特征信息;将所述文本特征信息输入分类模型进行分类,获得与当前层相对应的分类结果;将当前层的损失函数值与所有先训练层各自的实际损失值进行加权求和获得当前层的实际损失值;利用当前层的实际损失值反向传播修正文本特征提取模型的权重参数实现梯度更新。4.根据权利要求1所述的商品类目分类方法,其特征在于,调用文本特征提取模型从所述标题文本中提取出文本特征信息,包括如下步骤:构造所述标题文本中各个分词相对应的嵌入向量;为每个嵌入向量拼接表征其上下文语义的左侧向量和右侧向量,构造出中间特征向量;对所述中间特征向量...

【专利技术属性】
技术研发人员:叶朝鹏
申请(专利权)人:广州华多网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1