System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 商品类目预测模型训练及应用方法、电子设备技术_技高网

商品类目预测模型训练及应用方法、电子设备技术

技术编号:39956397 阅读:8 留言:0更新日期:2024-01-08 23:42
本申请实施例提供一种商品类目预测模型训练及应用方法、电子设备,训练方法包括:根据商品数据集构建初始训练集与测试集;基于初始训练集对预先获取的基础模型进行至少一次迭代更新直至得到满足预设要求的商品类目预测模型,任一次更新包括:利用当前模型确定当前训练集中每个商品的文本描述与所有分类标签之间的相似度得分;基于相似度得分确定当前训练集对应的每个商品的预测分类标签;根据预测分类标签更新当前训练集得到更新的训练集;基于更新的训练集对基础模型进行优化更新得到更新的模型;当使用测试集确定更新的模型未满足所述预设要求时执行下一次更新。本申请能够有效提升利用模型根据商品文本进行商品类目预测的准确率与效率。

【技术实现步骤摘要】

本申请属于计算机,涉及自然语言处理领域,尤其涉及一种商品类目预测模型训练及应用方法、电子设备


技术介绍

1、用户在使用电商平台查找商品时,通常会输入文本信息作为商品检索的关键字词。因此,电商平台通常需要使用商品类目预测模型,从而根据用户输入的文本信息为用户展示所需类目的商品查询结果。在相关技术中,对商品类目预测模型的训练过程中,为了使模型的预测准确率达到要求,通常需要耗费大量时间与人力获取带有标签的文本数据作为训练数据,模型训练所需时间较长且模型的泛化能力不足。


技术实现思路

1、本申请实施例提供一种商品类目预测模型训练及应用方法、电子设备,能够解决现有的商品类目预测模型需要使用带有标签的文本数据作为训练数据以及训练所需时间较长且模型的泛化能力不足的问题,能够有效提升利用模型根据商品文本进行商品类目预测的准确率与效率。

2、本申请实施例第一方面提供一种商品类目预测模型训练方法,包括:根据商品数据集构建初始训练集与测试集;基于所述初始训练集对预先获取的基础模型进行至少一次迭代更新,直至得到满足预设要求的商品类目预测模型,其中所述至少一次迭代更新中的任一次更新包括:利用当前模型确定当前训练集中每个商品的文本描述与所有分类标签之间的相似度得分;基于所述相似度得分确定所述当前训练集对应的每个商品的预测分类标签;根据所述预测分类标签更新所述当前训练集,得到更新的训练集;基于所述更新的训练集对所述基础模型进行优化更新,得到更新的模型;当使用所述测试集确定所述更新的模型未满足所述预设要求时,执行下一次更新。

3、根据本申请实施例,所述方法还包括:利用所述商品数据集对预设模型进行微调,得到所述基础模型,所述基础模型用于预测商品的类目之间的相似度。

4、根据本申请实施例,所述商品数据集包括多个商品的商品数据,所述商品数据包括每个商品的文本描述、每个商品所属的类目;所述根据商品数据集构建初始训练集与测试集包括:将所述商品数据集中的商品划分为第一商品与第二商品;构建所述第一商品中的目标商品对应的类目对集合,利用所有目标商品的所述类目对集合构建所述初始训练集;利用所述第二商品的数据构建所述测试集。

5、根据本申请实施例,所述构建所述第一商品中的目标商品对应的类目对集合包括:确定所属的类目的数量大于预设数值的第一商品作为所述目标商品;根据每个目标商品所属的类目组成的集合将每两个类目组成类目对,将每个目标商品对应的所有类目对构成的集合作为所述类目对集合。

6、根据本申请实施例,所述方法还包括:使用所述基础模型对所述商品数据集中的数据进行编码,得到所述商品数据集中的数据的编码向量,所述编码向量包括:每个商品的文本描述的文本编码向量、每个商品所属的类目的类目编码向量。

7、根据本申请实施例,所述基于所述相似度得分确定所述当前训练集对应的每个商品的预测分类标签包括:确定具有最高的相似度得分的分类标签作为目标分类标签,当所述目标分类标签对应的相似度得分大于预设的得分阈值时,将所述目标分类标签作为所述预测分类标签。

8、根据本申请实施例,所述根据所述预测分类标签更新所述当前训练集包括:将所述当前训练集对应的每个商品的所属类目与对应的预测分类标签组成数据对,利用所述数据对更新所述当前训练集。

9、根据本申请实施例,所述基于所述更新的训练集对所述基础模型进行优化更新包括:利用所述基础模型确定所述更新的训练集中的每个数据对中的类目与分类标签的距离,当确定所述距离超出预设距离范围时,对所述基础模型进行优化更新。

10、本申请实施例第二方面提供一种商品类目预测模型的应用方法,所述方法包括:接收用户输入的对待预测商品的文本描述;将所述文本描述输入商品类目预测模型,利用所述商品类目预测模型对所述文本描述进行编码,所述商品类目预测模型为利用所述的品类目预测模型训练方法所获得;利用所述商品类目预测模型确定与编码后的文本描述的相似度得分最高的目标分类标签,将所述目标分类标签作为所述待预测商品所属的目标类目。

11、本申请实施例第三方面提供一种商品类目预测模型训练装置,所述商品类目预测模型训练装置包括:构建模块,用于根据商品数据集构建初始训练集与测试集;迭代更新模块,用于基于所述初始训练集对预先获取的基础模型进行至少一次迭代更新,直至得到满足预设要求的商品类目预测模型。

12、本申请实施例第四方面提供一种电子设备,包括:存储器,及处理器,所述处理器执行所述存储器中存储的计算机可读指令,实现所述的商品类目预测模型训练方法或商品类目预测模型的应用方法。

13、本申请实施例提供的商品类目预测模型训练方法,可以基于商品的文本描述与商品的类目之间的正相关关系,使用标签进行模型训练而不是对文本进行训练,能够降低训练数据的收集难度,并提高对模型进行训练的效率与模型的泛化能力。本申请实施例提供的商品类目预测模型的应用方法,可以能够应用于电商商品检索的排序部分,能够优先展示与用户查询内容相同类目的商品,可以有效提升利用模型根据商品文本进行商品类目预测的准确率与效率。

本文档来自技高网...

【技术保护点】

1.一种商品类目预测模型训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的商品类目预测模型训练方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的商品类目预测模型训练方法,其特征在于,所述商品数据集包括多个商品的商品数据,所述商品数据包括每个商品的文本描述、每个商品所属的类目;

4.根据权利要求3所述的商品类目预测模型训练方法,其特征在于,所述构建所述第一商品中的目标商品对应的类目对集合包括:

5.根据权利要求1所述的商品类目预测模型训练方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的商品类目预测模型训练方法,其特征在于,所述基于所述相似度得分确定所述当前训练集对应的每个商品的预测分类标签包括:

7.根据权利要求1所述的商品类目预测模型训练方法,其特征在于,所述根据所述预测分类标签更新所述当前训练集包括:

8.根据权利要求7所述的商品类目预测模型训练方法,其特征在于,所述基于所述更新的训练集对所述基础模型进行优化更新包括:

9.一种商品类目预测模型的应用方法,其特征在于,所述方法包括:

10.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现如权利要求1至8中任意一项所述的商品类目预测模型训练方法,或实现如权利要求9所述的商品类目预测模型的应用方法。

...

【技术特征摘要】

1.一种商品类目预测模型训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的商品类目预测模型训练方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的商品类目预测模型训练方法,其特征在于,所述商品数据集包括多个商品的商品数据,所述商品数据包括每个商品的文本描述、每个商品所属的类目;

4.根据权利要求3所述的商品类目预测模型训练方法,其特征在于,所述构建所述第一商品中的目标商品对应的类目对集合包括:

5.根据权利要求1所述的商品类目预测模型训练方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的商品类目预测模型训练方法,其特征在于,所述基于所述相...

【专利技术属性】
技术研发人员:王锋
申请(专利权)人:广州商研网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1