一种电商商品的品目预测机器人及其实现方法技术

技术编号：37704941 阅读：12 留言：0更新日期：2023-06-01 23:53

本发明专利技术提供一种电商商品的品目预测机器人及其实现方法，先通过海量无标注语料对下载的所述bert预训练语言模型bert

全部详细技术资料下载

【技术实现步骤摘要】
一种电商商品的品目预测机器人及其实现方法

[0001]本专利技术涉及计算机
，特别涉及一种电商商品的品目预测机器人及其实现方法。

技术介绍

[0002]在大数据时代，随着大数据、人工智能、区块链等技术的广泛应用，技术的发展推动了采购业务数字化升级的进程。电子商务的蓬勃发展已经成为推动我国商业经济发展的重要增长点，电商企业也在充分运用大数据的技术优势来完善商品管理模式，并取得了显著成效。目前，电商企业面临的市场竞争有增无减，尤其是面对新时代下采购平台的海量商品数据，企业只有不断提高商品、人力等方面的成本控制管理水平，不断提高商品标准化治理水平，才能有效地降低供应链成本、提高自身的竞争优势。
[0003]由于商品种类五花八门，商品分类问题往往涉及庞大的数据量。与此同时，新产品层出不穷，商品分类需要紧跟商品更新迭代的速度。采用传统的人工标注的方式进行商品分类和审核已经无法满足大数据时代下商品分类的需求，这种方式不仅工作量大，费时费力，而且判断标准较为主观，误判率较高。因此，对商品进行自动化分类已成为当前的主要发展趋势。

技术实现思路

[0004]本专利技术要解决的技术问题，在于提供一种电商商品的品目预测机器人的实现方法，依托大数据、人工智能等技术实现电商商品的品目预测机器人，解决传统人工为主方式商品数据治理分类低效问题。
[0005]第一方面，本专利技术提供了一种电商商品的品目预测机器人，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述计算机程序的实现方法包括：环...

【技术保护点】

【技术特征摘要】
1.一种电商商品的品目预测机器人，其特征在于：所述计算机程序的实现方法包括：环境搭建过程，下载bert预训练语言模型bert
‑
base
‑
chinese；通过海量无标注语料对下载的所述bert预训练语言模型bert
‑
base
‑
chinese进行预训练，得到预训练后bert模型；该海量无标注语料未作商品标题的标注；模型微调过程，基于品目库标准构建品目标签集文件class.txt，供预训练后bert模型读取；将品目清单进行one
‑
hot编码形成标签矩阵；选取run_classifier.py文件作为下游分类任务的分类器；在所述run_classifier.py文件中关联数据集文件、品目标签集文件class.txt和初始模型参数列表，从而能加载标注数据集C和所述标签矩阵作为分类器的输入，加载初始模型参数列表并配置初始学习率参数值后运行分类器，通过分类器对输入的各个商品标题信息进行所属品目的推理，列出推理结果；重新配置学习率参数值和模型参数列表，继续运行分类器，并进行推理，如此反复，得到多个推理能力不同的bert模型；选择分类器推理能力最高的bert模型作为最佳模型，并保存最佳模型的模型参数列表；模型评估过程，运行所述最佳模型，加载所述最佳模型的模型参数列表；输入测试数据集核验输出结果的置信度，核验模型对商品归类的准确率，若准确率低于阈值，则重新配置学习率取值和模型参数列表后再进行模型微调，直到准确率不低于阈值时结束，此时得到的bert模型即为所述电商商品的品目预测机器人；其中，所述下游分类任务是用于将商品标题信息文本分为若干商品类目；所述标注数据集C标注了商品标题和品目标签；所述模型参数列表包括商品属性、名称和品牌的相关参数；所述测试数据集为一定数量的商品标题信息的数据集。2.根据权利要求1所述的一种电商商品的品目预测机器人，其特征在于：所述学习率参数值配置为2
×
10
‑
5 ~ 5
×
10
‑5之间；且所述对输入的各个商品标题信息进行所属品目的推理是：先将输入某个商品标题信息中的汉字预处理转为整数编码，每个汉字对应一个整数后再进行推理。3.根据权利要求1或2所述的一种电商商品的品目预测机器人，其特征在于：所述模型微调过程采用的算法具体是：采用如下目标函数训练LM语言模型：P(w
i | w1, ..., w
i
‑1, w
i+1
, ..., w
n
)所述品目标签集文件train.csv从所述标注数据集C中读取商品标题X作为输入，将商品标题X从汉字级别进行拆分，得到n个汉字，把每个汉字进行特征转换为整数编码，得到n个整数编码W1,
ꢀ…
, Wn，输出为品目清单的一个分类的one
‑
hot标签y；把所述整数编码W1,
ꢀ…
, Wn输入至Transformer模型，得到最上层最后一个时刻的输出集hn l，将hn l通过softmax层进行分类，所述softmax层的参数为Wy，Wy为某个one
‑
hot标签y的标签编码，最后用CrossEntropyLoss计算损失，调整Transformer模型的学习率以及参数Wy，等价于最大似然估计：
L1还是之前语言模型的损失，使用的数据为当前任务的标注数据集C，而且只使用其中的商品标题X，而不需要one
‑
hot标签y；L2是微调过程中的损失，使用的数据为当前任务的标注数据集C，同时使用其中的商品标题X和one
‑
hot标签y;L3是最大似然值，即为置信度。4.根据权利要求1所述的一种电商商品的品目预测机器人，其特征在于：所述推理结果的输出是一个数组，数组的每个元素的值表示一个商品品目的置信度，每个元素的值为0.00
‑
1.00之间，数值越小，表示是相应商品品目的概率越低，数值...

【专利技术属性】
技术研发人员：郑新刚，邱华淞，严友金，陈诚，林铖伟，王赛，雷晶强，
申请(专利权)人：数采小博科技发展有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人