一种电商商品的品目预测机器人及其实现方法技术

技术编号:37704941 阅读:12 留言:0更新日期:2023-06-01 23:53
本发明专利技术提供一种电商商品的品目预测机器人及其实现方法,先通过海量无标注语料对下载的所述bert预训练语言模型bert

【技术实现步骤摘要】
一种电商商品的品目预测机器人及其实现方法


[0001]本专利技术涉及计算机
,特别涉及一种电商商品的品目预测机器人及其实现方法。

技术介绍

[0002]在大数据时代,随着大数据、人工智能、区块链等技术的广泛应用,技术的发展推动了采购业务数字化升级的进程。电子商务的蓬勃发展已经成为推动我国商业经济发展的重要增长点,电商企业也在充分运用大数据的技术优势来完善商品管理模式,并取得了显著成效。目前,电商企业面临的市场竞争有增无减,尤其是面对新时代下采购平台的海量商品数据,企业只有不断提高商品、人力等方面的成本控制管理水平,不断提高商品标准化治理水平,才能有效地降低供应链成本、提高自身的竞争优势。
[0003]由于商品种类五花八门,商品分类问题往往涉及庞大的数据量。与此同时,新产品层出不穷,商品分类需要紧跟商品更新迭代的速度。采用传统的人工标注的方式进行商品分类和审核已经无法满足大数据时代下商品分类的需求,这种方式不仅工作量大,费时费力,而且判断标准较为主观,误判率较高。因此,对商品进行自动化分类已成为当前的主要发展趋势。

技术实现思路

[0004]本专利技术要解决的技术问题,在于提供一种电商商品的品目预测机器人的实现方法,依托大数据、人工智能等技术实现电商商品的品目预测机器人,解决传统人工为主方式商品数据治理分类低效问题。
[0005]第一方面,本专利技术提供了一种电商商品的品目预测机器人,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序的实现方法包括:环境搭建过程,下载bert预训练语言模型bert

base

chinese;通过海量无标注语料对下载的所述bert预训练语言模型bert

base

chinese进行预训练,得到预训练后bert模型;该海量无标注语料未作商品标题的标注;模型微调过程,基于品目库标准构建品目标签集文件class.txt,供预训练后bert模型读取;将品目清单进行one

hot编码形成标签矩阵;选取run_classifier.py文件作为下游分类任务的分类器;在所述run_classifier.py文件中关联数据集文件、品目标签集文件class.txt和初始模型参数列表,从而能加载标注数据集C和所述标签矩阵作为分类器的输入,加载初始模型参数列表并配置初始学习率参数值后运行分类器,通过分类器对输入的各个商品标题信息进行所属品目的推理,列出推理结果;重新配置学习率参数值和模型参数列表,继续运行分类器,并进行推理,如此反复,得到多个推理能力不同的bert模型;选择分类器推理能力最高的bert模型作为最佳模型,并保存最佳模型的模型参数列表;模型评估过程,运行所述最佳模型,加载所述最佳模型的模型参数列表;输入测试数据集核验输出结果的置信度,核验模型对商品归类的准确率,若准确率低于阈值,则重新
配置学习率取值和模型参数列表后再进行模型微调,直到准确率不低于阈值时结束,此时得到的bert模型即为所述电商商品的品目预测机器人;其中,所述下游分类任务是用于将商品标题信息文本分为若干商品类目;所述标注数据集C标注了商品标题和品目标签;所述模型参数列表包括商品属性、名称和品牌的相关参数;所述测试数据集为一定数量的商品标题信息的数据集。
[0006]第二方面,本专利技术提供了一种电商商品的品目预测机器人的实现方法,包括:环境搭建过程,下载bert预训练语言模型bert

base

chinese;通过海量无标注语料对下载的所述bert预训练语言模型bert

base

chinese进行预训练,得到预训练后bert模型;该海量无标注语料未作商品标题的标注;模型微调过程,基于品目库标准构建品目标签集文件class.txt,供预训练后bert模型读取;将品目清单进行one

hot编码形成标签矩阵;选取run_classifier.py文件作为下游分类任务的分类器;在所述run_classifier.py文件中关联数据集文件、品目标签集文件class.txt和初始模型参数列表,从而能加载标注数据集C和所述标签矩阵作为分类器的输入,加载初始模型参数列表并配置初始学习率参数值后运行分类器,通过分类器对输入的各个商品标题信息进行所属品目的推理,列出推理结果;重新配置学习率参数值和模型参数列表,继续运行分类器,并进行推理,如此反复,得到多个推理能力不同的bert模型;选择分类器推理能力最高的bert模型作为最佳模型,并保存最佳模型的模型参数列表;模型评估过程,运行所述最佳模型,加载所述最佳模型的模型参数列表;输入测试数据集核验输出结果的置信度,核验模型对商品归类的准确率,若准确率低于阈值,则重新配置学习率取值和模型参数列表后再进行模型微调,直到准确率不低于阈值时结束,此时得到的bert模型即为所述电商商品的品目预测机器人;其中,所述下游分类任务是用于将商品标题信息文本分为若干商品类目;所述标注数据集C标注了商品标题和品目标签;所述模型参数列表包括商品属性、名称和品牌的相关参数;所述测试数据集为一定数量的商品标题信息的数据集。
[0007]本专利技术实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:本专利技术根据品目库标准,依托大数据,通过人工智能算法模型实现商品品目预测,能快速、精准、智能地从大规模商品数据中识别商品类目,无需人工识别归类同款商品,以算力解放人力,助力企业采购数字化、自动化、智能化转型升级,为供应链端商品治理归类降本增效。
[0008]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。
附图说明
[0009]下面参照附图结合实施例对本专利技术作进一步的说明。
[0010]图1为本专利技术下游分类任务的源码结构的示意图;图2为本专利技术实施例一中电商商品的品目预测机器人的实现方法流程图;图3为本专利技术实施例中学习率参数值对模型精度的影响曲线示意图。
具体实施方式
[0011]本申请实施例通过提供一种电商商品的品目预测机器人及其实现方法,依托大数据、人工智能等技术实现电商商品的品目预测机器人,解决传统人工为主方式商品数据治理分类低效问题。
[0012]本申请实施例中的技术方案,总体思路如下:通过下载bert预训练语言模型bert

base

chinese,先通过海量无标注语料对下载的所述bert预训练语言模型bert

base

chinese进行预训练,得到预训练后bert模型;再经过模型微调过程对预训练后bert模型进行微调,从而得到最佳模型,并保存最佳模型的模型参数列表。最后通过运行所述最佳模型,加载所述最佳模型的模型本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电商商品的品目预测机器人,其特征在于:所述计算机程序的实现方法包括:环境搭建过程,下载bert预训练语言模型bert

base

chinese;通过海量无标注语料对下载的所述bert预训练语言模型bert

base

chinese进行预训练,得到预训练后bert模型;该海量无标注语料未作商品标题的标注;模型微调过程,基于品目库标准构建品目标签集文件class.txt,供预训练后bert模型读取;将品目清单进行one

hot编码形成标签矩阵;选取run_classifier.py文件作为下游分类任务的分类器;在所述run_classifier.py文件中关联数据集文件、品目标签集文件class.txt和初始模型参数列表,从而能加载标注数据集C和所述标签矩阵作为分类器的输入,加载初始模型参数列表并配置初始学习率参数值后运行分类器,通过分类器对输入的各个商品标题信息进行所属品目的推理,列出推理结果;重新配置学习率参数值和模型参数列表,继续运行分类器,并进行推理,如此反复,得到多个推理能力不同的bert模型;选择分类器推理能力最高的bert模型作为最佳模型,并保存最佳模型的模型参数列表;模型评估过程,运行所述最佳模型,加载所述最佳模型的模型参数列表;输入测试数据集核验输出结果的置信度,核验模型对商品归类的准确率,若准确率低于阈值,则重新配置学习率取值和模型参数列表后再进行模型微调,直到准确率不低于阈值时结束,此时得到的bert模型即为所述电商商品的品目预测机器人;其中,所述下游分类任务是用于将商品标题信息文本分为若干商品类目;所述标注数据集C标注了商品标题和品目标签;所述模型参数列表包括商品属性、名称和品牌的相关参数;所述测试数据集为一定数量的商品标题信息的数据集。2.根据权利要求1所述的一种电商商品的品目预测机器人,其特征在于:所述学习率参数值配置为2
×
10

5 ~ 5
×
10
‑5之间;且所述对输入的各个商品标题信息进行所属品目的推理是:先将输入某个商品标题信息中的汉字预处理转为整数编码,每个汉字对应一个整数后再进行推理。3.根据权利要求1或2所述的一种电商商品的品目预测机器人,其特征在于:所述模型微调过程采用的算法具体是:采用如下目标函数训练LM语言模型:P(w
i | w1, ..., w
i
‑1, w
i+1
, ..., w
n
)所述品目标签集文件train.csv从所述标注数据集C中读取商品标题X作为输入,将商品标题X从汉字级别进行拆分,得到n个汉字,把每个汉字进行特征转换为整数编码,得到n个整数编码W1,
ꢀ…
, Wn,输出为品目清单的一个分类的one

hot标签y;把所述整数编码W1,
ꢀ…
, Wn输入至Transformer模型,得到最上层最后一个时刻的输出集hn l,将hn l通过softmax层进行分类,所述softmax层的参数为Wy,Wy为某个one

hot标签y的标签编码,最后用CrossEntropyLoss计算损失,调整Transformer模型的学习率以及参数Wy,等价于最大似然估计:
L1还是之前语言模型的损失,使用的数据为当前任务的标注数据集C,而且只使用其中的商品标题X,而不需要one

hot标签y;L2是微调过程中的损失,使用的数据为当前任务的标注数据集C,同时使用其中的商品标题X和one

hot标签y;L3是最大似然值,即为置信度。4.根据权利要求1所述的一种电商商品的品目预测机器人,其特征在于:所述推理结果的输出是一个数组,数组的每个元素的值表示一个商品品目的置信度,每个元素的值为0.00

1.00之间,数值越小,表示是相应商品品目的概率越低,数值...

【专利技术属性】
技术研发人员:郑新刚邱华淞严友金陈诚林铖伟王赛雷晶强
申请(专利权)人:数采小博科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1