【技术实现步骤摘要】
多个分类器协同的商品智能分类方法、系统、设备及介质
[0001]本专利技术涉及商品分类
,具体地,涉及一种多个分类器协同的商品智能分类方法、系统、设备及介质。
技术介绍
[0002]企业电子商务平台是建立在Internet网上进行商务活动的虚拟网络空间和保障商务顺利运营的管理环境;是协调、整合信息流、货物流、资金流有序、关联、高效流动的重要场所。企业、商家可充分利用电子商务平台提供的网络基础设施、支付平台、安全平台、管理平台等共享资源有效地、低成本地开展自己的商业活动。
[0003]现有技术中存在以下缺点:电商平台上的商品存在覆盖范围广泛,分类体系较复杂,易出现卖家对商品类别的填写不规范或漏填等情况;不同卖家上传的商品信息存在差异化,信息不完整的情况,一般分类方法表现较差。
技术实现思路
[0004]针对现有技术中的缺陷,本专利技术提供一种多个分类器协同的商品智能分类方法、系统、设备及介质。
[0005]根据本专利技术提供的一种多个分类器协同的商品智能分类方法、系统、设备及介质,所述方案如下:
[0006]第一方面,提供了一种多个分类器协同的商品智能分类方法,所述方法包括:
[0007]步骤S1:获取数据量分布均匀的训练集;
[0008]步骤S2:对所述训练集中每个商品的描述信息做切词、去停用词,得到分词结果;
[0009]步骤S3:分词后,对每个分词进行特征编码,并计算分词的TF
‑
IDF值,将各分词TF
‑
I ...
【技术保护点】
【技术特征摘要】
1.一种多个分类器协同的商品智能分类方法,其特征在于,包括:步骤S1:获取数据量分布均匀的训练集;步骤S2:对所述训练集中每个商品的描述信息做切词、去停用词,得到分词结果;步骤S3:分词后,对每个分词进行特征编码,并计算分词的TF
‑
IDF值,将各分词TF
‑
IDF值作为该词汇的编码权重值;步骤S4:每个分词的特征编码与权重值相乘的积作为该分词所属在所属品类下的加权特征,商品中的所有分词加权特的和作为商品的特征编码;步骤S5:将所有商品的特征编码划分为用于训练分类器的训练集和测试集,分别训练多个分类器;步骤S6:计算各分类器的权重值,将各分类器结果加权求和;步骤S7:将得分最高的类别作为分类结果。2.根据权利要求1所述的多个分类器协同的商品智能分类方法,其特征在于,所述步骤S3中TF
‑
IDF的计算包括:TF和IDF;其中,TF表示某个词汇在某篇文档出现的频率;IDF表示一个词汇普遍重要性的度量,即若包含某个词汇的文档越少,IDF越大,则说明该词汇具有很好的类别区分能力;若某个词汇在一篇文档中出现的频率TF高,且在其他文档中很少出现,则认为此词汇具有很好的类别区分能力,适合用来分类。3.根据权利要求2所述的多个分类器协同的商品智能分类方法,其特征在于,第i个词汇t
i
关于第j个文档d
j
的TF
‑
IDF计算如下:其中,n
ij
表示第i个词汇t
i
出现在第j个文档d
j
的次数;S为文档总数;k表示第j个文档中的词汇数量;I表示包含t
i
的多有文档的集合。4.根据权利要求1所述的多个分类器协同的商品智能分类方法,其特征在于,所述步骤S6采用AIC信息准则:AIC
K
=
‑
2logl
k
+2λ
k
其中,l
k
和λ
k
分别是第k个分类器的极大似然函数和分类器参数量;每个分类器的权重为:设上述k种算法得到的每个样本i分类到类别j的概率分别为由此可得,分类器加权后,第i个样本分到类别j的概为:第i个样本选择作为分类结果。5.一种多个分类器协同的商品智能分类系统,其特征在于,包括:模块M1:获取数据量分布均匀的训练集;模块M2:对所述训练集中每个商品的描述信息做切词、去停用词,得到分词结果;
模块...
【专利技术属性】
技术研发人员:王静,李燕北,朱俊,夏竟翔,戴智鑫,闫晨光,沈达峰,
申请(专利权)人:欧冶工业品股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。