一种分类方法、装置、设备及存储介质制造方法及图纸

技术编号:34789664 阅读:42 留言:0更新日期:2022-09-03 19:52
本发明专利技术公开了一种分类方法、装置、设备及存储介质,该方法包括:获取待分类用户的特征标签对应的用户特征数据;将所述用户特征数据分别输入到多个分类模型中的每个分类模型中,得到每个所述分类模型计算的概率;计算多个所述概率的平均值;根据所述平均值确定所述待分类用户的所属类别;其中,每个所述分类模型是基于训练样本中部分特征标签对应的用户特征数据进行训练得到的。本发明专利技术实施例提供的分类方法能够提高将用户分类的准确性。方法能够提高将用户分类的准确性。方法能够提高将用户分类的准确性。

【技术实现步骤摘要】
一种分类方法、装置、设备及存储介质


[0001]本专利技术属于数据处理
,尤其涉及一种分类方法、装置、设备及存储介质。

技术介绍

[0002]在一些场景中,商家为用户推荐商品或服务前,需要先将用户分类,根据用户所述类别确定对商品或服务是否有需求的用户。
[0003]现有的方法中,将待分类用户的数据作为样本训练分类器,使用训练后的分类器确定待分类用户的类别。
[0004]采用现有的对用户分类的方法进行用户分类时,准确性较低。

技术实现思路

[0005]本专利技术实施例提供一种分类方法、装置、设备及存储介质,能够基于训练样本中部分特征标签对应的用户特征数据进行训练得到的分类模型,根据分类模型计算待分类用户的概率,从而准确确定待分类用户的所属类别,实现提高将用户分类的准确性。
[0006]第一方面,本专利技术实施例提供一种分类方法,该方法包括:获取待分类用户的特征标签对应的用户特征数据;将用户特征数据分别输入到多个分类模型中的每个分类模型中,得到每个分类模型计算的概率;计算多个概率的平均值;根据平均值确定本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种分类方法,其特征在于,所述方法包括:获取待分类用户的特征标签对应的用户特征数据;将所述用户特征数据分别输入到多个分类模型中的每个分类模型中,得到每个所述分类模型计算的概率;计算多个所述概率的平均值;根据所述平均值确定所述待分类用户的所属类别;其中,每个所述分类模型是基于训练样本中部分特征标签对应的用户特征数据进行训练得到的;训练每个所述分类模型时采用的所述部分特征标签不完全相同;每个所述分类模型的训练过程包括:获取M个第一样本和N个第二样本,所述第一样本包括已分类用户的类别标签和所述特征标签对应的用户特征数据,所述第二样本包括未分类用户的所述特征标签对应的用户特征数据;将所述M个第一样本的用户特征数据和所述N个第二样本的用户特征数据拼接,得到P个训练样本集;针对多个待训练分类模型中的每个待训练分类模型,分别执行以下步骤:根据所述待训练分类模型对应的训练样本集,采用部分特征标签训练所述待训练分类模型,得到所述分类模型;其中,M为大于0的正整数,N为大于M的正整数,P为大于0的正整数。2.根据权利要求1所述的方法,其特征在于,所述待训练分类模型包括待训练决策树分类模型;所述分类模型包括决策树分类模型。3.根据权利要求1或2所述的方法,其特征在于,在所述获取M个第一样本和N个第二样本之前,所述方法还包括:获取多个第一初始样本和多个第二初始样本,所述第一初始样本包括所述已分类用户的所述类别标签和用户特征数据,所述第二初始样本包括所述未分类用户的用户特征数据;将多个所述第一初始样本和多个所述第二初始样本中的用户特征数据归类,得到多个所述特征标签;将所述第一初始样本中所述已分类用户的所述类别标签和所述特征标签对应的用户特征数据作为所述第一样本;将所述第二初始样本中所述未分类用户的所述特征标签对应的用户特征数据作为所述第二样本;其中,每个特征标签对应一种用户特征数据。4.根据权利要求1所述的方法,其特征在于,所述根据平均值确定...

【专利技术属性】
技术研发人员:武晋琦
申请(专利权)人:上海钐昆网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1