【技术实现步骤摘要】
基于客群偏差平滑优化的用户分类方法、装置及电子设备
[0001]本公开涉及设备数据处理领域,具体而言,涉及一种基于客群偏差平滑优化的用户分类方法、装置、电子设备及计算机可读介质。
技术介绍
[0002]随着互联网的快速发展,互联网服务平台中有大量的用户设备数据。该互联网服务平台可以通过分类的方式来管理大量的用户设备数据。例如,先对大量的用户设备数据进行分群,得到多个不同的客群。然后基于不同客群中的用户设备数据训练模型,得到多个客群模型。当获取到新的用户设备数据时,可以通过多个客群模型分别预测该用户设备数据,并根据预测结果确定该用户所属的客群。
[0003]但是,专利技术人在实现本专利技术的专利技术构思时发现,相关技术至少存在一下技术问题:通过上述方式预测用户所属客群获取的结果准备度较低,从而导致部分用户被划分到与真实情况不符的客群,降低用户体验。
[0004]在所述
技术介绍
部分公开的上述信息仅用于加强对本公开的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
r/>[0005]有本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于客群偏差平滑优化的用户分类方法,其特征在于,所述分类方法包括:获取属于不同客群的样本用户的样本设备数据分别进行训练得到的客群模型;将各个样本设备数据分别输入各个所述客群模型,分别得到相应的预测安全评分;根据各个客群中的样本用户的样本设备数据,确定各个客群的真实安全评分;根据每个所述样本用户在不同所述客群模型下的预测安全评分和对应的所述客群的真实安全评分,得到每个所述样本用户在不同所述客群下的分类权重;根据各个所述样本用户在不同客群下的分类权重和各个所述样本用户所属的客群,训练得到用户分类模型;根据所述用户分类模型和各个所述客群模型,对待识别用户进行分类,确定所述待识别用户所属客群。2.根据权利要求1所述的用户分类方法,其特征在于,所述根据每个所述样本用户在不同所述客群模型下的预测安全评分和对应的所述客群的真实安全评分,得到每个所述样本用户在不同所述客群下的分类权重,包括:针对每个样本用户,分别确定所述样本用户在不同所述客群模型下的预测安全评分和对应的所述客群的真实安全评分之间的相对偏差值,作为所述样本用户在不同所述客群下的分类权重;分别得到每个所述样本用户在不同所述客群下的分类权重。3.根据权利要求2所述的用户分类方法,其特征在于,所述分别确定所述样本用户在不同所述客群模型下的预测安全评分和对应的所述客群的真实安全评分之间的相对偏差值,包括:针对每个所述客群,计算所述样本用户在所述客群对应的客群模型下的预测安全评分和所述客群的真实安全评分的欧式距离,作为所述相对偏差值;分别得到所述样本用户在不同所述客群下的相对偏差值。4.根据权利要求2所述的用户分类方法,其特征在于,所述根据各个客群中的样本用户的样本设备数据,确定各个客群的真实安全评分,包括:针对每个所述客群,根据所述客群中的所述样本用户的样本设备数据,确定所述客群中所述样本用户的总数和为不安全用户的所述样本用户的数量,将所述为不安全用户的所述样本用户的数量和所述样本用户的总数的比值,作为所述客群的真实安全评分;分别得到各个所述客群的真实安全评分。5.根据权利要求1所述的用户分类方法,其特征在于,所述根据各个所述样本用户在不同客群下的分类权重和各个所述样本用户所属的客群,训练得到用户分类模型,包括:构建初始用户分类模型;对应每个样本用户分别构建以所述客群的数量为维度的分类向量;所述分类向量中的元素与所述客群一一对应;根据所述样本用户所属的客群,将所述分类向量中对应的元素的值设置为预设极小值,其他所述元素的值设置为预设极大值;将所述样本用户在不同客群下的分类权重作为所述用户分类模型的输入,将所述样本用户对应的分类向量作为输出,训...
【专利技术属性】
技术研发人员:宋孟楠,付棋红,苏绥绥,
申请(专利权)人:上海淇玥信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。