预测模型训练方法及装置、用户类别预测方法及装置制造方法及图纸

技术编号:32796517 阅读:16 留言:0更新日期:2022-03-23 19:59
本公开关于一种预测模型训练方法及装置、用户类别预测方法及装置。所述预测模型训练方法包括:获取原始用户集合,其中,所述原始用户集合中的用户是在第一历史时间处于第一类别的用户;将所述原始用户集合划分为第一用户集合和剩余用户;将第一用户集合中的用户的评价指标作为训练数据对初始预测模型进行训练,得到第一模型;使用第一模型对剩余用户进行预测,基于预测结果从剩余用户中获取第二用户集合;将第二用户集合中的用户的评价指标作为训练数据对第一模型进行训练,得到第二模型;将第一模型和第二模型的组合作为初始预测模型训练后的预测模型。根据本公开的预测模型训练方法及装置,可提高训练出的预测模型进行用户类别预测的准确性。类别预测的准确性。类别预测的准确性。

【技术实现步骤摘要】
预测模型训练方法及装置、用户类别预测方法及装置


[0001]本公开涉及数据分析
更具体地,本公开涉及一种预测模型训练方法及装置、一种用户类别预测方法及装置。

技术介绍

[0002]在相关技术中,在主播运营策略时,通常是对已知某一方面或者某几个方面表现符合预设条件(例如,打赏收入高、直播观看用户多等)的主播提供一些扶持和运营策略帮助主播在平台更好的成长,一方面这种刻画多为人工根据几个指标进行规则判断,没有一个综合的衡量指标;另一方面对于一些未来有潜力成为符合预设条件的主播没有很好的识别方法,这部分主播如果提前识别并给予相应的产品和运营策略,不仅有利于主播的成长,同时可以促进平台的健康发展,实现主播和平台的双赢。

技术实现思路

[0003]本公开的示例性实施例在于提供一种预测模型训练方法及装置、用户类别预测方法及装置,以至少解决相关技术中的问题,也可不解决任何上述问题。
[0004]根据本公开的示例性实施例,提供一种预测模型训练方法,包括:获取原始用户集合,其中,所述原始用户集合中的用户是在第一历史时间处于第一类别的用户;将所述原始用户集合划分为第一用户集合和剩余用户;将第一用户集合中的用户的评价指标作为训练数据对初始预测模型进行训练,得到第一模型;使用第一模型对剩余用户进行预测,基于预测结果从剩余用户中获取第二用户集合;将第二用户集合中的用户的评价指标作为训练数据对第一模型进行训练,得到第二模型;将第一模型和第二模型的组合作为初始预测模型训练后的预测模型。
[0005]可选地,在获取原始用户集合之前,所述预测模型训练方法还可包括:确定预设多个用户在历史时间的类别,其中,获取原始用户集合,可包括:从所述预设多个用户中选择在第一历史时间处于第一类别的预设数量个用户组成所述原始用户集合。
[0006]可选地,计算预设多个用户在历史时间的类别,可包括:基于所述预设多个用户中的每个用户在所述历史时间的多个评价指标确定所述多个评价指标中的每个评价指标的重要性;针对所述预设多个用户中的每个用户,基于所述每个评价指标的重要性对所述每个用户的所述多个评价指标进行综合处理,得到所述每个用户的评价结果;针对所述预设多个用户中的每个用户,基于所述每个用户的评价结果来确定所述每个用户在所述历史时间的类别。
[0007]可选地,基于所述预设多个用户中的每个用户在所述历史时间的多个评价指标确定所述多个评价指标中的每个评价指标的重要性,可包括:基于所述预设多个用户的多个评价指标确定所述多个评价指标中的每个评价指标的权重。
[0008]可选地,基于所述每个评价指标的重要性对所述每个用户的所述多个评价指标进行综合处理,可包括:基于所述多个评价指标中的每个评价指标的权重,对所述每个用户的
所述多个评价指标进行加权求和。
[0009]可选地,基于所述预设多个用户的所述多个评价指标确定所述多个评价指标中的每个评价指标的权重,可包括:基于所述预设多个用户的所述多个评价指标确定所述多个评价指标中的每个评价指标的变异系数;基于所述多个评价指标中的每个评价指标的变异系数,确定所述多个评价指标中的每个评价指标的权重。
[0010]可选地,基于所述预设多个用户的所述多个评价指标确定所述多个评价指标中的每个评价指标的变异系数,可包括:针对所述多个评价指标中的每个评价指标,确定所述预设多个用户的所述评价指标的均值和标准差,基于所述均值和所述标准差确定所述评价指标的变异系数。
[0011]可选地,基于所述均值和所述标准差确定所述评价指标的变异系数,可包括:确定所述标准差与所述均值的比值,将所述比值确定为所述评价指标的变异系数。
[0012]可选地,基于所述多个评价指标中的每个评价指标的变异系数,确定所述多个评价指标中的每个评价指标的权重,可包括:对所述多个评价指标的变异系数进行归一化,得到所述多个评价指标中的每个评价指标的权重。
[0013]可选地,基于所述每个用户的评价结果来确定所述每个用户的类别,可包括:当所述每个用户的评价结果小于阈值,确定所述用户处于第一类别;当所述每个用户的评价结果大于所述阈值,确定所述用户处于第二类别。
[0014]可选地,所述阈值与所述预设多个用户参与的业务相关。
[0015]可选地,将原始用户集合划分为第一用户集合和剩余用户,可包括:基于所述原始用户集合中的用户在第二历史时间的类别,从所述原始用户集合中采样具有预设类别比的用户;将采样出的用户组成第一用户集合,其中,第二历史时间在第一历史时间之后。
[0016]可选地,从所述原始用户集合中采样具有预设类别比的用户,可包括:按照所述预设类别比的从所述原始用户集合中采样在第二历史时间处于第一类别和第二类别的用户。
[0017]可选地,基于预测结果从剩余用户中获取第二用户集合,可包括:将剩余用户中预测结果为第二类别的用户组成第二用户集合。
[0018]根据本公开的示例性实施例,提供一种用户类别预测方法,包括:获取待预测用户的评价指标;通过将所述评价指标输入到预测模型中来得到待预测用户在预设时间的类别,其中,所述预测模型是通过本公开中的任一种训练方法训练得到的,所述预测模型包括第一模型和第二模型。
[0019]可选地,通过将所述评价指标输入到预测模型中来得到待预测用户在预设时间的类别,可包括:将所述评价指标分别输入到第一模型和第二模型,得到第一概率和第二概率;将第一概率和第二概率中的最小值确定为待预测用户在预设时间处于预设类别的概率;通过将所述概率与预设阈值进行比较来确定待预测用户在预设时间的类别。
[0020]可选地,通过将所述概率与预设概率进行比较来确定待预测用户在预设时间的类别,可包括:当所述概率小于所述预设概率时,确定待预测用户在所述预设时间处于第一类别;当所述概率大于所述预设概率时,确定待预测用户在所述预设时间处于第二类别。
[0021]根据本公开的示例性实施例,提供一种预测模型训练装置,包括:用户集合获取单元,被配置为获取原始用户集合,其中,所述原始用户集合中的用户是在第一历史时间处于第一类别的用户;用户划分单元,被配置为将原始用户集合划分为第一用户集合和剩余用
户;第一训练单元,被配置为将第一用户集合中的用户的评价指标作为训练数据对初始预测模型进行训练,得到第一模型;用户获取单元,被配置为使用第一模型对剩余用户进行预测,基于预测结果从剩余用户中获取第二用户集合;第二训练单元,被配置为将第二用户集合中的用户的评价指标作为训练数据对第一模型进行训练,得到第二模型;和预测模型确定单元,被配置为将第一模型和第二模型的组合作为初始预测模型训练后的预测模型。
[0022]可选地,所述预测模型训练装置还可包括:历史类别确定单元,被配置为确定预设多个用户在历史时间的类别,其中,用户集合获取单元被配置为:从所述预设多个用户中选择在第一历史时间处于第一类别的预设数量个用户组成所述原始用户集合。
[0023]可选地,历史类别确定单元可被配置为:基于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种预测模型训练方法,其特征在于,包括:获取原始用户集合,其中,所述原始用户集合中的用户是在第一历史时间处于第一类别的用户;将所述原始用户集合划分为第一用户集合和剩余用户;将第一用户集合中的用户的评价指标作为训练数据对初始预测模型进行训练,得到第一模型;使用第一模型对剩余用户进行预测,基于预测结果从剩余用户中获取第二用户集合;将第二用户集合中的用户的评价指标作为训练数据对第一模型进行训练,得到第二模型;将第一模型和第二模型的组合作为初始预测模型训练后的预测模型。2.根据权利要求1所述的预测模型训练方法,其特征在于,在获取原始用户集合之前,所述预测模型训练方法还包括:确定预设多个用户在历史时间的类别,其中,获取原始用户集合,包括:从所述预设多个用户中选择在第一历史时间处于第一类别的预设数量个用户组成所述原始用户集合。3.根据权利要求2所述的预测模型训练方法,其特征在于,计算预设多个用户在历史时间的类别,包括:基于所述预设多个用户中的每个用户在所述历史时间的多个评价指标确定所述多个评价指标中的每个评价指标的重要性;针对所述预设多个用户中的每个用户,基于所述每个评价指标的重要性对所述每个用户的所述多个评价指标进行综合处理,得到所述每个用户的评价结果;针对所述预设多个用户中的每个用户,基于所述每个用户的评价结果来确定所述每个用户在所述历史时间的类别。4.根据权利要求3所述的预测模型训练方法,其特征在于,基于所述预设多个用户中的每个用户在所述历史时间的多个评价指标确定所述多个评价指标中的每个评价指标的重要性,包括:基于所述预设多个用户的多个评价指标确定所述多个评价指标中的每个评价指标的权重。5.根据权利要求4所述的预测模型训练方法,其特征在于,基于所述每个评价指标的重要性对所述每个用户的所述多个评价指标进行综合处理,包括:基于所述多个评价指标中的每个评价指标的权重,...

【专利技术属性】
技术研发人员:余婷婷王方舟
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1