一种基于自训练的用户价值分层方法、装置、存储介质及设备制造方法及图纸

技术编号:34147324 阅读:16 留言:0更新日期:2022-07-14 19:17
本发明专利技术公开了本发明专利技术提供了一种基于自训练的用户价值分层方法、装置、存储介质及设备,所述的方法包括以下步骤,步骤(一),根据RFM模型提取用户样本的数据特征,并将数据特征进行归一化处理,得到用户样本数据集;步骤(二),基于统计分析,确定步骤(一)中的用户样本数据集的部分数据的标签,得到部分数据有标签的样本集合;步骤(三),将步骤(二)中的样本集合基于自训练,获得用户价值分层模型。本发明专利技术的基于自训练的用户价值分层方法、装置、存储介质及设备,能够在数据动态增长和缺乏置信标签的情况下高效且准确的划分不同价值类别的用户。本方案将整体架构进行了解耦化,方便部署以及试错检查、此外具有良好的可扩展性和迁移性。此外具有良好的可扩展性和迁移性。此外具有良好的可扩展性和迁移性。

A user value hierarchy method, device, storage medium and equipment based on self training

【技术实现步骤摘要】
一种基于自训练的用户价值分层方法、装置、存储介质及设备


[0001]本专利技术涉及用户价值分层领域,具体涉及一种基于自训练的用户价值分层方法、装置、存储介质及设备。

技术介绍

[0002]本部分的描述仅提供与本专利技术公开相关的背景信息,而不构成现有技术。
[0003]用户价值分层指根据用户的参与意愿及创利能力将其划分不同的群体,以便平台为其提供定制化的服务。面向广告投放业务,不同类型的用户在参与动机和意愿等方面存在差异,他们所创造的价值也存在差异。对用户价值进行分层,便于针对性地设置有效的广告投放策略,增加业务的创收。因此,如何利用采集到的用户行为特征来进行价值分层具有切实的意义。然而,面向广告投放业务,目前尚无成熟的用户价值分层方案。由于实际采集到的数据动态增长且缺乏置信的标签,相关领域的用户价值分层方法难以适用。
[0004]应该注意,上面对技术背景的介绍只是为了方便对本专利技术的技术方案进行清楚、完整的说明,并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本专利技术的
技术介绍
部分进行了阐述而认为上述技术方案为本领域技术人员所公知。

技术实现思路

[0005]本专利技术要解决的技术问题是提供一种基于自训练的用户价值分层方法、装置、存储介质及设备。
[0006]为了解决上述技术问题,本专利技术提供了一种基于自训练的用户价值分层方法,其特征在于,所述的方法包括以下步骤,
[0007]步骤(一),根据RFM模型提取用户样本的数据特征,并将数据特征进行归一化处理,得到用户样本数据集;
[0008]步骤(二),基于统计分析,确定步骤(一)中的用户样本数据集的部分数据的标签,得到部分数据有标签的样本集合;
[0009]步骤(三),将步骤(二)中的样本集合基于自训练,获得用户价值分层模型。
[0010]优选地,步骤(一)具体包括,
[0011]特征采集:采集单位时间内用户游戏闯关数R、单位时间内观看广告的数量F及用户的生命周期价值M,分别如式(1)

(3)所示,其中,ΔT表示一段时间的间隔,
[0012][0013][0014]M=LTV(3),
[0015]特征处理:定义用户参与意愿W,如式(4)所示,其中,f(F,M)为每关平均展示广告的数量,并对样本进行归一化处理,如式(5)所示,
[0016][0017][0018]优选地,步骤(二)具体包括,
[0019]样本处理过的数据集D={(X1,y1),...,(X
i
,y
i
),...,(X
n
,y
n
)},其中为用户参与意愿W与生命周期价值M构成的特征向量,对应用户所属的类别,
[0020]根据四分位点和均值确定高阈值和低阈值,如式(6)和式(7)所示,并确定部分数据集的标签,如式(8)所示,
[0021][0022][0023][0024]优选地,y
i
=1,对应的用户类型为用户参与意愿强且创造的收益多的“重要价值用户”;y
i
=2,对应的用户类型为用户参与意愿强但创造的收益少的“一般价值用户”;y
i
=3,对应的用户类型为用户参与意愿弱但创造的收益多的“重要发展客户”;y
i
=4,对应的用户类型为用户参与意愿弱且创造的收益少的“一般发展用户”。
[0025]优选地,步骤(三)具体包括,
[0026]用xgboost作为训练模型的基学习器,如式9

10所示,其中L(φ)为损失函数,Ω(f
k
)为正则项,将部分带有标签的样本用于训练初始的分类器,
[0027][0028][0029]优选地,使用基学习器预测数据集中未被标记的样本,并从中挑选出置信度高的数据添加至新的训练集中,所述的置信度高的数据为预测概率高于阈值的数据,如式(11)所示,其中I表明该数据是否属于高置信度的数据,重复该过程,更新数据集和分类模型,直到训练任务结束,得到用户价值分层模型p,
[0030][0031]根据自训练得到的模型p,可对输入特征进行分类,得到其对应类别y
i
=p(X
i
),完成对用户价值进行分层。
[0032]本申请还提供一种基于自训练的用户价值分层装置,所述的装置包括,
[0033]样本处理模块,用于根据RFM模型提取用户样本的数据特征,并将数据特征进行归一化处理,得到用户样本数据集;
[0034]基于统计分析的数据标记模块,用于基于统计分析,确定用户样本数据集的部分数据的标签,得到部分数据有标签的样本集合;
[0035]自训练模块,用于将样本集合基于自训练,获得用户价值分层模型。
[0036]优选地,所述的样本处理模块包括,
[0037]特征采集单元,用于采集单位时间内用户游戏闯关数R、单位时间内观看广告的数量F及用户的生命周期价值M;
[0038]特征处理单元,用于定义用户参与意愿W,如式(4)所示,其中,f(F,M)为每关平均展示广告的数量,并对样本进行归一化处理,如式(5)所示,
[0039][0040][0041]本申请还提供一种存储有计算机程序的计算机可读存储介质,其特征在于,当所述计算机程序被处理器执行时,致使所述处理器实现所述的基于自训练的用户价值分层方法。
[0042]本申请还提供一种电子设备,包括:
[0043]至少一个处理器;以及
[0044]与所述至少一个处理器通信连接的存储器;其中,
[0045]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行所述的基于自训练的用户价值分层方法。
[0046]借由以上的技术方案,本专利技术的有益效果如下:
[0047]本专利技术的基于自训练的用户价值分层方法、装置、存储介质及设备,能够在数据动态增长和缺乏置信标签的情况下高效且准确的划分不同价值类别的用户。本方案将整体架构进行了解耦化,方便部署以及试错检查、此外具有良好的可扩展性和迁移性。
附图说明
[0048]图1是本申请的基于自训练方法的用户价值分层整体框架图;
[0049]图2是本申请的样本处理流程图;
[0050]图3是本申请的基于统计分析的数据标记流程图;
[0051]图4是本申请的自训练模型的工作流程图。
具体实施方式
[0052]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0053]如图1所示,为本申请的基于自训练方法的用户价值分层整体框架,基于自训练的用户价值分层方法包本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于自训练的用户价值分层方法,其特征在于,所述的方法包括以下步骤,步骤(一),根据RFM模型提取用户样本的数据特征,并将数据特征进行归一化处理,得到用户样本数据集;步骤(二),基于统计分析,确定步骤(一)中的用户样本数据集的部分数据的标签,得到部分数据有标签的样本集合;步骤(三),将步骤(二)中的样本集合基于自训练,获得用户价值分层模型。2.根据权利要求1所述的方法,其特征在于,步骤(一)具体包括,特征采集:采集单位时间内用户游戏闯关数R、单位时间内观看广告的数量F及用户的生命周期价值M,如式(1)

(3)所示,其中,ΔT表示一段时间的间隔,(3)所示,其中,ΔT表示一段时间的间隔,M=LTV
ꢀꢀ
(3),特征处理:定义用户参与意愿W,如式(4)所示,其中,f(F,M)为每关平均展示广告的数量,并对样本进行归一化处理,如式(5)所示,量,并对样本进行归一化处理,如式(5)所示,3.根据权利要求2所述的方法,其特征在于,步骤(二)具体包括,样本处理过的数据集D={(X1,y1),...,(X
i
,y
i
),...,(X
n
,y
n
)},其中为用户参与意愿W与生命周期价值M构成的特征向量,y
i
∈[1,2,3,4]对应用户所属的类别,根据四分位点和均值确定高阈值和低阈值,如式(6)和式(7)所示,并确定部分数据集的标签,如式(8)所示,的标签,如式(8)所示,
4.根据权利要求3所述的方法,其特征在于,y
i
=1,对应的用户类型为用户参与意愿强且创造的收益多的“重要价值用户”;y
i
=2,对应的用户类型为用户参与意愿强但创造的收益少的“一般价值用户”;y
i
=3,对应的用户类型为用户参与意愿弱但创造的收益多的“重要发展客户”;y
i
=4,对应的用户类型为用户参与意愿弱且创造的收益少的“一般发展用户”。5.根据权利要求3所述的方法,其特征在于,步骤(三)...

【专利技术属性】
技术研发人员:周洪海
申请(专利权)人:金数信息科技苏州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1