用户标签的预测方法、装置、电子设备及计算机程序产品制造方法及图纸

技术编号:39294597 阅读:8 留言:0更新日期:2023-11-07 11:02
本申请涉及计算机技术领域,提供一种用户标签的预测方法、装置、电子设备及计算机程序产品。所述方法包括:获取目标用户的网络指标数据;将目标用户的网络指标数据输入到集成模型中的深度森林模型,获取目标用户对应的中间指标数据;将中间指标数据输入到集成模型中的逻辑回归模型,获取目标用户对应的目标标签;所述目标用户对应的中间指标数据是基于所述深度森林模型中每一层的输出确定的。本申请实施例通过将目标用户的网络指标数据输入到集成模型中深度森林模型,基于深度森林模型中每一层的输出确定中间指标数据,可以提高中间指标数据的数量,输入到集成模型中逻辑回归模型,可以获取目标标签,提高用户标签预测的精确度。确度。确度。

【技术实现步骤摘要】
用户标签的预测方法、装置、电子设备及计算机程序产品


[0001]本申请涉及计算机
,具体涉及一种用户标签的预测方法、装置、电子设备及计算机程序产品。

技术介绍

[0002]随着运营商大数据采集、存储和处理能力的提升,积累了维度广、连续性好和数据准确度高的用户数据,能够基于用户数据从基础信息、交往圈信息和上网行为信息等维度构建用户画像。基于运营商提供的底层数据和金融企业提供的样本标签,可以建立预测模型。
[0003]基于集成模型可以对用户标签进行预测,但相关技术中的集成模型的上层模型输出的指标数量有限,导致模型预测的精确度不高。

技术实现思路

[0004]本申请实施例提供一种用户标签的预测方法、装置、电子设备及计算机程序产品,用以解决相关技术中模型预测的精确度不高的技术问题。
[0005]第一方面,本申请实施例提供一种用户标签的预测方法,包括:
[0006]获取目标用户的网络指标数据;
[0007]将所述目标用户的网络指标数据输入到集成模型中的深度森林模型,获取所述目标用户对应的中间指标数据;
[0008]将所述目标用户对应的中间指标数据输入到集成模型中的逻辑回归模型,获取所述目标用户对应的目标标签;
[0009]所述集成模型包括深度森林模型和逻辑回归模型,所述目标用户对应的中间指标数据是基于所述深度森林模型中每一层的输出确定的。
[0010]可选地,在一个实施例中,所述将所述目标用户的网络指标数据输入到集成模型中的深度森林模型,获取所述目标用户对应的中间指标数据,包括:
[0011]将所述目标用户的网络指标数据输入到深度森林模型的第一层对应的学习器,获取所述第一层对应的中间指标数据;
[0012]对于所述深度森林模型中每一个目标层,将所述目标层的前一层对应的中间指标数据输入所述目标层对应的学习器,获取所述目标层对应的中间指标数据;
[0013]基于所述深度森林模型中每一层分别对应的中间指标数据,确定所述目标用户对应的中间指标数据;
[0014]其中,所述目标层为所述深度森林模型中除所述第一层之外的其他层。
[0015]可选地,在一个实施例中,所述深度森林模型的第一层包括一个或多个学习器,所述将所述目标用户的网络指标数据输入到深度森林模型的第一层对应的学习器,获取所述第一层对应的中间指标数据,包括:
[0016]将所述目标用户的网络指标数据输入到所述第一层的每一个学习器,获取所述第
一层的每一个学习器分别对应的中间指标数据;
[0017]基于所述第一层的每一个学习器分别对应的中间指标数据和所述第一层的每一个学习器对应的编号,确定所述第一层对应的中间指标数据。
[0018]可选地,在一个实施例中,所述目标层包括一个或多个学习器,所述将所述目标层的前一层对应的中间指标数据输入所述目标层对应的学习器,获取所述目标层对应的中间指标数据,包括:
[0019]将所述目标层的前一层对应的中间指标数据输入到所述目标层的每一个学习器,获取所述目标层的每一个学习器分别对应的中间指标数据;
[0020]基于所述目标层的每一个学习器分别对应的中间指标数据和所述目标层的每一个学习器对应的编号,确定所述目标层应的中间指标数据。
[0021]可选地,在一个实施例中,所述学习器为以下任一模型:
[0022]梯度提升模型LightGBM;
[0023]随机森林模型;
[0024]极端随机森林模型。
[0025]可选地,在一个实施例中,所述深度森林模型通过如下方式构建:
[0026]对历史用户指标数据进行预处理,获取所述历史用户指标数据对应的初始指标宽表;
[0027]基于所述初始指标宽表、历史用户金融标签和第一评估指标,对初始的深度森林模型进行训练,获取所述深度森林模型;
[0028]所述第一评估指标为受试者工作特性曲线ROC下的面积,所述深度森林模型对应的所述第一评估指标大于或等于70%。
[0029]可选地,在一个实施例中,所述逻辑回归模型通过如下方式构建:
[0030]对历史用户指标数据进行预处理,获取所述历史用户指标数据对应的初始指标宽表;
[0031]将所述初始指标宽表中的数据输入到所述深度森林模型,获取中间指标宽表;
[0032]基于所述中间指标宽表、历史用户金融标签和第二评估指标,对初始的逻辑回归模型进行训练,获取所述逻辑回归模型;
[0033]所述第二评估指标为受试者工作特性曲线ROC下的面积。
[0034]可选地,在一个实施例中,所述基于所述中间指标宽表、历史用户金融标签和第二评估指标,对初始的逻辑回归模型进行训练,获取所述逻辑回归模型,包括:
[0035]获取所述初始的逻辑回归模型的调优参数;
[0036]基于所述中间指标宽表、所述历史用户金融标签、所述第二评估指标和所述调优参数,对所述初始的逻辑回归模型进行训练,获取所述逻辑回归模型。
[0037]第二方面,本申请实施例提供一种用户标签的预测装置,包括:
[0038]第一获取模块,用于获取目标用户的网络指标数据;
[0039]第二获取模块,用于将所述目标用户的网络指标数据输入到集成模型中的深度森林模型,获取所述目标用户对应的中间指标数据;
[0040]第三获取模块,用于将所述目标用户对应的中间指标数据输入到集成模型中的逻辑回归模型,获取所述目标用户对应的目标标签;
[0041]所述集成模型包括深度森林模型和逻辑回归模型,所述目标用户对应的中间指标数据是基于所述深度森林模型中每一层的输出确定的。
[0042]第三方面,本申请实施例提供一种电子设备,包括处理器和存储有计算机程序的存储器,所述处理器执行所述程序时实现第一方面所述的用户标签的预测方法的步骤。
[0043]第四方面,本申请实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现第一方面所述的用户标签的预测方法的步骤。
[0044]本申请实施例提供的用户标签的预测方法、装置、电子设备及计算机程序产品,通过将目标用户的网络指标数据输入到集成模型中深度森林模型,可以基于深度森林模型中每一层的输出确定目标用户对应的中间指标数据,可以提高中间指标数据的数量,进而将目标用户对应的中间指标数据输入到集成模型中逻辑回归模型,可以获取目标用户对应的目标标签,提高用户标签预测的精确度。
附图说明
[0045]为了更清楚地说明本申请或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0046]图1是本申请实施例提供的用户标签的预测方法的流程示意图之一;
[0047]图2是本申请实施例提供的用户标签的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户标签的预测方法,其特征在于,包括:获取目标用户的网络指标数据;将所述目标用户的网络指标数据输入到集成模型中的深度森林模型,获取所述目标用户对应的中间指标数据;将所述目标用户对应的中间指标数据输入到集成模型中的逻辑回归模型,获取所述目标用户对应的目标标签;所述集成模型包括深度森林模型和逻辑回归模型,所述目标用户对应的中间指标数据是基于所述深度森林模型中每一层的输出确定的。2.根据权利要求1所述的用户标签的预测方法,其特征在于,所述将所述目标用户的网络指标数据输入到集成模型中的深度森林模型,获取所述目标用户对应的中间指标数据,包括:将所述目标用户的网络指标数据输入到深度森林模型的第一层对应的学习器,获取所述第一层对应的中间指标数据;对于所述深度森林模型中每一个目标层,将所述目标层的前一层对应的中间指标数据输入所述目标层对应的学习器,获取所述目标层对应的中间指标数据;基于所述深度森林模型中每一层分别对应的中间指标数据,确定所述目标用户对应的中间指标数据;其中,所述目标层为所述深度森林模型中除所述第一层之外的其他层。3.根据权利要求2所述的用户标签的预测方法,其特征在于,所述深度森林模型的第一层包括一个或多个学习器,所述将所述目标用户的网络指标数据输入到深度森林模型的第一层对应的学习器,获取所述第一层对应的中间指标数据,包括:将所述目标用户的网络指标数据输入到所述第一层的每一个学习器,获取所述第一层的每一个学习器分别对应的中间指标数据;基于所述第一层的每一个学习器分别对应的中间指标数据和所述第一层的每一个学习器对应的编号,确定所述第一层对应的中间指标数据。4.根据权利要求2所述的用户标签的预测方法,其特征在于,所述目标层包括一个或多个学习器,所述将所述目标层的前一层对应的中间指标数据输入所述目标层对应的学习器,获取所述目标层对应的中间指标数据,包括:将所述目标层的前一层对应的中间指标数据输入到所述目标层的每一个学习器,获取所述目标层的每一个学习器分别对应的中间指标数据;基于所述目标层的每一个学习器分别对应的中间指标数据和所述目标层的每一个学习器对应的编号,确定所述目标层应的中间指标数据。5.根据权利要求2

4任一项所述的用户标签的预测方法,其特征在于,所述学习器为以下任一模型:梯度提升模型LightGBM;随...

【专利技术属性】
技术研发人员:方海贝赵雨樊巧云陆天珺
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1