一种终端设备的用户属性确定方法及电子设备技术

技术编号:36552258 阅读:11 留言:0更新日期:2023-02-04 17:06
本申请实施例提供一种终端设备的用户属性确定方法及电子设备,涉及数据处理领域,能够根据终端设备的基础参数和使用数据确定终端设备的用户属性,且准确性较高。该方法包括:获取第一终端设备的第一数据。将第一终端设备的第一数据输入属性确定模型。属性确定模型为预先使用样本数据对预设模型训练生成。样本数据包括多个终端设备的第一数据以及用户属性。预设模型为分类模型。根据属性确定模型的输出结果确定第一终端设备的用户属性。结果确定第一终端设备的用户属性。结果确定第一终端设备的用户属性。

【技术实现步骤摘要】
一种终端设备的用户属性确定方法及电子设备


[0001]本申请实施例涉及数据处理领域,尤其涉及一种终端设备的用户属性确定方法及电子设备。

技术介绍

[0002]随着终端设备的普及,对终端设备的用户属性的研究也越来越多。终端设备的用户属性包括该终端设备的用户性别,用户年龄,兴趣偏好,消费偏好等。可以理解,终端设备的用户属性在统计该类终端设备的用户分布,精准营销等方面具有很高的价值。例如,某产品提供商,其产品的主要营销目标为某品牌终端设备的用户中的女性群体。如果该产品提供商可以先通过该品牌终端设备的用户属性圈定目标群体,则可以大大减小营销成本。
[0003]终端设备的用户属性可以由用户自行输入保存于终端设备中,以便于产品提供商在经过用户同意后获取使用。然而,并非所有用户都会将用户属性输入到终端设备中,使得很多终端设备中没有存储用户属性,产品提供商也无法获取到这部分终端设备的用户属性。
[0004]因此,如何确定终端设备的用户属性成为亟待解决的问题。

技术实现思路

[0005]本申请实施例提供一种终端设备的用户属性确定方法及电子设备,能够根据终端设备的基础参数和使用数据确定终端设备的用户属性,且准确性较高。
[0006]为了达到上述目的,本申请实施例采用如下技术方案。
[0007]第一方面,提供一种终端设备的用户属性确定方法,用于根据第一终端设备的第一数据确定第一终端设备的用户属性。第一数据包括对应的终端设备的基础参数以及对应的终端设备被激活且被使用后产生的使用数据。用户属性至少包括以下一种:用户性别,用户年龄段。方法包括:获取第一终端设备的第一数据。将第一终端设备的第一数据输入属性确定模型。属性确定模型为预先使用样本数据对预设模型训练生成。样本数据包括多个终端设备的第一数据以及用户属性。预设模型为分类模型。根据属性确定模型的输出结果确定第一终端设备的用户属性。
[0008]基于该方案,通过使用样本数据训练出的机器学习模型,实现了在终端设备中不包括用户属性的情况下,仍然能够根据终端设备的基础参数和使用数据确定出终端设备的用户属性,且具有较高的准确性。
[0009]在一种可能的设计中,将第一终端设备的第一数据输入属性确定模型之前,方法还包括:分别对第一终端设备的第一数据中的基础参数进行特征衍生,对第一终端设备的第一数据中的使用数据进行聚类,得到第一终端设备的特征数据。将第一终端设备的第一数据输入属性确定模型,包括:将第一终端设备的特征数据输入属性确定模型。样本数据包括多个终端设备的特征数据以及用户属性。终端设备的特征数据通过对各终端设备的第一数据中的基础参数进行特征衍生,对各终端设备的第一数据中的使用数据进行聚类得到。
基于该方案,对第一数据进行特征衍生和特征提取生成更具有代表性的特征数据,可以有效提高确定出的用户属性的准确性。
[0010]在一种可能的设计中,第一数据还包括对应的终端设备的激活时长。获取第一终端设备的第一数据之前,方法还包括:获取样本数据。获取样本数据中的第一样本。第一样本对应的各终端设备的激活时长大于第一时长。使用第一样本对预设模型中的第一模型进行训练,生成属性确定模型中的第二模型。第一模型为树模型分类器或线性分类模型。基于该方案,在模型训练阶段,可以采用对样本数据中的第一样本进行训练。在模型使用阶段,在第一终端设备激活时长与第一样本对应的终端设备的激活时长相同时,将第一终端设备的特征数据输入经过第一样本训练的模型中,以得到第一终端设备的用户属性。如此,可以提高确定用户属性的准确率以及效率。
[0011]在一种可能的设计中,将第一终端设备的第一数据输入属性确定模型,包括:在第一终端设备的激活时长大于第一时长时,将第一终端设备的特征数据输入第二模型。根据属性确定模型的输出结果确定第一终端设备的用户属性,包括:根据第二模型的输出结果确定第一终端设备的用户属性。基于该方案,在模型训练阶段,可以采用对样本数据中的第一样本进行训练。在模型使用阶段,在第一终端设备激活时长与第一样本对应的终端设备的激活时长相同时,将第一终端设备的特征数据输入经过第一样本训练的模型中,以得到第一终端设备的用户属性。如此,可以提高确定用户属性的准确率以及效率。
[0012]在一种可能的设计中,获取样本数据之后,方法还包括。获取样本数据中的第二样本。第二样本对应的各终端设备的激活时长小于或等于第一时长。将第二样本输入树模型分类器进行多次迭代,得到树模型分类器中各个弱分类器的叶子节点数据。叶子节点数据为第二样本中各特征数据的特征组合。对各叶子节点数据进行一位有效编码,得到编码数据。将编码数据与第二样本中的各特征数据进行合并,得到第三样本。使用第三样本对预设模型中的第三模型进行训练,生成属性确定模型中的第四模型。第四模型为线性分类模型。基于该方案,在模型训练阶段,可以采用对样本数据中的第二样本进行训练。在模型使用阶段,在第一终端设备激活时长与第二样本对应的终端设备的激活时长相同时,将第一终端设备的特征数据输入经过第二样本训练的模型中,以得到第一终端设备的用户属性。如此,可以提高确定用户属性的准确率以及效率。
[0013]在一种可能的设计中,将第一终端设备的第一数据输入属性确定模型,包括:在第一终端设备的激活时长小于或等于第一时长时,将第一终端设备的特征数据输入树模型分类器,得到特征分类结果。对特征分类结果进行一位有效编码,得到特征编码结果。将特征编码结果与第一终端设备的特征数据合并,得到特征合并结果。以第三样本中编码数据的顺序以及特征数据的顺序为参考,对特征合并结果进行特征对齐,得到特征对齐结果。将特征对齐结果输入第四模型。根据属性确定模型的输出结果确定第一终端设备的用户属性,包括:根据第四模型的输出结果确定第一终端设备的用户属性。基于该方案,在模型训练阶段,可以采用对样本数据中的第二样本进行训练。在模型使用阶段,在第一终端设备激活时长与第二样本对应的终端设备的激活时长相同时,将第一终端设备的特征数据输入经过第二样本训练的模型中,以得到第一终端设备的用户属性。如此,可以提高确定用户属性的准确率以及效率。
[0014]在一种可能的设计中,树模型分类器为梯度提升决策树。
[0015]在一种可能的设计中,在第一终端设备的第一数据中的基础参数包括终端设备每天被使用的时间段时,对第一终端设备的第一数据中的基础参数进行特征衍生,包括:根据终端设备每天被使用的时间段确定终端设备每天被使用的最早时间和最晚时间。
[0016]在一种可能的设计中,在第一终端设备的第一数据中的使用数据包括应用安装信息时,对第一终端设备的第一数据中的使用数据进行聚类,包括:对应用市场中安装数量大于第一阈值的应用进行分类,得到多个应用类别。根据应用安装信息确定第一终端设备所包括的应用类别。
[0017]在一种可能的设计中,终端设备的基础参数至少包括以下一种:颜色,型号,系统版本。
[0018]在一种可能的设计中,终端设备的使用数据至少包括以下一种:应用安装信息,应用使用信息,使本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种终端设备的用户属性确定方法,其特征在于,用于根据第一终端设备的第一数据确定所述第一终端设备的用户属性;所述第一数据包括对应的终端设备的基础参数以及对应的终端设备被激活且被使用后产生的使用数据;所述用户属性至少包括以下一种:用户性别,用户年龄段;所述方法包括:获取所述第一终端设备的第一数据;将所述第一终端设备的第一数据输入属性确定模型;所述属性确定模型为预先使用样本数据对预设模型训练生成;所述样本数据包括多个终端设备的第一数据以及用户属性;所述预设模型为分类模型;根据所述属性确定模型的输出结果确定所述第一终端设备的用户属性。2.根据权利要求1所述的方法,其特征在于,所述将所述第一终端设备的第一数据输入属性确定模型之前,所述方法还包括:分别对所述第一终端设备的第一数据中的基础参数进行特征衍生,对所述第一终端设备的第一数据中的使用数据进行聚类,得到第一终端设备的特征数据;所述将所述第一终端设备的第一数据输入属性确定模型,包括:将所述第一终端设备的特征数据输入属性确定模型;所述样本数据包括多个终端设备的特征数据以及用户属性;所述终端设备的特征数据通过对各终端设备的第一数据中的基础参数进行特征衍生,对各终端设备的第一数据中的使用数据进行聚类得到。3.根据权利要求2所述的方法,其特征在于,所述第一数据还包括对应的终端设备的激活时长;所述获取所述第一终端设备的第一数据之前,所述方法还包括:获取所述样本数据;获取所述样本数据中的第一样本;所述第一样本对应的各终端设备的激活时长大于第一时长;使用所述第一样本对所述预设模型中的第一模型进行训练,生成所述属性确定模型中的第二模型;所述第一模型为树模型分类器或线性分类模型。4.根据权利要求3所述的方法,其特征在于,所述将所述第一终端设备的第一数据输入属性确定模型,包括:在所述第一终端设备的激活时长大于所述第一时长时,将所述第一终端设备的特征数据输入所述第二模型;所述根据所述属性确定模型的输出结果确定所述第一终端设备的用户属性,包括:根据所述第二模型的输出结果确定所述第一终端设备的用户属性。5.根据权利要求3所述的方法,其特征在于,所述获取所述样本数据之后,所述方法还包括;获取所述样本数据中的第二样本;所述第二样本对应的各终端设备的激活时长小于或等于所述第一时长;将所述第二样本输入树模型分类器进行多次迭代,得到所述树模型分类器中各个弱分类器的叶子节点数据;所述叶子节点数据为所述第二样本中各特征数据的特征组合;对各叶子节点数据进行一位有效编码,得到编码数据;将所述编码数据与所述第二样本中的各特征数据进行合并,得到第三样本;
使用所述第三样本对所述预设模型中的第三模型进行训练,生成所述属性确定模型中的第四模型;所述第四模型为线性分类模型。6...

【专利技术属性】
技术研发人员:章心宇
申请(专利权)人:荣耀终端有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1