通过决策树模型对用户进行分类的方法、装置和设备制造方法及图纸

技术编号:30021643 阅读:17 留言:0更新日期:2021-09-11 06:43
本发明专利技术公开了一种通过决策树模型对用户进行分类的方法、装置和设备,涉及人工智能,方法包括:获取待分类用户的至少一个用户属性以及预先创建的决策树模型;获取当前场景下与该决策树模型的各属性节点相对应的基尼系数,该基尼系数携带有与当前场景相对应的属性节点的权重信息;从决策树模型的根节点开始,根据该基尼系数依次确定下一层级属性节点的开支节点;从该用户属性中选取存在于该决策树模型的属性节点中的用户属性,得到匹配属性;将得到的该匹配属性与该决策树模型中的各节点属性进行匹配,根据该决策树模型中确定的每一层级的开支节点,对该用户进行分类。对该用户进行分类。对该用户进行分类。

【技术实现步骤摘要】
通过决策树模型对用户进行分类的方法、装置和设备


[0001]本专利技术涉及人工智能的智能决策
,尤其涉及一种通过决策树模型对用户进行分类的方法、装置、计算机设备和存储介质。

技术介绍

[0002]用户LOOKALIKE模型工具是现在各类公司和业务上广泛使用的运营工具,其核心原理是在特定场景下,通过目标用户群体,去发掘与该类群体相似度较高的用户,常常运用于潜客运营和新产品/功能的推广。目前LOOKALIKE的方法体系大致分为两种,一类是聚类方法,直接通过指标库中的指标,去寻找在笛卡尔距离下与目标群体距离最近的用户;第二类是通过有监督的分类模型,将目标人群作为正样本,输出模型后再反向用于训练集去圈选模型预测高概率为正样本的用户。
[0003]实际应用中第二类方法表现较为优异,因为第二种方法会尝试在目标用户群特征最明显的方向去优化模型,但是仍然存在针对性弱的问题。比如如下场景中,需要根据已购买产品A的用户寻找其他潜在可能购买产品A的用户,此时应更关注用户的交易、活跃属性等,但是又不能彻底删除其他如用户基础属性的影响,专利技术人意识到,不同场景下通过模型对用户进行分类时,需要重点区分的用户的属性应有所差别,但是目前的LOOKALIKE并不能实现这个自由度,使得目前的LOOKALIKE的场景应用范围收到限制,灵活性不高。

技术实现思路

[0004]本专利技术实施例提供一种通过决策树模型对用户进行分类的方法、装置、计算机设备及存储介质,以解决目前的决策树模型的场景应用范围小、灵活性不高的技术问题。<br/>[0005]一种通过决策树模型对用户进行分类的方法,该方法包括:
[0006]获取待分类用户的至少一个用户属性以及预先创建的决策树模型;
[0007]获取当前场景下与该决策树模型的各属性节点相对应的基尼系数,至少一个该属性节点的基尼系数携带有与该当前场景相对应的属性节点的权重信息;
[0008]从该决策树模型的根节点开始,根据该基尼系数依次确定下一层级属性节点的开支节点;
[0009]从该用户属性中选取存在于该决策树模型的属性节点中的用户属性,得到匹配属性;
[0010]将得到的该匹配属性与该决策树模型中的各节点属性进行匹配,根据该决策树模型中确定的每一层级的开支节点,对该用户进行分类。
[0011]一种通过决策树模型对用户进行分类的装置,该装置包括:
[0012]模型获取模块,用于获取待分类用户的至少一个用户属性以及预先创建的决策树模型;
[0013]系数获取模块,用于获取当前场景下与该决策树模型的各属性节点相对应的基尼系数,至少一个该属性节点的基尼系数携带有与该当前场景相对应的属性节点的权重信
息;
[0014]节点确定模块,用于从该决策树模型的根节点开始,根据该基尼系数依次确定下一层级属性节点的开支节点;
[0015]属性选取模块,用于从该用户属性中选取存在于该决策树模型的属性节点中的用户属性,得到匹配属性;
[0016]匹配模块,用于将得到的该匹配属性与该决策树模型中的各节点属性进行匹配,根据该决策树模型中确定的每一层级的开支节点,对该用户进行分类。
[0017]一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述通过决策树模型对用户进行分类的方法的步骤。
[0018]一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述通过决策树模型对用户进行分类的方法的步骤。
[0019]本专利技术提出的通过决策树模型对用户进行分类的方法、装置、计算机设备及存储介质,首先获取待分类用户的至少一个用户属性以及预先创建的决策树模型,然后获取当前场景下与所述决策树模型的各属性节点相对应的基尼系数,从所述决策树模型的根节点开始,根据所述基尼系数依次确定下一层级属性节点的开支节点,再从所述用户属性中选取存在于所述决策树模型的属性节点中的用户属性,得到匹配属性,最后将得到的所述匹配属性与所述决策树模型中的各节点属性进行匹配,根据所述决策树模型中确定的每一层级的开支节点,对所述用户进行分类,由于至少一个所述属性节点的基尼系数携带有与所述当前场景相对应的属性节点的权重信息,使得可以通过预先设置对应属性节点在当前场景下的权重,以将该属性节点在当前场景下对分类结果的影响力体现出来,使得在通过该决策树模型对待分类的用户进行分类时具有更好的场景效应,提高决策树模型的场景应用范围,也使得通过决策树模型对用户进行分类的方法具有更好的灵活性。
附图说明
[0020]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0021]图1是本专利技术一实施例中通过决策树模型对用户进行分类的方法的一应用环境示意图;
[0022]图2是本专利技术一实施例中通过决策树模型对用户进行分类的方法的一流程图;
[0023]图3是本专利技术实施例图2中步骤S105的进一步实现流程图;
[0024]图4是本专利技术一实施例中通过决策树模型对用户进行分类的装置的结构示意图;
[0025]图5是本专利技术一实施例中计算机设备的一示意图。
具体实施方式
[0026]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本发
明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0027]本申请提供的通过决策树模型对用户进行分类的方法,可应用在如图1的应用环境中,其中,该计算机设备可以通过网络与服务器进行通信。其中,该计算机设备可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
[0028]在一实施例中,如图2所示,提供一种通过决策树模型对用户进行分类的方法,以该方法应用在图1中的计算机设备为例进行说明,包括如下步骤S101至S105。
[0029]S101、获取待分类用户的至少一个用户属性以及预先创建的决策树模型。
[0030]在其中一个实施例中,所述用户属性包括但不限于用户性别、年龄、资产、活跃指标、历史交易指标等等。可以理解的是,为了使得待分类用户的分类结果更加准确,优先获取该待分类用户存在的全部用户属性。
[0031]在其中一个实施例中,创建所述决策树模型的步骤包括以下步骤S201至S205。
[0032]S201、获取当前场景以及当前场景中的用户样本,所述用户样本携带有正标签或负标签的标识。
[0033]在其中一个实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种通过决策树模型对用户进行分类的方法,其特征在于,所述方法包括:获取待分类用户的至少一个用户属性以及预先创建的决策树模型;获取当前场景下与所述决策树模型的各属性节点相对应的基尼系数,至少一个所述属性节点的基尼系数携带有与所述当前场景相对应的属性节点的权重信息;从所述决策树模型的根节点开始,根据所述基尼系数依次确定下一层级属性节点的开支节点;从所述用户属性中选取存在于所述决策树模型的属性节点中的用户属性,得到匹配属性;将得到的所述匹配属性与所述决策树模型中的各节点属性进行匹配,根据所述决策树模型中确定的每一层级的开支节点,对所述用户进行分类。2.根据权利要求1所述的通过决策树模型对用户进行分类的方法,其特征在于,所述获取待分类用户的至少一个用户属性以及预先创建的决策树模型之前,还包括:获取当前场景以及当前场景中的用户样本,所述用户样本携带有正标签或负标签的标识;获取正标签用户样本的样本特征以及所述样本特征所属的样本属性;计算各所述样本属性的基尼系数;将所述基尼系数最小的样本属性作为当前层级的开支节点;在确定所述开支节点后,循环计算各剩余样本属性的基尼系数至所述将所述基尼系数最小的样本属性作为当前层级的开支节点的步骤,直到满足预设的停止条件,得到创建好的决策树模型。3.根据权利要求2所述的通过决策树模型对用户进行分类的方法,其特征在于,通过以下公式计算各所述样本属性的基尼系数:下公式计算各所述样本属性的基尼系数:其中,N
i
表示样本特征A所属的样本属性,D表示所述正标签用户样本,t
i
表示根据当前场景预先设置的对应样本属性的权重,|D|表示所述用户样本的总数量,|D
k
|表示第k个所述样本属性中正标签用户样本的样本数量,|C
k
|表示第k个所述样本属性的样本数量。4.根据权利要求3所述的通过决策树模型对用户进行分类的方法,其特征在于,当所述样本属性对分类结果的影响力不受所述当前场景的影响时,将根据当前场景预先设置的对应样本属性的权重t
i
设置为1。5.根据权利要求1所述的通过决策树模型对用户进行分类的方法,其特征在于,所述根据所述基尼系数依次确定下一层级属性节点的开支节点的步骤,包括:获取在当前场景下的同一层级中各个属性节点相对应的基尼系数;将获取...

【专利技术属性】
技术研发人员:梁炀潇
申请(专利权)人:未鲲上海科技服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1