一种获取多标签用户画像的方法和装置制造方法及图纸

技术编号:18351262 阅读:273 留言:0更新日期:2018-07-02 01:03
本说明书实施例公开了一种训练用户画像分类器的方法和装置以及获取多标签用户画像的方法和装置。所述训练方法包括:获取第一组用户的各自的第一特征向量;获取所述第一组用户各自的第一标签的值;以所述第一组用户各自的第一特征向量和第一标签的值的集合作为第一训练集,训练第一分类器;将所述第一组用户各自的第一特征向量和第一标签的值组合,以获取所述第一组用户各自的第二特征向量;获取所述第一组用户各自的第二标签的值;以及以所述第一组用户各自的第二特征向量和第二标签的值的集合作为第二训练集,训练第二分类器。

【技术实现步骤摘要】
一种获取多标签用户画像的方法和装置
本专利技术涉及机器学习领域,具体地,涉及一种训练用户画像分类器的方法和装置以及一种获取多标签用户画像的方法和装置。
技术介绍
随着互联网的普及与发展,越来越多的数据可以被各个互联网运营商收集起来。例如,对于电商网站,可以获得用户的购买记录、浏览记录等信息;对于搜索引擎,可以获得用户的搜索记录、点击记录等信息。为了更好的利用这样的信息,以提供更为高效优质的服务,用户画像这一技术得到了普遍重视。用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。目前,现有技术中包括基于深度神经网络获取用户画像的方法和基于统计数据获取用户画像的方法等。因此,需要一种更有效的用于获取多标签用户画像的方案。
技术实现思路
本说明书实施例旨在提供一种更有效的获取多标签用户画像的方案,以解决现有技术中的不足。为实现上述目的,本说明书一个方面提供一种训练用户画像分类器的方法,所述分类器是链式分类器,其包括第一分类器和第二分类器,所述用户画像为多标签用户画像,所述方法包括:获取第一组用户的各自的第一特征向量,所述第一特征向量对应于用户的信息,所述信息包括用户的注册信息、以及用户的操作历史信息;获取所述第一组用户各自的第一标签的值,所述第一标签的值对应于用户的第一标签信息;以所述第一组用户各自的第一特征向量和第一标签的值的集合作为第一训练集,训练第一分类器;将所述第一组用户各自的第一特征向量和第一标签的值组合,以获取所述第一组用户各自的第二特征向量;获取所述第一组用户各自的第二标签的值,所述第二标签的值对应于用户的第二标签信息,并且用户的第二标签与用户的第一标签相关联;以及以所述第一组用户各自的第二特征向量和第二标签的值的集合作为第二训练集,训练第二分类器。在一个实施例中,在上述训练链式分类器的方法中,所述用户的信息包括用户的标签信息。在一个实施例中,在上述训练链式分类器的方法中,第一标签是年龄,第二标签是购买偏好。在一个实施例中,在上述训练链式分类器的方法中,第一标签是购买偏好,第二标签是购买能力。本说明书另一方面提供一种训练用户画像分类器的方法,所述分类器是链式分类器,其包括第一分类器和第二分类器,其中所述第一分类器是通过上述训练方法训练获得的第一分类器,所述用户画像为多标签用户画像,所述方法包括:在训练第一分类器之后,获取第二组用户的各自的第一特征向量,所述第二组用户包括不属于所述第一组用户的至少一个用户,所述第一特征向量对应于用户的信息,所述信息包括用户的注册信息、以及用户的操作历史信息;将所述第二组用户的各自的第一特征向量输入所述第一分类器,以获取所述第二组用户的各自的第一标签预测值,将所述第二组用户中每个用户的第一特征向量和第一标签预测值组合,以获取第二组用户各自的第二特征向量;获取第二组用户各自的第二标签的值,所述第二标签的值对应于用户的第二标签信息,并且用户的第二标签与用户的第一标签相关联;以及以所述第二组用户各自的第二特征向量和第二标签的值的集合作为第三训练集,训练所述第二分类器。本说明书另一方面提供一种获取多标签用户画像的方法,包括:基于用户信息获取用户的第一特征向量;将所述第一特征向量输入通过上述训练方法训练获得的第一分类器,获得所述用户的第一标签预测值,作为所述用户的第一标签的值;将所述第一特征向量与所述第一标签的值组合,以获取所述用户的第二特征向量;以及将所述第二特征向量输入通过上述训练方法训练获得的第二分类器,获得所述用户的第二标签预测值,作为所述用户的第二标签的值。在一个实施例中,上述获取多标签用户画像的方法还包括,在基于用户信息获取用户的第一特征向量之后,在所述用户信息中包括所述第一标签信息的情况中,以所述第一标签信息的对应预设值替换所述第一标签预测值,作为所述用户的第一标签的值。在一个实施例中,上述获取多标签用户画像的方法还包括,在获取所述用户的第二特征向量之后,在所述用户信息中包括所述第二标签信息的情况中,以所述第二标签信息的对应预设值替换所述第二标签预测值,作为所述用户的第二标签的值。本说明书另一方面提供一种训练用户画像分类器的装置,所述分类器是链式分类器,其包括第一分类器和第二分类器,所述用户画像为多标签用户画像,所述装置包括:第一获取单元,配置为,获取第一组用户的各自的第一特征向量,所述第一特征向量对应于用户的信息,所述信息包括用户的注册信息、以及用户的操作历史信息;第二获取单元,配置为,获取所述第一组用户各自的第一标签的值,所述第一标签的值对应于用户的第一标签信息;第一训练单元,配置为,以所述第一组用户各自的第一特征向量和第一标签的值的集合作为第一训练集,训练第一分类器;第三获取单元,配置为,将所述第一组用户各自的第一特征向量和第一标签的值组合,以获取所述第一组用户各自的第二特征向量;第四获取单元,配置为,获取所述第一组用户各自的第二标签的值,所述第二标签的值对应于用户的第二标签信息,并且用户的第二标签与用户的第一标签相关联;以及第二训练单元,配置为,以所述第一组用户各自的第二特征向量和第二标签的值的集合作为第二训练集,训练第二分类器。本说明书另一方面提供一种训练用户画像分类器的装置,所述分类器是链式分类器,其包括第一分类器和第二分类器,其中所述第一分类器是通过上述训练方法训练获得的第一分类器,所述用户画像为多标签用户画像,所述装置包括:第五获取单元,配置为,获取第二组用户的各自的第一特征向量,所述第二组用户包括不属于所述第一组用户的至少一个用户,所述第一特征向量对应于用户的信息,所述信息包括用户的注册信息、以及用户的操作历史信息;输入单元,配置为,将所述第二组用户的各自的第一特征向量输入所述第一分类器,以获取所述第二组用户的各自的第一标签预测值;组合单元,配置为,将所述第二组用户中每个用户的第一特征向量和第一标签预测值组合,以获取第二组用户各自的第二特征向量;第六获取单元,配置为,获取第二组用户各自的第二标签的值,所述第二标签的值对应于用户的第二标签信息,并且用户的第二标签与用户的第一标签相关联;以及第三训练单元,配置为,以所述第二组用户各自的第二特征向量和第二标签的值的集合作为第三训练集,训练所述第二分类器。本说明书另一方面提供一种获取多标签用户画像的装置,包括:第一获取单元,配置为,基于用户信息获取用户的第一特征向量;第一输入单元,配置为,将所述第一特征向量输入通过上述训练方法训练获得的第一分类器,获得所述用户的第一标签预测值,作为所述用户的第一标签的值;第二获取单元,配置为,将所述第一特征向量与所述第一标签的值组合,以获取所述用户的第二特征向量;以及第二输入单元,配置为,将所述第二特征向量输入通过上述训练方法训练获得的第二分类器,获得所述用户的第二标签预测值,作为所述用户的第二标签的值。通过根据本说明书实施例的用于获取多标签用户画像的上述方案,使得对于用户画像的各标签的学习更为准确可靠,也使得获取的多标签用户画像更加精确。附图说明通过结合附图描述本说明书实施例,可以使得本说明书实施例更加清楚:图1示出根据本说明书实施例的系统100的示意图;图2示出了根据本说明书实施例的一种训练链式分类器的方法;图3示出了根据本说本文档来自技高网...
一种获取多标签用户画像的方法和装置

【技术保护点】
1.一种训练用户画像分类器的方法,所述分类器是链式分类器,其包括第一分类器和第二分类器,所述用户画像为多标签用户画像,所述方法包括:获取第一组用户的各自的第一特征向量,所述第一特征向量对应于用户的信息,所述信息包括用户的注册信息、以及用户的操作历史信息;获取所述第一组用户各自的第一标签的值,所述第一标签的值对应于用户的第一标签信息;以所述第一组用户各自的第一特征向量和第一标签的值的集合作为第一训练集,训练第一分类器;将所述第一组用户各自的第一特征向量和第一标签的值组合,以获取所述第一组用户各自的第二特征向量;获取所述第一组用户各自的第二标签的值,所述第二标签的值对应于用户的第二标签信息,并且用户的第二标签与用户的第一标签相关联;以及以所述第一组用户各自的第二特征向量和第二标签的值的集合作为第二训练集,训练第二分类器。

【技术特征摘要】
1.一种训练用户画像分类器的方法,所述分类器是链式分类器,其包括第一分类器和第二分类器,所述用户画像为多标签用户画像,所述方法包括:获取第一组用户的各自的第一特征向量,所述第一特征向量对应于用户的信息,所述信息包括用户的注册信息、以及用户的操作历史信息;获取所述第一组用户各自的第一标签的值,所述第一标签的值对应于用户的第一标签信息;以所述第一组用户各自的第一特征向量和第一标签的值的集合作为第一训练集,训练第一分类器;将所述第一组用户各自的第一特征向量和第一标签的值组合,以获取所述第一组用户各自的第二特征向量;获取所述第一组用户各自的第二标签的值,所述第二标签的值对应于用户的第二标签信息,并且用户的第二标签与用户的第一标签相关联;以及以所述第一组用户各自的第二特征向量和第二标签的值的集合作为第二训练集,训练第二分类器。2.根据权利要求1所述的训练用户画像分类器的方法,其中所述用户的信息包括用户的标签信息。3.根据权利要求1所述的训练用户画像分类器的方法,其中所述第一标签是年龄,所述第二标签是购买偏好。4.根据权利要求1所述的训练用户画像分类器的方法,其中所述第一标签是购买偏好,所述第二标签是购买能力。5.一种训练用户画像分类器的方法,所述分类器是链式分类器,其包括第一分类器和第二分类器,其中所述第一分类器是通过根据权利要求1-4中任一项所述的方法训练获得的第一分类器,所述用户画像为多标签用户画像,所述方法包括:获取第二组用户的各自的第一特征向量,所述第二组用户包括不属于所述第一组用户的至少一个用户,所述第一特征向量对应于用户的信息,所述信息包括用户的注册信息、以及用户的操作历史信息;将所述第二组用户的各自的第一特征向量输入所述第一分类器,以获取所述第二组用户的各自的第一标签预测值;将所述第二组用户中每个用户的第一特征向量和第一标签预测值组合,以获取第二组用户各自的第二特征向量;获取第二组用户各自的第二标签的值,所述第二标签的值对应于用户的第二标签信息,并且用户的第二标签与用户的第一标签相关联;以及以所述第二组用户各自的第二特征向量和第二标签的值的集合作为第三训练集,训练第二分类器。6.一种获取多标签用户画像的方法,包括:基于用户信息获取用户的第一特征向量;将所述第一特征向量输入根据权利要求1-4中任一项的方法训练获得的第一分类器,获得所述用户的第一标签预测值,作为所述用户的第一标签的值;将所述第一特征向量与所述第一标签的值组合,以获取所述用户的第二特征向量;以及将所述第二特征向量输入根据权利要求1-5中任一项的方法训练获得的第二分类器,获得所述用户的第二标签预测值,作为所述用户的第二标签的值。7.根据权利要求6所述的获取多标签用户画像的方法,还包括,在基于用户信息获取用户的第一特征向量之后,在所述用户信息中包括所述第一标签信息的情况中,以所述第一标签信息的对应预设值替换所述第一标签预测值,作为所述用户的第一标签的值。8.根据权利要求6所述的获取多标签用户画像的方法,还包括,在获取所述用户的第二特征向量之后,在所述用户信息中包括所述第二标签信息的情况中,以所述第二标签信息的对应预设值替换所述第二标签预测值,作为所述用户的第二标签的值。9.一种训练用户画像分类器的装置,所述分类器是链式分类器,其包括第一分类器和第二分类器,所述用户画像为多标签用户画像,所述装置包括:第一获取单元,配置为,获取第一组用户的各自的第一特征向量,所...

【专利技术属性】
技术研发人员:张雅淋李龙飞
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1