一种用户分群方法、设备及存储介质技术

技术编号:38509534 阅读:8 留言:0更新日期:2023-08-19 16:54
本申请公开了一种用户分群方法、装置、设备及存储介质,包括:获取客户端创建的标签规则;所述标签规则包含所述客户端选取的多个预设标签及标签间的逻辑关系;如果多个所述预设标签的标签类型均为热标签,则在实时数仓中查询符合所述标签规则的用户群体;所述实时数仓中存储标签类型为热标签的用户数据;如果多个所述预设标签中存在标签类型为冷标签的标签,则在离线数仓中查询符合所述标签规则的用户群体;所述离线数仓中存储全部标签类型的用户数据。本申请可通过对标签进行冷热分离,利用不同的数据仓库存储不同标签类型的用户数据,并在此基础上针对不同标签类型采用不同的查询方案,能够实现秒级分群。能够实现秒级分群。能够实现秒级分群。

【技术实现步骤摘要】
一种用户分群方法、设备及存储介质


[0001]本专利技术涉及数据处理
,特别涉及一种用户分群方法、设备及存储介质。

技术介绍

[0002]目前,各种各样的软件应用会保存用户的相关数据。为对大量用户进行分析以把握用户群体需求,以便更好地推进后续业务,一般会为用户设置标签,并通过标签进行用户分群。例如,可为音乐软件产品的用户生成各种不同的标签,如年龄、性别、是否为vip用户、过去一周听歌次数、过去一周K歌次数等,进而业务人员可以根据需求圈选出符合一定要求的用户群体,然后为该群体推送一些运营活动,而圈选用户的过程便称为用户分群。然而,现有的用户分群方案存在查询逻辑复杂、查询速度慢(分钟级)、查询性能不稳定且存储空间占用较多的缺陷。
[0003]因此,上述技术问题亟待本领域技术人员解决。

技术实现思路

[0004]有鉴于此,本专利技术的目的在于提供一种用户分群方法、设备及存储介质,能够在降低存储空间占用率的基础上实现秒级分群。其具体方案如下:
[0005]本申请的第一方面提供了一种用户分群方法,包括:
[0006]获取客户端创建的标签规则;所述标签规则包含所述客户端选取的多个预设标签及标签间的逻辑关系;
[0007]如果多个所述预设标签的标签类型均为热标签,则在实时数仓中查询符合所述标签规则的用户群体;所述实时数仓中存储标签类型为热标签的用户数据;
[0008]如果多个所述预设标签中存在标签类型为冷标签的标签,则在离线数仓中查询符合所述标签规则的用户群体;所述离线数仓中存储全部标签类型的用户数据。
[0009]可选的,所述用户分群方法,还包括:
[0010]实时统计各所述预设标签被所述客户端选取的频次;
[0011]根据频次高低确定各所述预设标签的标签类型;标签类型为冷标签或热标签。
[0012]可选的,所述用户分群方法,还包括:
[0013]将所述离线数仓中标签类型为热标签的所述预设标签对应的用户数据实时同步至所述实时数仓,使得所述实时数仓中存储标签类型为热标签的用户数据。
[0014]可选的,所述将所述离线数仓中标签类型为热标签的所述预设标签对应的用户数据实时同步至所述实时数仓之后,还包括:
[0015]将同步的用户数据填充至在所述实时数仓中构建的目标竖表中,使得所述实时数仓中存储标签类型为热标签的用户数据;所述目标竖表的每一行至少存储一个所述预设标签、所述预设标签的一个标签值及一个包含具有所述预设标签和所述标签值的用户标识的序列。
[0016]可选的,所述目标竖表的每一行存储的用户标识的存储形式为位图格式。
[0017]可选的,所述在实时数仓中查询符合所述标签规则的用户群体,包括:
[0018]在所述实时数仓的所述目标竖表中查询出符合所述标签规则的用户标识。
[0019]可选地,所述在实时数仓中查询符合所述标签规则的用户群体,包括:
[0020]利用第一数据库引擎将所述标签规则转化为第一查询语句,并在所述实时数仓中执行所述第一查询语句以得到符合所述标签规则的用户群体;
[0021]所述在离线数仓中查询符合所述标签规则的用户群体,包括:
[0022]利用第二数据库引擎将所述标签规则转化为第二查询语句,并在所述离线数仓中执行所述第二查询语句以得到符合所述标签规则的用户群体。
[0023]可选的,所述用户分群方法,还包括:
[0024]将得到的符合所述标签规则的用户群体进行打包处理得到相应的人群包;
[0025]将所述人群包上传至云存储平台,以便所述客户端从所述云存储平台下载所述人群包。
[0026]本申请的第二方面提供了一种电子设备,所述电子设备包括处理器和存储器;其中所述存储器用于存储计算机程序,所述计算机程序由所述处理器加载并执行以实现前述用户分群方法。
[0027]本申请的第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现前述用户分群方法。
[0028]本申请中,先获取客户端创建的标签规则;所述标签规则包含所述客户端选取的多个预设标签及标签间的逻辑关系;如果多个所述预设标签的标签类型均为热标签,则在实时数仓中查询符合所述标签规则的用户群体;所述实时数仓中存储标签类型为热标签的用户数据;如果多个所述预设标签中存在标签类型为冷标签的标签,则在离线数仓中查询符合所述标签规则的用户群体;所述离线数仓中存储全部标签类型的用户数据。可见,本申请通过对标签进行冷热分离,利用不同的数据仓库存储不同标签类型的用户数据,以降低存储空间占用率,在此基础上针对不同标签类型采用不同的查询方案,从而将用户分群速度提升了一个数量级,实现秒级分群。
附图说明
[0029]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0030]图1为本申请提供的一种用户分群方法所适用的硬件组成框架示意图;
[0031]图2为本申请提供的一种用户分群方法流程图;
[0032]图3为本申请提供的一种具体的标签规则创建示例图;
[0033]图4为本申请提供的一种具体的用户分群方法流程图;
[0034]图5为本申请提供的一种具体的用户分群方法流程图;
[0035]图6为本申请提供的一种具体的实时数仓中的标签存储结构示例图;
[0036]图7为本申请提供的一种具体的标签规则创建示例图;
[0037]图8为本申请提供的一种具体的离线数仓中的标签存储结构示例图;
[0038]图9为本申请提供的一种具体的用户分群方法流程图;
[0039]图10为本申请提供的一种具体的用户分群方法示意图;
[0040]图11为本申请提供的一种具体的用户分群方法使用效果图;
[0041]图12为本申请提供的一种具体的用户分群方法使用效果图;
[0042]图13为本申请提供的一种用户分群装置结构示意图。
具体实施方式
[0043]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0044]现有的用户分群方案存在查询逻辑复杂、查询速度慢(分钟级)、查询性能不稳定及存储空间占用较多的缺陷。针对上述技术缺陷,本申请提供一种用户分群方案,通过对标签进行冷热分离,利用不同的数据仓库存储不同标签类型的用户数据,以降低存储空间占用率,在此基础上针对不同标签类型采用不同的查询方案,从而将用户分群速度提本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户分群方法,其特征在于,包括:获取客户端创建的标签规则;所述标签规则包含所述客户端选取的多个预设标签及标签间的逻辑关系;如果多个所述预设标签的标签类型均为热标签,则在实时数仓中查询符合所述标签规则的用户群体;所述实时数仓中存储标签类型为热标签的用户数据;如果多个所述预设标签中存在标签类型为冷标签的标签,则在离线数仓中查询符合所述标签规则的用户群体;所述离线数仓中存储全部标签类型的用户数据。2.根据权利要求1所述的用户分群方法,其特征在于,还包括:实时统计各所述预设标签被所述客户端选取的频次;根据频次高低确定各所述预设标签的标签类型;标签类型为冷标签或热标签。3.根据权利要求1所述的用户分群方法,其特征在于,还包括:将所述离线数仓中标签类型为热标签的所述预设标签对应的用户数据实时同步至所述实时数仓,使得所述实时数仓中存储标签类型为热标签的用户数据。4.根据权利要求3所述的用户分群方法,其特征在于,所述将所述离线数仓中标签类型为热标签的所述预设标签对应的用户数据实时同步至所述实时数仓之后,还包括:将同步的用户数据填充至在所述实时数仓中构建的目标竖表中,使得所述实时数仓中存储标签类型为热标签的用户数据;所述目标竖表的每一行至少存储一个所述预设标签、所述预设标签的一个标签值及一个包含具有所述预设标签和所述标签值的用户标识的序列。5.根据权利要求4所述的用户分群方法,其特征在于,所...

【专利技术属性】
技术研发人员:蒋明明徐晓波李革委胡鹏
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1