用户分类方法、装置、电子设备及存储介质制造方法及图纸

技术编号:39320609 阅读:10 留言:0更新日期:2023-11-12 16:01
本发明专利技术提供一种用户分类方法、装置、电子设备及存储介质,通过目标掩码,将各总访问时长进行分桶存储,不仅可以更有效的使用存储空间,还可以通过目标掩码的使用,提高分桶存储的效率。由于各桶的引入,在该访问时长分位数的计算步骤中,并不需要对各总访问时长进行全量排序或构建全量索引,可以降低计算访问时长分位数的时延,提高访问时长分位数的计算效率。相比于现有技术中采用给定访问时长阈值对用户进行分类,采用访问时长分位数可以考虑各用户的总访问时长之间的关系,可以使用户的分类结果更加准确,为后续向用户推荐合适的服务信息。信息。信息。

【技术实现步骤摘要】
用户分类方法、装置、电子设备及存储介质


[0001]本专利技术涉及用户分类
,尤其涉及一种用户分类方法、装置、电子设备及存储介质。

技术介绍

[0002]为保持用户对应用程序(Application,APP)的黏着程度(即用户粘度),提供APP的服务方一般会以用户对APP的访问时长作为衡量指标,来衡量用户对APP的黏着程度。
[0003]在确定用户对APP的访问时长之后,对用户进行分类,以便于为用户推荐合适的服务信息。在该过程中,通常情况是通过给定访问时长阈值对用户进行分类。这种方法虽然可以实现用户分类,但是容易导致分类不准确,进而导致无法为用户推荐合适的服务信息。
[0004]为此,现急需提供一种用户分类方法。

技术实现思路

[0005]本专利技术提供一种用户分类方法、装置、电子设备及存储介质,用以解决现有技术中存在的缺陷。
[0006]本专利技术提供一种用户分类方法,包括:
[0007]获取每个用户对目标对象的总访问时长,并基于目标掩码,将各总访问时长进行分桶存储;
[0008]基于总访问时长数量以及预设分位,确定所述预设分位对应的初始位置,并基于所述初始位置以及各桶中的元素数量,计算所述预设分位处的访问时长分位数;
[0009]基于所述各总访问时长以及所述访问时长分位数,对各用户进行分类。
[0010]根据本专利技术提供的一种用户分类方法,所述基于所述初始位置以及各桶中的元素数量,计算所述预设分位处的访问时长分位数,具体包括:
>[0011]基于各桶的标识,对各桶进行排序,得到第一排序结果;
[0012]从所述第一排序结果中的第一个桶开始,基于当前位置与当前桶中的元素数量之间的差异信息,确定所述各桶中的目标桶以及所述预设分位在所述目标桶内的目标位置;所述当前位置基于所述当前位置的前一位置对应的差异信息确定,所述当前位置的初始值为所述初始位置;
[0013]对所述目标桶中的各元素进行排序,得到第二排序结果;
[0014]基于所述目标位置以及所述第二排序结果,确定所述访问时长分位数。
[0015]根据本专利技术提供的一种用户分类方法,所述基于目标掩码,将各总访问时长进行分桶存储,包括:
[0016]基于所述目标掩码,将每个总访问时长划分为索引段以及内容段;
[0017]采用多线程,将每个总访问时长的内容段存储至以所述索引段为标识的桶中。
[0018]根据本专利技术提供的一种用户分类方法,所述基于所述目标掩码,将每个总访问时长划分为索引段以及内容段,包括:
[0019]基于所述目标掩码的非零位数,采用移位运算方式以及逻辑运算方式,将每个总访问时长划分为索引段以及内容段。
[0020]根据本专利技术提供的一种用户分类方法,所述基于所述总访问时长数量以及所述预设分位,确定所述访问时长分位数对应的初始位置,之前包括:
[0021]将各桶存储至内存中;
[0022]若所述内存的容量不足,则从所述各桶中选取内容段数量大于所述目标掩码对应的数量阈值的桶写入磁盘。
[0023]根据本专利技术提供的一种用户分类方法,所述目标掩码基于如下方法确定:
[0024]根据所述总访问时长数量和所述各总访问时长的内容段,确定最优掩码范围;
[0025]确定所述最优掩码范围内的任一个掩码为所述目标掩码。
[0026]根据本专利技术提供的一种用户分类方法,所述基于所述各总访问时长以及所述访问时长分位数,对各用户进行分类,之后包括:
[0027]基于所述各用户对应的分类结果,为所述各用户进行服务信息推荐。
[0028]本专利技术还提供一种用户分类装置,包括:
[0029]分桶存储模块,用于获取每个用户对目标对象的总访问时长,并基于目标掩码,将各总访问时长进行分桶存储;
[0030]分位数计算模块,用于基于总访问时长数量以及预设分位,确定所述预设分位对应的初始位置,并基于所述初始位置以及各桶中的元素数量,计算所述预设分位处的访问时长分位数;
[0031]分类模块,用于基于所述各总访问时长以及所述访问时长分位数,对各用户进行分类。
[0032]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述的用户分类方法。
[0033]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述的用户分类方法。
[0034]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述的用户分类方法。
[0035]本专利技术提供的用户分类方法、装置、电子设备及存储介质,通过目标掩码,将各总访问时长进行分桶存储,不仅可以更有效的使用存储空间,还可以通过目标掩码的使用,提高分桶存储的效率。由于各桶的引入,在该访问时长分位数的计算步骤中,并不需要对各总访问时长进行全量排序或构建全量索引,可以降低计算访问时长分位数的时延,提高访问时长分位数的计算效率。相比于现有技术中采用给定访问时长阈值对用户进行分类,采用访问时长分位数可以考虑各用户的总访问时长之间的关系,可以使用户的分类结果更加准确,为后续向用户推荐合适的服务信息。
附图说明
[0036]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图,对于本领域普
通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0037]图1是本专利技术提供的用户分类方法的流程示意图;
[0038]图2是本专利技术提供的用户分类装置的结构示意图;
[0039]图3是本专利技术提供的电子设备的结构示意图。
具体实施方式
[0040]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术中的附图,对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0041]由于现有技术中,在确定用户对应用程序(Application,APP)的访问时长之后,通常通过给定访问时长阈值对用户进行分类。这种方法导致分类不准确,进而导致无法为用户推荐合适的服务信息。为此,本专利技术实施例中提供了一种用户分类方法。
[0042]图1为本专利技术实施例中提供的一种用户分类方法的流程示意图,如图1所示,该方法包括:
[0043]S11,获取每个用户对目标对象的总访问时长,并基于目标掩码,将各总访问时长进行分桶存储;
[0044]S12,基于总访问时长数量以及预设分位,确定所述预设分位对应的初始位置,并基于所述初始位置以及各桶中的元素数量,计算所述预设分位处的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用户分类方法,其特征在于,包括:获取每个用户对目标对象的总访问时长,并基于目标掩码,将各总访问时长进行分桶存储;基于总访问时长数量以及预设分位,确定所述预设分位对应的初始位置,并基于所述初始位置以及各桶中的元素数量,计算所述预设分位处的访问时长分位数;基于所述各总访问时长以及所述访问时长分位数,对各用户进行分类。2.根据权利要求1所述的用户分类方法,其特征在于,所述基于所述初始位置以及各桶中的元素数量,计算所述预设分位处的访问时长分位数,具体包括:基于各桶的标识,对各桶进行排序,得到第一排序结果;从所述第一排序结果中的第一个桶开始,基于当前位置与当前桶中的元素数量之间的差异信息,确定所述各桶中的目标桶以及所述预设分位在所述目标桶内的目标位置;所述当前位置基于所述当前位置的前一位置对应的差异信息确定,所述当前位置的初始值为所述初始位置;对所述目标桶中的各元素进行排序,得到第二排序结果;基于所述目标位置以及所述第二排序结果,确定所述访问时长分位数。3.根据权利要求1所述的用户分类方法,其特征在于,所述基于目标掩码,将各总访问时长进行分桶存储,包括:基于所述目标掩码,将每个总访问时长划分为索引段以及内容段;采用多线程,将每个总访问时长的内容段存储至以所述索引段为标识的桶中。4.根据权利要求3所述的用户分类方法,其特征在于,所述基于所述目标掩码,将每个总访问时长划分为索引段以及内容段,包括:基于所述目标掩码的非零位数,采用移位运算方式以及逻辑运算方式,将每个总访问时长划分为索引段以及内容段。5.根据权利要求1

4中任一项所述的用户分类方法,其特征在...

【专利技术属性】
技术研发人员:张博徐煦张伟朱宇昕
申请(专利权)人:中移系统集成有限公司中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1