System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 账号数据集的处理方法、装置和存储介质及电子设备制造方法及图纸_技高网

账号数据集的处理方法、装置和存储介质及电子设备制造方法及图纸

技术编号:40353011 阅读:7 留言:0更新日期:2024-02-09 14:37
本申请公开了一种账号数据集的处理方法、装置和存储介质及电子设备。其中,该方法包括:获取全量账号数据集,其中,全量账号数据集中包括至少一条行为数据,行为数据由账号标识、第一时间标识、第二时间标识,和类型标识序列组成,账号标识用于指示行为数据所属的用户账号,第一时间标识用于指示开始写入行为数据的第一时间点,第二时间标识用于指示最后更新行为数据的第二时间点,从第一时间点至第二时间点之间包含N个单位时间点;响应于对全量账号数据集执行的数据处理请求,从全量账号数据集中筛选或统计出自定义数据集,可应用在云技术场景,涉及大数据等技术。本申请解决了账号数据集的处理效率较低的技术问题。

【技术实现步骤摘要】

本申请涉及计算机领域,具体而言,涉及一种账号数据集的处理方法、装置和存储介质及电子设备


技术介绍

1、在账号数据集的处理场景中,通常会先利用二进制全量储存的方式,构建账号数据集,但二进制构建的账号数据集,对于一个维度数据通常只能包含0或1两种状态,如同一维度下用户有多种的行为类型(a/b/c),则需要更多的维度来表示和计算(是否为a/是否为b/是否为c);且二进制储存只能储存64位的行为类型,无法储存更多数据,若维度为日期,则一个字段只能够储存用户在64天内的行为类型,而实际业务场景中往往需要考虑至少1年或更长的时间周期,此时也需要更多个字段(1-64天,65-128天)来表示和存储用户的行为类型。

2、由此可见,若想二进制构建的账号数据集适用于实际业务场景,则需要构建出较大量级的账号数据集,而较大量级的账号数据集不利于数据处理的高效执行,进而导致账号数据集的处理效率较低的问题出现。因此,存在账号数据集的处理效率较低的问题。

3、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本申请实施例提供了一种账号数据集的处理方法、装置和存储介质及电子设备,以至少解决账号数据集的处理效率较低的技术问题。

2、根据本申请实施例的一个方面,提供了一种账号数据集的处理方法,包括:获取全量账号数据集,其中,上述全量账号数据集中包括至少一条行为数据,上述行为数据由账号标识、第一时间标识、第二时间标识,和类型标识序列组成,上述账号标识用于指示上述行为数据所属的用户账号,上述第一时间标识用于指示开始写入上述行为数据的第一时间点,上述第二时间标识用于指示最后更新上述行为数据的第二时间点,从上述第一时间点至上述第二时间点之间包含n个单位时间点,上述类型标识序列包括n个按序排列的类型标识,上述类型标识用于指示上述用户账号在对应的上述单位时间点执行的行为所属的行为类型,n为大于或等于2的整数;响应于对上述全量账号数据集执行的数据处理请求,从上述全量账号数据集中筛选或统计出自定义数据集,其中,上述数据处理请求用于请求按照自定义条件对上述全量账号数据集进行筛选或统计,上述自定义数据集中包括与上述自定义条件匹配的行为数据。

3、根据本申请实施例的另一方面,还提供了一种账号数据集的处理装置,包括:获取单元,用于获取全量账号数据集,其中,上述全量账号数据集中包括至少一条行为数据,上述行为数据由账号标识、第一时间标识、第二时间标识,和类型标识序列组成,上述账号标识用于指示上述行为数据所属的用户账号,上述第一时间标识用于指示开始写入上述行为数据的第一时间点,上述第二时间标识用于指示最后更新上述行为数据的第二时间点,从上述第一时间点至上述第二时间点之间包含n个单位时间点,上述类型标识序列包括n个按序排列的类型标识,上述类型标识用于指示上述用户账号在对应的上述单位时间点执行的行为所属的行为类型,n为大于或等于2的整数;处理单元,用于响应于对上述全量账号数据集执行的数据处理请求,从上述全量账号数据集中筛选或统计出自定义数据集,其中,上述数据处理请求用于请求按照自定义条件对上述全量账号数据集进行筛选或统计,上述自定义数据集中包括与上述自定义条件匹配的行为数据。

4、作为一种可选的方案,上述处理单元,包括:筛选模块,用于响应于对上述全量账号数据集执行的数据筛选请求,从上述全量账号数据集中筛选出自定义时间数据集,其中,上述数据处理请求包括上述数据筛选请求,上述自定义数据集包括上述自定义时间数据集,上述数据筛选请求用于请求从上述全量账号数据集中筛选出第一自定义时间点与第二自定义时间点之间的行为数据,上述第一自定义时间点与第二自定义时间点之间包括自定义时间段,上述自定义条件包括上述至少两个自定义时间点之间的筛选条件,上述自定义时间数据集中包括上述自定义时间段内的行为数据。

5、作为一种可选的方案,上述装置还包括以下至少之一:第一确定模块,用于在上述从上述全量账号数据集中筛选出自定义时间数据集之前,在上述第一自定义时间点位于上述第一时间点之前、上述第二自定义时间点位于上述第二时间点之后的情况下,将上述第一时间点与上述第二时间点之间的时间段确定为上述自定义时间段;第二确定模块,用于在上述从上述全量账号数据集中筛选出自定义时间数据集之前,在上述第一自定义时间点位于上述第一时间点之后、上述第二自定义时间点位于上述第二时间点之后的情况下,将上述第一自定义时间点与上述第二时间点之间的时间段确定为上述自定义时间段;第三确定模块,用于在上述从上述全量账号数据集中筛选出自定义时间数据集之前,在上述第一自定义时间点位于上述第一时间点之后、上述第二自定义时间点位于上述第二时间点之前的情况下,将上述第一自定义时间点与上述第二自定义时间点之间的时间段确定为上述自定义时间段;第四确定模块,用于在上述从上述全量账号数据集中筛选出自定义时间数据集之前,在上述第一自定义时间点位于上述第一时间点之前、上述第二自定义时间点位于上述第二时间点之前的情况下,将上述第一时间点与上述第二自定义时间点之间的时间段确定为上述自定义时间段。

6、作为一种可选的方案,上述处理单元,包括:统计模块,用于响应于对上述全量账号数据集执行的数据统计请求,对上述全量账号数据集进行汇总计算,得到自定义类型数据集,其中,上述数据处理请求包括上述数据统计请求,上述自定义数据集包括上述自定义类型数据集,上述数据统计请求用于请求利用上述自定义统计条件对上述全量账号数据集中的行为数据进行汇总计算,上述自定义统计条件为依据上述行为类型自定义得到的统计条件,上述自定义条件包括上述自定义统计条件,上述自定义类型数据集中包括满足上述自定义统计条件的行为数据。

7、作为一种可选的方案,上述统计模块,包括:第一统计模块,用于在上述行为类型包括第一类型和第二类型、且上述自定义统计条件为统计各个上述用户账号最高行为优先级的行为类型的情况下,将上述类型标识指示上述第一类型和上述第二类型的用户账号最高行为优先级的行为类型确定为上述第二类型,以及将上述类型标识指示上述第一类型的用户账号最高行为优先级的行为类型确定为上述第一类型,其中,上述第二类型的行为优先级高于上述第一类型的行为优先级。

8、作为一种可选的方案,上述统计模块,包括:第二统计模块,用于在上述自定义统计条件为统计的上述行为类型发生变更的第一用户账号的情况下,将上述类型标识序列上存在连续且不同的至少两个上述类型标识的用户账号,确定为上述第一用户账号。

9、作为一种可选的方案,上述统计模块,包括:第三统计模块,用于在上述自定义统计条件为统计上述类型标识序列上以相同的类型标识为起点和终点之间的范围行为数据的情况下,获取上述类型标识序列上存在的上述相同的类型标识为起点和终点之间的至少一个类型标识,并将上述至少一个类型标识确定为上述范围行为数据。

10、作为一种可选的方案,上述装置还包括:确定单元,用于在上述获取全量账号数据集之后,在获取到任一用户账号新的行为数据的情本文档来自技高网...

【技术保护点】

1.一种账号数据集的处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述响应于对所述全量账号数据集执行的数据处理请求,从所述全量账号数据集中筛选或统计出自定义数据集,包括:

3.根据权利要求2所述的方法,其特征在于,在所述从所述全量账号数据集中筛选出自定义时间数据集之前,所述方法还包括以下至少之一:

4.根据权利要求1所述的方法,其特征在于,所述响应于对所述全量账号数据集执行的数据处理请求,从所述全量账号数据集中筛选或统计出自定义数据集,包括:

5.根据权利要求4所述的方法,其特征在于,所述对所述全量账号数据集进行汇总计算,得到自定义类型数据集,包括:

6.根据权利要求4所述的方法,其特征在于,所述对所述全量账号数据集进行汇总计算,得到自定义类型数据集,包括:

7.根据权利要求4所述的方法,其特征在于,所述对所述全量账号数据集进行汇总计算,得到自定义类型数据集,包括:

8.根据权利要求1至7中任一项所述的方法,其特征在于,在所述获取全量账号数据集之后,所述方法还包括:>

9.根据权利要求1至7中任一项所述的方法,其特征在于,

10.一种账号数据集的处理装置,其特征在于,包括:

11.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序被电子设备运行时执行所述权利要求1至9任一项中所述的方法。

12.一种电子设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至9任一项中所述的方法。

...

【技术特征摘要】

1.一种账号数据集的处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述响应于对所述全量账号数据集执行的数据处理请求,从所述全量账号数据集中筛选或统计出自定义数据集,包括:

3.根据权利要求2所述的方法,其特征在于,在所述从所述全量账号数据集中筛选出自定义时间数据集之前,所述方法还包括以下至少之一:

4.根据权利要求1所述的方法,其特征在于,所述响应于对所述全量账号数据集执行的数据处理请求,从所述全量账号数据集中筛选或统计出自定义数据集,包括:

5.根据权利要求4所述的方法,其特征在于,所述对所述全量账号数据集进行汇总计算,得到自定义类型数据集,包括:

6.根据权利要求4所述的方法,其特征在于,所述对所述全量账号数据集进行汇总计算,得到自定...

【专利技术属性】
技术研发人员:卢帆扬秦江
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1