数据处理方法及装置、存储介质、电子设备制造方法及图纸

技术编号:29967364 阅读:13 留言:0更新日期:2021-09-08 09:37
本公开属于计算机技术领域,涉及一种数据处理方法及装置、存储介质、电子设备。该方法包括:获取账号信息以及与账号信息对应的分组规则,并按照分组规则对账号信息进行分组处理得到用户数据;获取与用户数据对应的用户行为数据,并按照用户行为数据对用户数据进行位图表征处理得到行为位图;获取确定目标用户的筛选条件,并按照筛选条件对行为位图进行位图计算确定目标用户和目标用户的用户数量。本公开降低了数据急剧增长带来的存储和计算压力,对数据的存储、处理、传输和读取性能都有大幅度提升,满足了高时效性应用场景的要求;进一步的,不仅支持了多种查询操作,且查询语句简易,能够最大化的利用计算资源,避免了计算资源浪费的情况发生。的情况发生。的情况发生。

【技术实现步骤摘要】
数据处理方法及装置、存储介质、电子设备


[0001]本公开涉及计算机
,尤其涉及一种数据处理方法与数据处理装置、计算机可读存储介质及电子设备。

技术介绍

[0002]对于企业的运营平台,其中一个重要功能是广告主和采销等可以圈选关注人群,并对关注人群进行分析或者广告投放等操作,以实现品牌业务增长或者其他效果。在技术实现方面,之前运营平台采用离线计算的方式圈选人群,极大地依赖hadoop和spark等离线计算框架。运营平台会将用户输入的圈人条件转化为能在离线计算框架上执行的SQL(Structured Query Language,结构化查询语言)语句,并进行提交,以使离线计算框架进行计算和输出结果。
[0003]但是,这种方案生成一个人群通常需要15

30分钟,在任务量激增的极端情况可能还会超过1个小时,无法支持海量数据的查询,时效性和用户体验都太差。并且,用户进行人群圈选只能知道圈选条件下的人群规模,90%的圈选人群不会进行广告触达,无法完成广告投放等目的,极大地浪费了计算资源。
[0004]鉴于此,本领域亟需开发一种新的数据处理方法及装置。
[0005]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0006]本公开的目的在于提供一种数据处理方法、数据处理装置、计算机可读存储介质及电子设备,进而至少在一定程度上克服由于相关技术的限制而导致的时效性差和计算资源浪费的技术问题。
[0007]本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
[0008]根据本专利技术实施例的第一个方面,提供一种数据处理方法,所述方法包括:获取账号信息以及与所述账号信息对应的分组规则,并按照所述分组规则对所述账号信息进行分组处理得到用户数据;
[0009]获取与所述用户数据对应的用户行为数据,并按照所述用户行为数据对所述用户数据进行位图表征处理得到行为位图;
[0010]获取确定目标用户的筛选条件,并按照所述筛选条件对所述行为位图进行位图计算确定所述目标用户和所述目标用户的用户数量。
[0011]在本专利技术的一种示例性实施例中,所述按照所述分组规则对所述账号信息进行分组处理得到用户数据,包括:
[0012]确定所述分组规则中规定的分组数;
[0013]按照所述分组数对所述账号信息进行分组处理得到用户数据。
[0014]在本专利技术的一种示例性实施例中,所述按照所述分组数对所述账号信息进行分组处理得到用户数据,包括:
[0015]按照所述分组数对所述账号信息进行账号计算得到账号计算结果;
[0016]对所述账号计算结果进行哈希计算得到分组标识以及与所述分组标识对应的用户数据。
[0017]在本专利技术的一种示例性实施例中,所述按照所述用户行为数据对所述用户数据进行位图表征处理得到行为位图,包括:
[0018]对所述账号信息进行索引配置处理得到具有索引的账号信息;
[0019]基于所述索引,按照所述用户行为数据对所述用户数据进行位图表征处理得到行为位图。
[0020]在本专利技术的一种示例性实施例中,所述按照所述筛选条件对所述行为位图进行位图计算确定所述目标用户和所述目标用户的用户数量,包括:
[0021]当所述筛选条件为多个时,确定所述行为位图为多个;
[0022]当所述用户数据为一组时,对多个所述行为位图进行位图计算确定所述目标用户和所述目标用户的用户数量。
[0023]在本专利技术的一种示例性实施例中,所述按照所述筛选条件对所述行为位图进行位图计算确定所述目标用户和所述目标用户的用户数量,包括:
[0024]当所述筛选条件为多个时,确定所述行为位图为多个;
[0025]当所述用户数据为多组时,按照分组标识对多个所述行为位图进行位图计算确定多个单一条件用户和所述多个单一条件用户的多个单一用户数量;
[0026]对所述多个单一条件用户进行连接处理得到目标用户,并对所述多个单一用户数量进行数量计算得到所述目标用户的用户数量。
[0027]在本专利技术的一种示例性实施例中,所述方法还包括:
[0028]当所述筛选条件为一个时,确定所述行为位图为一个;
[0029]对所述行为位图进行表征含义识别得到目标用户和所述目标用户的用户数量。
[0030]根据本专利技术实施例的第二个方面,提供一种数据处理装置,所述装置包括:分组处理模块,被配置为获取账号信息以及与所述账号信息对应的分组规则,并按照所述分组规则对所述账号信息进行分组处理得到用户数据;
[0031]位图表征模块,被配置为获取与所述用户数据对应的用户行为数据,并按照所述用户行为数据对所述用户数据进行位图表征处理得到行为位图;
[0032]用户确定模块,被配置为获取确定目标用户的筛选条件,并按照所述筛选条件对所述行为位图进行位图计算确定所述目标用户和所述目标用户的用户数量。
[0033]根据本专利技术实施例的第三个方面,提供一种电子设备,包括:处理器和存储器;其中,存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现上述任意示例性实施例的数据处理方法。
[0034]根据本专利技术实施例的第四个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意示例性实施例中的数据处理方法。
[0035]由上述技术方案可知,本专利技术示例性实施例中的数据处理方法、数据处理装置、计
算机存储介质及电子设备至少具备以下优点和积极效果:
[0036]在本公开的示例性实施例提供的方法及装置中,一方面,对账号信息进行分组处理得到用户数据,在解决数据存储量的同时,降低了存储消耗,至少满足了未来数百亿量级的数据存储需求。另一方面,对用户数据进行位图表征处理得到行为位图,极大地降低了数据急剧增长带来的存储和计算压力,对数据的存储、处理、传输和读取性能都有大幅度提升,满足了高时效性应用场景的要求;进一步的,对行为位图进行位图计算得到目标用户和用户数量,不仅支持了多种查询操作,且查询语句简易,易于理解,还能够最大化的利用计算资源,避免了计算资源浪费的情况发生。
[0037]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
[0038]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0039]图1示意性示出本公开示例性实施例中一种数据处理方法的流程示意图;
[0040]图2示意性示出本公开示例性实施例中按照分组规本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取账号信息以及与所述账号信息对应的分组规则,并按照所述分组规则对所述账号信息进行分组处理得到用户数据;获取与所述用户数据对应的用户行为数据,并按照所述用户行为数据对所述用户数据进行位图表征处理得到行为位图;获取确定目标用户的筛选条件,并按照所述筛选条件对所述行为位图进行位图计算确定所述目标用户和所述目标用户的用户数量。2.根据权利要求1所述的数据处理方法,其特征在于,所述按照所述分组规则对所述账号信息进行分组处理得到用户数据,包括:确定所述分组规则中规定的分组数;按照所述分组数对所述账号信息进行分组处理得到用户数据。3.根据权利要求2所述的数据处理方法,其特征在于,所述按照所述分组数对所述账号信息进行分组处理得到用户数据,包括:按照所述分组数对所述账号信息进行账号计算得到账号计算结果;对所述账号计算结果进行哈希计算得到分组标识以及与所述分组标识对应的用户数据。4.根据权利要求3所述的数据处理方法,其特征在于,所述按照所述用户行为数据对所述用户数据进行位图表征处理得到行为位图,包括:对所述账号信息进行索引配置处理得到具有索引的账号信息;基于所述索引,按照所述用户行为数据对所述用户数据进行位图表征处理得到行为位图。5.根据权利要求3所述的数据处理方法,其特征在于,所述按照所述筛选条件对所述行为位图进行位图计算确定所述目标用户和所述目标用户的用户数量,包括:当所述筛选条件为多个时,确定所述行为位图为多个;当所述用户数据为一组时,对多个所述行为位图进行位图计算确定所述目标用户和所述目标用户的用户数量。6.根据权利要求4所述的数据处理方法,其...

【专利技术属性】
技术研发人员:董哲梅焕马永生
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1