一种人群特征确定方法、装置、设备及存储介质制造方法及图纸

技术编号:38159665 阅读:9 留言:0更新日期:2023-07-13 09:31
本公开提供了一种人群特征确定方法、装置、设备及存储介质,涉及数据处理技术领域,尤其涉及大数据技术领域。具体实现方案为:获取基准日期对应的行为明细数据、所述基准日期对应的历史行业特征数据和历史品牌特征数据;根据所述行为明细数据、所述历史行业特征数据和所述历史品牌特征数据,确定基准日期对应的人群特征数据。通过上述技术方案,能够提高人群特征数据的确定效率。特征数据的确定效率。特征数据的确定效率。

【技术实现步骤摘要】
一种人群特征确定方法、装置、设备及存储介质


[0001]本公开涉及数据处理
,尤其涉及大数据


技术介绍

[0002]随着互联网技术的发展,各行各业每天都会产生大量的网络行为数据。在不同行业的品牌方如何快速高效地从海量网络行为数据中分析行为方(如消费者)的人群阶段,对于品牌方精细化运营至关重要。而这其中,如何快速且准确确定不同行为方的人群特征对于确定人群阶段也至关重要。

技术实现思路

[0003]本公开提供了一种人群特征确定方法、装置、设备及存储介质。
[0004]根据本公开的一方面,提供了一种人群特征确定方法,该方法包括:
[0005]获取基准日期对应的行为明细数据、所述基准日期对应的历史行业特征数据和历史品牌特征数据;
[0006]根据所述行为明细数据、所述历史行业特征数据和所述历史品牌特征数据,确定基准日期对应的人群特征数据。
[0007]根据本公开的另一方面,提供了一种人群特征确定装置,包括:
[0008]数据获取模块,用于获取基准日期对应的行为明细数据、所述基准日期对应的历史行业特征数据和历史品牌特征数据;
[0009]人群特征确定模块,用于根据所述行为明细数据、所述历史行业特征数据和所述历史品牌特征数据,确定基准日期对应的人群特征数据。
[0010]根据本公开的另一方面,提供了一种电子设备,该电子设备包括:
[0011]至少一个处理器;以及
[0012]与所述至少一个处理器通信连接的存储器;其中,
>[0013]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开任一实施例所述人群特征确定方法。
[0014]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行本公开任一实施例所述的人群特征确定方法。
[0015]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据本公开任一实施例所述的人群特征确定方法。
[0016]根据本公开的技术,能够提高人群特征的确定效率。
[0017]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0018]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0019]图1是根据本公开实施例提供的一种人群特征确定方法的流程图;
[0020]图2是根据本公开实施例提供的另一种人群特征确定方法的流程图;
[0021]图3是根据本公开实施例提供的又一种人群特征确定方法的流程图;
[0022]图4根据本公开实施例提供的一种人群特征确定装置的结构示意图;
[0023]图5是用来实现本公开实施例的人群特征确定方法的电子设备的框图。
具体实施方式
[0024]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0025]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“历史”、“目标”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0026]此外,还需要说明的是,本专利技术的技术方案中,所涉及的行为明细数据、行业特征数据和品牌特征数据等相关数据的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
[0027]从海量的用户行为日志中,实现O

AIIA人群的快速圈选和高效更新,以赋能品牌精细化运营。在O

AIIA人群资产经营方法论中,品牌方的人群资产被分为两个部分:O(Opportunity)机会人群:用于控制人群资产的总量;AIIA品牌资产人群:用于控制人群资产的结构。根据消费者和品牌方关系的远近关系定义为了解人群(aware)、兴趣人群(interest)、意向人群(intent)、转化人群(act)。
[0028]目前实现O

AIIA人群传统做法为:(1)各行业人群定制化建设。各品牌方由于产品性质不同,对应的用户行为也不尽相同,不同人群的圈选逻辑多样,涉及到维护圈定规则、识别触点类型、判定人群阶段等过程,每个步骤都仅与当前品牌相关,实现定制化开发。(2)基于用户行为明细数据圈定人群。AIIA人群判定是依据不同时间段的用户某类行为次数来判断。该方案对于上游各种来源的用户行为明细数据保存时间有比较严格的要求,计算过程中需要读入连续多天的数据,join操作涉及shuffle,shuffle操作需要大量的网络IO操作,任务计算时间长。(3)按需更新人群数据。由于计算成本较大,人群数据并非按天例行更新,大多是按月或按需进行更新。以机会人群为例:会一次性从多种来源的所有用户行为日志中筛选出与该品牌所在行业相关的用户id,作为机会人群,后续分析人群流转等场景都使用同一份数据。
[0029]传统方法存在以下缺点:(1)定制化开发维护成本大。不同行业人群圈定步骤基本
相同,开发过程中相似代码逻辑会维护在多个地方。如果需要更改共用的代码,需要改动多次,没有良好的拓展性。(2)计算资源和存储资源存在双重浪费。人群圈定各行业类似,需要依据用户某类行为在某段时间的次数是否达标,时间长度并不统一,少则需要近30天,多则长达365天甚至更长时间。如果通过明细数据直接圈定人群,一是读入的数据量会非常大,计算会额外消耗很多计算资源,而是对明细数据的存储时长提出了要求,至少需要存储1年,对存储资源也会造成浪费。(3)数据更新不及时无法快速反哺业务。机会人群应当是持续挖掘和扩展的过程,既要有进场策略(例如近一段周期产生行为或符合用户特征),也要有退场策略(例如历史上符合行为特征,但有较长时间未产生相关行为)。机会人群应该同行业共享,AIIA人群应该是机会人群的子集。在上述方案中,机会人群长时间不更新,一是会冗余已失效的人群、二是会遗漏最近发生过行为的人群,不利于真实体现各阶段人群流转情况。
[0030]图1是根据本公开实施例提供的一种人群特征确定方法的流程图。本实施例适本文档来自技高网...

【技术保护点】

【技术特征摘要】
天的触达次数;根据基准日期对应行为触点近一天的触达次数和基准日期对应行为触点近M

1天的触达次数,确定基准日期对应行为触点近M天的触达次数。6.根据权利要求4所述的方法,其中,所述根据基准日期对应的行为触点近一天的触达次数、基准日期对应的行为触点近M天的触达次数,确定行为触点对应行为方所属的目标人群阶段,包括:根据基准日期对应的行为触点近一天的触达次数和基准日期对应的行为触点近M天的触达次数,确定基准日期的行为统计数据;去除基准日期的行为统计数据中的无效数据,得到处理后的行为统计数据;基于预设人群阶段判断模型,根据处理后的行为统计数据,确定行为触点对应行为方所属的目标人群阶段。7.一种人群特征确定装置,包括:数据获取模块,用于获取基准日期对应的行为明细数据、所述基准日期对应的历史行业特征数据和历史品牌特征数据;人群特征确定模块,用于根据所述行为明细数据、所述历史行业特征数据和所述历史品牌特征数据,确定基准日期对应的人群特征数据。8.根据权利要求7所述的装置,其中,所述人群特征确定模块,包括:行业特征确定单元,用于根据所述行为明细数据和所述历史行业特征数据,确定基准日期对应的目标行业特征数据;其中,所述历史行业特征数据包括基准日期前一天对应的行业特征数据;品牌特征确定单元,用于根据所述行为明细数据和所述历史品牌特征数据,确定基准日期对应的目标品牌特征数据;其中,所述历史品牌特征数据包括基准日期前一天对应的品牌特征数据和基准日期前M天对应的品牌特征数据;M为大于1的自然数;人群特征确定单元,用于根据所述目标行业特征数据和所述目标品牌特征数据,确定基准日期对应的人群特征数据。9.根据权利要求8所述的装置,其中,所述行业特征确定单元具体用于:从所述行为明细数据中筛选出基准日期对应的行业数据;其中,所述行业数据包括基准日期的行业信息和行为方信息;从基准日期前一天对应的行业特征数据中,选择出在固定时间跨度内日期最靠前的新增行为方数据,并删除所述新增行为方数据,得到处理后的历史行业特征数据;根据处理后的历史行业特征数据和所述基准日期对应的行业数据,确定基准日期对应的目标行业特征数据。10.根据权利要求8所述的装置,其中,所述品牌特征确定单元,包括:第一触达次数确定子单元,用于根据所述行为明细数据和基准日期前一天对应的品牌特征数据,确定基准...

【专利技术属性】
技术研发人员:蔺萍叶玮彬刘涛
申请(专利权)人:百度时代网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1