用户分群方法、装置、计算机设备和介质制造方法及图纸

技术编号:25949029 阅读:21 留言:0更新日期:2020-10-17 03:41
本公开提供了一种用户分群方法,涉及人工智能领域,具体涉及大数据领域的数据挖掘技术。该方法包括:获取预定用户群体的分群条件,分群条件包括:时间筛选条件和事件筛选条件;基于时间筛选条件,确定用户行为数据库中的每条用户行为数据的至少一个目标时间段;针对每条用户行为数据,基于该条用户行为数据和该条用户行为数据的至少一个目标时间段中的每个目标时间段,确定该条用户行为数据关于每个目标时间段的关联数据,以由关联数据构成关联表;并且,基于待测时间和事件筛选条件,从关联表中筛选针对待测时间的目标关联数据,以根据目标关联数据确定属于预定用户群体的目标用户。本公开还提供了用户分群装置、计算机设备和介质。

【技术实现步骤摘要】
用户分群方法、装置、计算机设备和介质
本公开涉及人工智能领域,具体涉及大数据领域的数据挖掘技术。更具体地,本公开提供了一种用户分群方法、装置、计算机设备和介质。
技术介绍
用户分群是指依据业务场景的需要对用户进行筛选,过滤出符合预定分群条件的目标用户群体的过程。用户分群结果可以用于网站或应用(application)关于用户群体的用户行为分析过程中。通常可以根据用户数据进行用户分群,用户数据可以包括用户属性数据和用户行为数据。在基于用户行为数据的用户分群方案中,现有技术需要针对每个预定时间段例行一次针对用户行为数据库的查询和存储的逻辑,导致占用大量的计算资源和存储空间,且灵活性较差。
技术实现思路
有鉴于此,本公开提供了一种用户分群方法、装置、计算机设备和介质。本公开的一个方面提供了一种用户分群方法,包括:获取预定用户群体的分群条件,分群条件包括:时间筛选条件和事件筛选条件;基于时间筛选条件,确定用户行为数据库中的每条用户行为数据的至少一个目标时间段;针对每条用户行为数据,基于该条用户行为数据和该条用户行为数据的至少一个目标时间段中的每个目标时间段,确定该条用户行为数据关于每个目标时间段的关联数据,以由关联数据构成关联表;并且,基于待测时间和事件筛选条件,从关联表中筛选针对待测时间的目标关联数据,以根据目标关联数据确定属于预定用户群体的目标用户。本公开的另一方面提供了一种用户分群装置,包括:获取模块、第一确定模块、第二确定模块和分群模块。获取模块用于获取预定用户群体的分群条件,分群条件包括:时间筛选条件和事件筛选条件。第一确定模块用于基于时间筛选条件,确定用户行为数据库中的每条用户行为数据的至少一个目标时间段。第二确定模块用于针对每条用户行为数据,基于该条用户行为数据和该条用户行为数据的至少一个目标时间段中的每个目标时间段,确定该条用户行为数据关于每个目标时间段的关联数据,以由关联数据构成关联表。分群模块用于基于待测时间和事件筛选条件,从关联表中筛选针对待测时间的目标关联数据,以根据目标关联数据确定属于预定用户群体的目标用户。本公开的另一方面提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述的方法。本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。根据本公开实施例的用户分群方法在每条用户行为数据产生后,根据分群条件中的时间筛选条件从该条用户行为数据推算出该条用户行为数据所对应的所有可能的目标时间段。并根据每条用户行为数据和目标时间段之间的关联关系来构建关联表,关联表中的每条关联数据用于表征一条用户行为数据和该条用户行为数据的一个目标时间段之间的关联关系符合上述时间筛选条件,从而使得关联表能够涵盖已有的所有符合上述时间筛选条件的关联数据。再基于关联表中符合待测时间和事件筛选条件的目标关联数据,确定预定用户群体的目标用户。上述过程可以在每次产生新的用户行为数据时针对该新的用户行为数据执行,相比于相关技术中从目标时间段的角度出发,关于每个预定时间段进行一次用户行为数据库整体的遍历式查询和存储的方案,可以有效节省计算资源和存储空间。附图说明通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:图1示意性示出了根据本公开实施例的应用用户分群方法和装置的示例性系统架构;图2示意性示出了根据本公开实施例的用户分群方法的流程图;图3示意性示出了根据本公开另一实施例的用户分群方法的示例流程图;图4示意性示出了根据本公开实施例的用户分群过程的示例示意图;图5示意性示出了根据本公开实施例的用户分群装置的框图;以及图6示意性示出了根据本公开实施例的计算机设备的框图。具体实施方式以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。本公开的实施例提供了一种用户分群方法、装置、计算机设备和介质。该用户分群方法可以包括获取过程、第一确定过程、第二确定过程和分群过程。在获取过程中,获取预定用户群体的分群条件,该分群条件可以包括:时间筛选条件和事件筛选条件。然后进行第一确定过程,基于时间筛选条件,确定用户行为数据库中的每条用户行为数据的至少一个目标时间段。接着进行第二确定过程,针对每条用户行为数据,基于该条用户行为数据和该条用户行为数据的至少一个目标时间段中的每个目标时间段,确定该条用户行为数据关于每个目标时间段的关联数据,以由关联数据构成关联表。再进行分群过程,基于待测时间和事件筛选条件,从关联表中筛选针对待测时间的目标关联数据,以根据目标关联数据确定属于预定用户群体的目标用户。用户分群是指依据业务场景的需要对用户进行筛选,过滤出符合预定分群条件的目标用户群体的过程。用户分群结果可以用于网站或应用关于用户群体的用户行为分析过程中。通常可以根据用户数据进行用户分群,用户数据可以包括用户属性数据和用户行为数据。其中由于用户行为数据能够反映用户的动态行为特征,基于用户行为数据的用户分群方案可以获得实时性较好、准确度较高的用户分群结果。图1示意性示出了根据本公开实施例的可以应用用户分群方法和装置的示例性系统架构100。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以本文档来自技高网...

【技术保护点】
1.一种用户分群方法,包括:/n获取预定用户群体的分群条件,所述分群条件包括:时间筛选条件和事件筛选条件;/n基于所述时间筛选条件,确定用户行为数据库中的每条用户行为数据的至少一个目标时间段;/n基于所述每条用户行为数据和所述至少一个目标时间段中的每个目标时间段,确定所述每条用户行为数据关于所述每个目标时间段的关联数据,以由所述关联数据构成关联表;以及/n基于待测时间和所述事件筛选条件,从所述关联表中筛选针对所述待测时间的目标关联数据,以根据所述目标关联数据确定属于所述预定用户群体的目标用户。/n

【技术特征摘要】
1.一种用户分群方法,包括:
获取预定用户群体的分群条件,所述分群条件包括:时间筛选条件和事件筛选条件;
基于所述时间筛选条件,确定用户行为数据库中的每条用户行为数据的至少一个目标时间段;
基于所述每条用户行为数据和所述至少一个目标时间段中的每个目标时间段,确定所述每条用户行为数据关于所述每个目标时间段的关联数据,以由所述关联数据构成关联表;以及
基于待测时间和所述事件筛选条件,从所述关联表中筛选针对所述待测时间的目标关联数据,以根据所述目标关联数据确定属于所述预定用户群体的目标用户。


2.根据权利要求1所述的方法,其中,所述时间筛选条件用于指示在前第一数量个预定时间段,所述每条用户行为数据包括事件发生时间的第一时间信息;
所述确定用户行为数据库中的每条用户行为数据的至少一个目标时间段包括:将紧接在所述每条用户行为数据的事件发生时间之后的第一数量个预定时间段中的每个预定时间段,作为一个目标时间段。


3.根据权利要求1所述的方法,其中,所述时间筛选条件用于指示在后第二数量个预定时间段,所述每条用户行为数据包括事件发生时间的第一时间信息;
所述确定用户行为数据库中的每条用户行为数据的至少一个目标时间段包括:将紧接在所述每条用户行为数据的发生时间之前的第二数量个预定时间段中的每个预定时间段,作为一个目标时间段。


4.根据权利要求1所述的方法,还包括:
在确定所述至少一个目标时间段之后,从所述至少一个目标时间段中筛选出处于有效时间窗口内的目标时间段;以及
将筛选出的目标时间段作为更新的所述至少一个目标时间段。


5.根据权利要求1所述的方法,其中,
所述关联数据包括:所述每条用户行为数据和用于表征所述每个目标时间段的第二时间信息;
所述每条用户行为数据包括:用户标识信息和事件描述信息;
所述从所述关联表中筛选针对所述待测时间的目标关联数据包括:从所述关联表中筛选目标时间段属于所述待测时间段、且事件描述信息符合所述事件筛选条件的目标关联数据。


6.根据权利要求5所述的方法,其中,所述事件筛选条件用于指示:针对预定商品的预定行为的发生次数大于等于预定数值;
所述从所述关联表中筛选目标时间段属于所述待测时间段、且事件描述信息符合所述事件筛选条件的目标关联数据包括:
将计次参数复位为初始值0;
在所述关联表中查找所述用户标识信息等于第一数值且所述第二时间信息等于第二数值的关联数据;
针对查找到的每条关联数据,在确定所述每条关联数据中的事件描述信息指示针对所述预定商品的所述预定行为的情况下,对所述计次参数的取值递增1;
在查找结束时,确定所述计次参数的取值是否大于等于所述预定数值;以及
如果是,则确定...

【专利技术属性】
技术研发人员:黄斐乔林江红
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1