相似人群扩展方法、装置、电子设备和可读存储介质制造方法及图纸

技术编号:34987754 阅读:17 留言:0更新日期:2022-09-21 14:32
本公开提供了一种相似人群扩展方法,包括:先选定目标场景,并通过用户历史行为数据确定目标场景对应的过滤算法。通过该过滤算法对原始用户样本进行异常过滤,得到种子用户样本。最后在目标场景下,对种子用户样本进行相似人群扩展,得到扩展用户样本。本公开还提供了一种相似人群扩展装置、电子设备以及计算机可读存储介质。可读存储介质。可读存储介质。

【技术实现步骤摘要】
相似人群扩展方法、装置、电子设备和可读存储介质


[0001]本公开涉及互联网
,更具体地,涉及一种相似人群扩展方法、装置、电子设备和可读存储介质。

技术介绍

[0002]相似人群扩展(Look

alike)指基于一批种子用户,通过标签规则或算法模型,找到与种子用户相似或有潜在关联人群的技术。现有技术主要包括通过画像标签圈选人群和算法模型两大类:前者通过人工选取年龄、性别等标签框选人群,后者通过向机器学习或深度学习模型输入用户画像和行为特征输出相关人群。
[0003]在实现本公开构思的过程中,专利技术人发现相关技术中至少存在如下问题由于手动框选标签难以发掘用户之间的内在联系,也难以利用上种子用户所具有的潜在特征。同时种子用户的质量也影响扩展得到的相似用户的总体质量。

技术实现思路

[0004]有鉴于此,本公开提供了一种相似人群扩展方法和装置。
[0005]本公开的一个方面提供了一种相似人群扩展方法,包括:选定目标场景;确定所述目标场景对应的过滤算法;通过所述过滤算法对原始用户样本进行异常过滤,得到种子用户样本;在所述目标场景下,对所述种子用户样本进行相似人群扩展,得到扩展用户样本。
[0006]根据本公开的实施例,所述确定所述目标场景对应的过滤算法,包括:基于预设行为特征,从候选用户样本集合中获取第一用户样本;分别通过多个预设算法对所述第一用户样本进行异常过滤,得到多个第二用户样本;在所述目标场景下,通过召回算法在所述候选用户样本集合内分别对每个第二用户样本进行召回,得到多个召回用户样本;基于所述预设行为特征,分别检测每个所述召回用户样本的召回质量;基于所述召回质量,确定所述目标场景对应的过滤算法,所述过滤算法为所述多个预设算法的其中一个。
[0007]根据本公开的实施例,所述基于所述预设行为特征,分别检测每个所述召回用户样本的召回质量,包括:分别统计每个所述召回用户样本中指定用户的数量,所述指定用户具有预设行为特征;比较所有所述指定用户的数量,确定最优召回用户样本,所述最优召回用户样本为所有所述召回用户样本中包含指定用户的数量最多的召回用户样本。
[0008]根据本公开的实施例,所述基于所述预设行为特征,分别检测每个所述召回用户样本的召回质量,还包括:统计所述候选用户样本集合中除所述第一用户样本以外的特征用户的数量,所述特征用户为具有预设行为特征;计算每个所述召回用户样本的召回率,所述召回率为所述指定用户的数量与所述特征用户的数量的比值;比较所有所述召回率;确定最优召回用户样本,所述最优召回用户样本为所有所述召回用户样本中具有最大召回率的召回用户样本。
[0009]根据本公开的实施例,所述基于所述召回质量,确定所述目标场景对应的过滤算法,包括:确定所述最优召回用户样本对应的预设算法;确定所述预设算法为所述目标场景
对应的过滤算法。
[0010]根据本公开的实施例,所述确定所述目标场景对应的过滤算法,还包括:在所述目标场景下,通过召回算法在所述候选用户样本集合内对第一用户样本进行召回,得到原始召回用户样本;基于所述预设行为特征,检测所述原始召回用户样本的原始召回质量;比较所述原始召回质量和多个所述召回用户样本的召回质量;若所述原始召回质量优于所有所述召回用户样本的召回质量,则所述目标场景没有对应的过滤算法。
[0011]根据本公开的实施例,所述用户样本为用户特征数据集合,所述用户特征数据包含用户画像信息和用户行为信息。
[0012]本公开的另一个方面提供了一种相似人群扩展装置,包括:选定模块,用于选定目标场景;确定模块,用于确定所述目标场景对应的过滤算法;过滤模块,用于通过所述过滤算法对原始用户样本进行异常过滤,得到种子用户样本;扩展模块,用于在所述目标场景下,对所述种子用户样本进行相似人群扩展,得到扩展用户样本。
[0013]本公开的另一方面提供了一种电子设备,所述电子设备包括一个或多个处理器;以及存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求上述任一项所述的方法。
[0014]本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
[0015]根据本公开的实施例,因为采用了通过指定的过滤算法对种子用户进行过滤,以得到在目标场景下具有预设行为特征的扩展人群的技术手段,所以至少部分地克服了如何减轻种子用户样本中噪音用户对相似人群扩展影响的技术问题,进而达到了增加扩展人群有效性的技术效果。
附图说明
[0016]通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
[0017]图1示意性示出了可以应用本公开的相似人群扩展方法和装置的示例性系统架构;
[0018]图2示意性示出了根据本公开实施例的相似人群扩展方法的流程图;
[0019]图3A示意性示出了根据本公开另一实施例的相似人群扩展方法的流程图;
[0020]图3B示意性示出了根据本公开另一实施例的相似人群扩展方法的流程图;
[0021]图3C示意性示出了根据本公开另一实施例的相似人群扩展方法的流程图;
[0022]图3D示意性示出了根据本公开另一实施例的相似人群扩展方法的流程图;
[0023]图3E示意性示出了根据本公开另一实施例的相似人群扩展方法的流程图;
[0024]图4示意性示出了根据本公开实施例的相似人群扩展装置的框图;以及
[0025]图5示意性示出了根据本公开实施例的适于实现相似人群扩展装置的电子设备的框图。
具体实施方式
[0026]以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性
的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
[0027]在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
[0028]在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
[0029]在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种相似人群扩展方法,包括:选定目标场景;确定所述目标场景对应的过滤算法;通过所述过滤算法对原始用户样本进行异常过滤,得到种子用户样本;在所述目标场景下,对所述种子用户样本进行相似人群扩展,得到扩展用户样本。2.根据权利要求1所述的方法,其中,所述确定所述目标场景对应的过滤算法,包括:基于预设行为特征,从候选用户样本集合中获取第一用户样本;分别通过多个预设算法对所述第一用户样本进行异常过滤,得到多个第二用户样本;在所述目标场景下,通过召回算法在所述候选用户样本集合内分别对每个第二用户样本进行召回,得到多个召回用户样本;基于所述预设行为特征,分别检测每个所述召回用户样本的召回质量;基于所述召回质量,确定所述目标场景对应的过滤算法,所述过滤算法为所述多个预设算法的其中一个。3.根据权利要求2所述的方法,其中,所述基于所述预设行为特征,分别检测每个所述召回用户样本的召回质量,包括:分别统计每个所述召回用户样本中指定用户的数量,所述指定用户具有预设行为特征;比较所有所述指定用户的数量,确定最优召回用户样本,所述最优召回用户样本为所有所述召回用户样本中包含指定用户的数量最多的召回用户样本。4.根据权利要求3所述的方法,其中,所述基于所述预设行为特征,分别检测每个所述召回用户样本的召回质量,还包括:统计所述候选用户样本集合中除所述第一用户样本以外的特征用户的数量,所述特征用户为具有预设行为特征;计算每个所述召回用户样本的召回率,所述召回率为所述指定用户的数量与所述特征用户的数量的比值;比较所有所述召回率,确定最优召回用户样本,所述最优召回...

【专利技术属性】
技术研发人员:曹雨晨张少洋孙中伟刘鸿儒潘城城
申请(专利权)人:京东科技控股股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1