一种用户目标人群扩散方法、装置及存储介质制造方法及图纸

技术编号:36696050 阅读:21 留言:0更新日期:2023-02-27 20:08
本发明专利技术公开一种用户目标人群扩散方法、装置及存储介质,用户目标人群扩散方法包括:获取用户的历史数据,将用户划分为种子人群和非种子人群;选取种子人群为正样本,非种子人群为负样本,输入用于人群扩散的深度学习网络模型进行模型训练,训练完成得到人群扩散模型;接收用户配置的目标种子人群包输入人群扩散模型中得到目标种子人群包向量,获取用户配置的目标扩散人群中各个目标扩散用户的目标扩散用户向量;计算目标扩散人群中各目标扩散用户向量与目标种子人群包向量之间的相似度,进行排序得到目标扩散人群的推荐扩散人群包。本发明专利技术具有多目标自适应扩散,适配复杂场景和控制计算成本,节约计算时间的有益效果。节约计算时间的有益效果。节约计算时间的有益效果。

【技术实现步骤摘要】
一种用户目标人群扩散方法、装置及存储介质


[0001]本专利技术涉及人工智能
,具体的涉及一种用户目标人群扩散方法、装置及存储介质。

技术介绍

[0002]在较大型的营销活动中,运营人员需要基于已确定的少量种子人群,进行更大量相似人群的圈选,来达到精准营销目的。种子人群:代指企业经营中,发生了某些具体动作(如购买商品、参与活动等)的核心用户人群。例如:进行某商品推广时,需要选取目标人群发放优惠券,全量发放成本过高,随机发放转化率较低。业务人员会利用已有用户数据,圈选满足某些条件(如近期购买过类似商品或符合某些特征)的人群。但人工圈选人群量级较小,需要基于此人群包(也称种子人群),在非种子人群中(除种子人群外的全量用户)选取与种子人群相似的用户进行扩散。此时需要用到人群扩散方法,人群扩散是基于种子用户(人工挑选的人群包),通过一定的算法评估模型,找到更多拥有潜在关联性的相似人群的技术。
[0003]现有的人群扩散方法大致分为三类。
[0004]1.基于标签的人群扩散方法通过对种子人群进行人工统计分析或模型分析,识别种子人群特征,如:性别男性、年龄20

26岁等特征占比较高,然后通过以上人群特征标签,圈选人群作为拓展人群,进行后续的营销活动。
[0005]该方法存在一定缺陷,首先强依赖于人群特征分析,分析过程费时费力且分析结论无法有效评估。其次基于分析结果进行标签圈选时,需要通过标签组合控制扩散人群数量,此过程不可控。如限制标签“性别男”后,人群数量超过预期扩散人群数量,限制标签组合“性别男,年龄20

26岁”后,人群数量可能又小于预期扩散人群数量。只能通过构建其他标签组合方式,或再次对人群抽样才能达到预期。整个过程人力成本高且准确率低。
[0006]2.基于分类模型的人群扩散方法将人群扩散看作分类问题,种子人群为类别A,部分其他非种子人群为类别B,利用分类模型(逻辑回归、决策树等)进行训练。将生成的模型对全量非种子人群进行预测,此时得到的预测结果为每个用户为类别A的可能性(二分类问题,反之为类别B的可能性亦可)。最后通过将预测结果进行排序,得到可能性最大的N个用户作为扩散人群。
[0007]该方法存在一定缺陷,首先训练分类模型时,部分非种子人群的选取方式可能影响模型效果。由于种子人群往往是全量人群中很少的一部分,如千万用户中,可能只识别出几百或几千的种子人群。因此如何在控制正负样本比例的基础上,选取部分非种子人群十分复杂,模型效果难以得到保证。其次该方法只能在得到种子人群后进行启动样本选取、特征筛选、模型训练的一系列过程,整个过程耗时较长,业务人员使用时体验感较差,无法通过预训练的方式减少应用人群扩散功能的时间。
[0008]3.基于向量相似度的人群扩散方法
利用深度学习模型(如双塔模型)对每个用户进行向量化表示,通过种子人群包的N个用户向量与每个非种子用户的向量计算相似度,然后对非种子用户与种子人群包的相似度进行排序,最后得到指定数量的人群作为扩散用户。
[0009]但该方法也存在一定不足。首先在利用模型进行用户向量化表示时,往往通过选取单一目标(如点击、浏览、下单等)训练满足特定场景的模型。如广告宣传时业务人员希望通过人群扩散提高广告点击率,而商品促销活动中则希望提高转化率(商品下单数/商品点击数)。不同的人群扩散目标需要算法工程师训练不同的模型、扩散后的人群质量难以控制、人群扩散的逻辑难以解释导致需要大量的后续分析等等。其次在计算种子人群包与其他用户的相似度时,涉及如何对种子人群包进行向量化表示问题。种子人群包中的N个用户向量与非种子用户计算得到N个相似度,以往的方式选取N个相似度的平均值、最大值或最小值作为用户与人群包的相似度。但这种方法计算量大且无法准确量化相似度,易受到异常值影响。
[0010]有鉴于此,特提出本专利技术专利。

技术实现思路

[0011]针对上述相关技术的不足,本专利技术提出一种用户目标人群扩散方法,通过人工指导结合算法模型,找到营销活动转化率较高的目标人群,具体地,采用如下技术方案:一种用户目标人群扩散方法,包括:获取用户的历史数据,将用户划分为种子人群和非种子人群;选取种子人群为正样本,非种子人群为负样本,输入用于人群扩散的深度学习网络模型进行模型训练,训练完成得到人群扩散模型;接收用户配置的目标种子人群包输入人群扩散模型中得到目标种子人群包向量,获取用户配置的目标扩散人群中各个目标扩散用户的目标扩散用户向量;计算目标扩散人群中各目标扩散用户向量与目标种子人群包向量之间的相似度,进行排序得到目标扩散人群的推荐扩散人群包。
[0012]作为本专利技术的可选实施方式,本专利技术的一种用户目标人群扩散方法中,所述选取种子人群为正样本,非种子人群为负样本,输入用于人群扩散的深度学习网络模型进行模型训练,训练完成得到人群扩散模型包括:所述深度学习网络模型包括种子人群包向量单元和目标向量单元,将所述正样本数据输入种子人群包向量单元,将部分正样本数据和负样本数据输入目标向量单元进行深度学习训练,将种子人群包向量单元输出的种子人群包向量与目标向量单元输出的目标向量进行相似度计算,根据相似度计算结果反馈深度学习网络模型进行种子人群包向量单元和目标向量单元的参数优化。
[0013]作为本专利技术的可选实施方式,本专利技术的一种用户目标人群扩散方法中,所述将所述正样本数据输入种子人群包向量单元进行深度学习训练包括:所述正样本的N个多维用户向量输入种子人群包向量单元;针对N个多维用户向量进行聚类分析,得到k个聚类中心向量,所述聚类中心的个数k根据人群包人数N的数量分段式调整;将k个聚类中心向量输入注意力单元,得到种子人群包的全局向量表示。
[0014]作为本专利技术的可选实施方式,本专利技术的一种用户目标人群扩散方法中,所述接收用户配置的目标种子人群包输入人群扩散模型中得到目标种子人群包向量,获取用户配置的目标扩散人群中各个目标扩散用户的目标扩散用户向量包括:接收用户上传的目标种子人群包,将目标种子人群包输入人群扩散模型中得到目标种子人群包向量;接收用户配置的目标扩散人群的扩散条件,所述的扩散条件包括扩散人数、扩散限定条件及扩散目标,由用户全量数据库中提取满足扩散限定条件的目标用户构成目标扩散人群,获取目标扩散人群中各个目标扩散用户的目标扩散用户向量。
[0015]作为本专利技术的可选实施方式,本专利技术的一种用户目标人群扩散方法中,所述计算目标扩散人群中各目标扩散用户向量与目标种子人群包向量之间的相似度,进行排序得到目标扩散人群的推荐扩散人群包括:当所述扩散目标为单目标扩散时,计算目标扩散用户向量与种子人群包向量的单个相似度;当所述扩散目标为多目标扩散时,分别计算每个目标扩散的相似度,将多个相似度进行加权平均计算得到多目标扩散相似度;可选地,所述加权平均计算的加权权重通过用户配置,默认为等权重。
[0016]作为本专利技术的可选实施方式,本专利技术的一种用户目标人群扩散方法,包括:将当前全量用户中各个用户的用户特征分别输本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户目标人群扩散方法,其特征在于,包括:获取用户的历史数据,将用户划分为种子人群和非种子人群;选取种子人群为正样本,非种子人群为负样本,输入用于人群扩散的深度学习网络模型进行模型训练,训练完成得到人群扩散模型;接收用户配置的目标种子人群包输入人群扩散模型中得到目标种子人群包向量,获取用户配置的目标扩散人群中各个目标扩散用户的目标扩散用户向量;计算目标扩散人群中各目标扩散用户向量与目标种子人群包向量之间的相似度,进行排序得到目标扩散人群的推荐扩散人群包。2.根据权利要求1所述的一种用户目标人群扩散方法,其特征在于,所述选取种子人群为正样本,非种子人群为负样本,输入用于人群扩散的深度学习网络模型进行模型训练,训练完成得到人群扩散模型包括:所述深度学习网络模型包括种子人群包向量单元和目标向量单元,将所述正样本数据输入种子人群包向量单元,将部分正样本数据和负样本数据输入目标向量单元进行深度学习训练,将种子人群包向量单元输出的种子人群包向量与目标向量单元输出的目标向量进行相似度计算,根据相似度计算结果反馈深度学习网络模型进行种子人群包向量单元和目标向量单元的参数优化。3.根据权利要求2所述的一种用户目标人群扩散方法,其特征在于,所述将所述正样本数据输入种子人群包向量单元进行深度学习训练包括:所述正样本的N个多维用户向量输入种子人群包向量单元;针对N个多维用户向量进行聚类分析,得到k个聚类中心向量,所述聚类中心的个数k根据人群包人数N的数量分段式调整;将k个聚类中心向量输入注意力单元,得到种子人群包的全局向量表示。4.根据权利要求1所述的一种用户目标人群扩散方法,其特征在于,所述接收用户配置的目标种子人群包输入人群扩散模型中得到目标种子人群包向量,获取用户配置的目标扩散人群中各个目标扩散用户的目标扩散用户向量包括:接收用户上传的目标种子人群包,将目标种子人群包输入人群扩散模型中得到目标种子人群包向量;接收用户配置的目标扩散人群的扩散条件,所述的扩散条件包括扩散人数、扩散限定条件及扩散目标,由用户全量数据库中提取满足扩散限定条件的目标用户构成目标扩散人群,获取目标扩散人群中各个目标扩散用户的目标扩散用户向量。5.根据权利要求4所述的一种用户目标人群扩散方法,其特征在于,所述计算目标扩散人群中各目标扩散用户向量与目标种子人群包向量之间的相似度,进行排序得到目标扩散人群的推荐扩散人群包括:当所述扩散目标为单目标扩散时,计算目标...

【专利技术属性】
技术研发人员:王涵
申请(专利权)人:北京数势云创科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1