一种用户人群扩散方法及装置制造方法及图纸

技术编号:21630284 阅读:34 留言:0更新日期:2019-07-17 11:31
本发明专利技术实施例公开了一种用户人群扩散方法及装置,包括:获取多个用户之间的社交信息;根据所述多个用户之间的社交信息构建多个社区,并计算所述多个社区中每个社区的特征属性;根据所述每个社区的所述特征属性,从所述多个社区中选取目标社区,并计算所述目标社区中每个用户的社交得分;根据所述目标社区中每个用户的画像信息,计算所述目标社区中每个用户的兴趣得分;根据所述目标社区中每个用户的所述兴趣得分以及所述社交得分,确定所述种子用户经扩散后的用户人群。采用本发明专利技术实施例,可以提高人群扩散的准确性。

A User Population Diffusion Method and Device

【技术实现步骤摘要】
一种用户人群扩散方法及装置
本专利技术涉及数据处理
,尤其涉及一种用户人群扩散方法及装置。
技术介绍
人群扩散主要是数据管理平台(DataManagementPlatform,DMP)中的一个重要组件,首先给定种子用户,然后根据种子用户生成一个更大的扩散人群,使得该扩散人群与给定的种子用户尽可能相似,并且投放效果(如,点击率,转化率等)尽可能好。目前,主流的人群扩散方法为Facebook等使用的Lookalike方法。包括:首先计算其他用户与种子用户的相似得分,然后根据相似得分确定扩散规模范围内的用户。主要思路包括:将种子用户作为正样本,其他用户作为负样本,设计画像相关的特征(如,兴趣、人口属性等),使用机器学习算法训练得到Lookalike模型,使用Lookalike模型对其他用户进行相似度打分。其中,Lookalike是人群扩散的一种方法,给定一个人群进而返回一个人群,使得该人群与给定人群的画像、属性、行为(点击、转化、互动)等尽可能相似。但是,Lookalike只考虑到了用户之间画像的相似度,人群扩散的准确性不够高,在社交平台投放社交互动效果不理想。
技术实现思路
本专利技术实施例提供一种用户人群扩散方法及装置。可以提高人群扩散的准确性。第一方面,本专利技术实施例提供了一种用户人群扩散方法,包括:获取多个用户之间的社交信息;根据所述多个用户之间的社交信息构建多个社区,并计算所述多个社区中每个社区的特征属性;根据所述每个社区的所述特征属性,从所述多个社区中选取目标社区,并计算所述目标社区中每个用户的社交得分;根据所述目标社区中每个用户的画像信息,计算所述目标社区中每个用户的兴趣得分;根据所述目标社区中每个用户的所述兴趣得分以及所述社交得分,确定所述种子用户经扩散后的用户人群。其中,所述特征属性包括社区质量,所述计算所述多个社区中每个社区的特征属性包括:根据所述多个用户之间的社交信息,计算所述多个用户之间的边影响力以及所述多个用户中每个用户的自身影响力;计算所述多个社区中每个社区的局部模块度;根据所述每个社区的局部模块度、所述每个社区中用户之间的边影响力以及所述每个社区中用户的自身影响力,计算所述每个社区的社区质量。其中,所述f(u,v)为用户u对用户v的边影响力,所述message(u,v)为预设时长内所述用户u给所述用户v发信息的次数,所述comment(u,v)为所述预设时长内所述用户u给所述用户v的评论次数,所述like(u,v)为所述预设时长内所述用户u给所述用户v的点赞次数,所述a、所述b以及所述c为常数。其中,所述node_inf(u)为所述用户u的自身影响力,所述node_inf(i)为用户i的自身影响力,所述f(u,v)为所述用户u对所述用户v的边影响力,所述f(j,i)为用户j对所述用户i的边影响力,所述m为常数。其中,所述计算所述多个社区中每个社区的局部模块度包括:统计关联的两个用户同时在一个社区的个数、以及所述关联的两个用户中任何一个在该社区的个数;将所述关联的两个用户同时在一个社区的个数除以所述关联的两个用户中任何一个在该社区的个数,计算该社区的局部模块度。其中,所述根据所述每个社区的局部模块度、所述每个社区中用户之间的边影响力以及所述每个社区中的用户的自身影响力,计算所述每个社区的社区质量包括:根据所述每个社区中用户之间的边影响力,计算所述每个社区中用户之间平均边影响力,以及根据所述每个社区中的用户的自身影响力,计算所述每个社区中的用户的平均自身影响力;计算所述每个社区的局部模块度、所述每个社区中用户之间平均边影响力以及所述每个社区中的用户的平均自身影响力的加权平均值作为所述每个社区的社区质量。其中,所述特征属性还包括种子用户与所述每个社区的匹配度;其中,所述Flc为所述种子用户与所述每个社区的匹配度,所述SeedNumc为属于所述多个社区中社区c的种子用户的数量,所述SeedNum为所有所述种子用户的数量,所述csizec为所述社区c中所有用户的数量。其中,所述根据所述每个社区的所述特征属性,从所述多个社区中选取目标社区包括:计算所述每个社区的社区质量以及所述种子用户与所述每个社区的匹配度的加权平均值作为所述每个社区的社区综合打分;选取所述社区综合打分最高的社区作为所述目标社区。其中,所述p(u)为用户u的社交得分,所述p(i)为用户i的社交得分,所述f(i,j)为所述用户i对用户j的边影响力,所述f(u,j)为所述用户u对所述用户j的边影响力,所述n为常数。其中,所述根据所述目标社区中每个用户的所述兴趣得分以及所述社交得分,确定所述种子用户经扩散后的用户人群包括:计算所述目标社区中每个用户的所述兴趣得分和所述社交得分的加权平均值;若所述目标社区中某个用户的所述加权平均值大于预设阈值,则将该用户确定为所述种子用户经扩散后的用户人群。第二方面,本专利技术实施例提供了一种用户人群扩散方法的装置,包括:信息获取模块,用于获取多个用户之间的社交信息;属性确定模块,用于根据所述多个用户之间的社交信息构建多个社区,并计算所述多个社区中每个社区的特征属性;第一计算模块,用于根据所述每个社区的所述特征属性,从所述多个社区中选取目标社区,并计算所述目标社区中每个用户的社交得分;第二计算模块,用于根据所述目标社区中每个用户的画像信息,计算所述目标社区中每个用户的兴趣得分;用户确定模块,用于根据所述目标社区中每个用户的所述兴趣得分以及所述社交得分,确定所述种子用户经扩散后的用户人群。其中,所述特征属性包括社区质量,所述社区构建模块具体用于:根据所述多个用户之间的社交信息,计算所述多个用户之间的边影响力以及所述多个用户中每个用户的自身影响力;计算所述多个社区中每个社区的局部模块度;根据所述每个社区的局部模块度、所述每个社区中用户之间的边影响力以及所述每个社区中用户的自身影响力,计算所述每个社区的社区质量。其中,所述f(u,v)为用户u对用户v的边影响力,所述message(u,v)为预设时长内所述用户u给所述用户v发信息的次数,所述comment(u,v)为所述预设时长内所述用户u给所述用户v的评论次数,所述like(u,v)为所述预设时长内所述用户u给所述用户v的点赞次数,所述a、所述b以及所述c为常数。其中,所述node_inf(u)为所述用户u的自身影响力,所述node_inf(i)为用户i的自身影响力,所述f(u,v)为所述用户u对所述用户v的边影响力,所述f(j,i)为用户j对所述用户i的边影响力,所述m为常数。其中,所述社区构建模块,还用于统计关联的两个用户同时在一个社区的个数、以及所述关联的两个用户中任何一个在该社区的个数;将所述关联的两个用户同时在一个社区的个数除以所述关联的两个用户中任何一个在该社区的个数,计算该社区的局部模块度。其中,所述社区构建模块,还用于根据所述每个社区中用户之间的边影响力,计算所述每个社区中用户之间平均边影响力,以及根据所述每个社区中的用户的自身影响力,计算所述每个社区中的用户的平均自身影响力;计算所述每个社区的局部模块度、所述每个社区中用户之间平均边影响力以及所述每个社区中的用户的平均自身影响力的加权平均值作为所述每个社区的社区质量。其中,所述特征属本文档来自技高网...

【技术保护点】
1.一种用户人群扩散方法,其特征在于,所述方法包括:获取多个用户之间的社交信息;根据所述多个用户之间的社交信息构建多个社区,并计算所述多个社区中每个社区的特征属性;根据所述每个社区的所述特征属性,从所述多个社区中选取目标社区,并计算所述目标社区中每个用户的社交得分;根据所述目标社区中每个用户的画像信息,计算所述目标社区中每个用户的兴趣得分;根据所述目标社区中每个用户的所述兴趣得分以及所述社交得分,确定所述种子用户经扩散后的用户人群。

【技术特征摘要】
1.一种用户人群扩散方法,其特征在于,所述方法包括:获取多个用户之间的社交信息;根据所述多个用户之间的社交信息构建多个社区,并计算所述多个社区中每个社区的特征属性;根据所述每个社区的所述特征属性,从所述多个社区中选取目标社区,并计算所述目标社区中每个用户的社交得分;根据所述目标社区中每个用户的画像信息,计算所述目标社区中每个用户的兴趣得分;根据所述目标社区中每个用户的所述兴趣得分以及所述社交得分,确定所述种子用户经扩散后的用户人群。2.如权利要求1所述的方法,其特征在于,所述特征属性包括社区质量,所述计算所述多个社区中每个社区的特征属性包括:根据所述多个用户之间的社交信息,计算所述多个用户之间的边影响力以及所述多个用户中每个用户的自身影响力;计算所述多个社区中每个社区的局部模块度;根据所述每个社区的局部模块度、所述每个社区中用户之间的边影响力以及所述每个社区中用户的自身影响力,计算所述每个社区的社区质量。3.如权利要求2所述的方法,其特征在于,所述f(u,v)为用户u对用户v的边影响力,所述message(u,v)为预设时长内所述用户u给所述用户v发信息的次数,所述comment(u,v)为所述预设时长内所述用户u给所述用户v的评论次数,所述like(u,v)为所述预设时长内所述用户u给所述用户v的点赞次数,所述a、所述b以及所述c为常数。4.如权利要求3所述的方法,其特征在于,所述node_inf(u)为所述用户u的自身影响力,所述node_inf(i)为用户i的自身影响力,所述f(u,v)为所述用户u对所述用户v的边影响力,所述f(j,i)为用户j对所述用户i的边影响力,所述m为常数。5.如权利要求2所述的方法,其特征在于,所述计算所述多个社区中每个社区的局部模块度包括:统计关联的两个用户同时在一个社区的个数、以及所述关联的两个用户中任何一个在该社区的个数;将所述关联的两个用户同时在一个社区的个数除以所述关联的两个用户中任何一个在该社区的个数,计算该社区的局部模块度。6.如权利要求2所述的方法,其特征在于,所述根据所述每个社区的局部模块度、所述每个社区中用户之间的边影响力以及所述每个社区中的用户的自身影响力,计算所述每个社区的社区质量包括:根据所述每个社区中用户之间的边影响力,计算所述每个社区中用户之间平均边影响力,以及根据所述每个社区中的用户的自身影响力,计算所述每个社区中的用户的平均自身影响力;计算所述每个社区的局部模块度、所述每个社区中用户之间平均边影响力以及所述每个社区中的用户的平均自身影响力的加权平均值作为所述每个社区的社区质量。7.如权利要求1或2所述的方法,其特征在于,所述特征属性包括种子用户与所述每个社区的匹配度;其中,所述Flc为所述种子用户与所述每个社区的匹配度,所述SeedNumc为属于所述多个社区中社区c的种子用户的数量,所述SeedNum为所有所述种子用户的数量,所述csizec为所述社区c中所有用户的数量。8.如权...

【专利技术属性】
技术研发人员:苏雯杨春风
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1