【技术实现步骤摘要】
数据处理方法和装置
[0001]本专利技术涉及计算机
,尤其涉及一种数据处理方法和装置。
技术介绍
[0002]人群拓展常用于广告的投放或者商家的营销活动。例如,在进行广告投放时,考虑到广告主提供的种子人群的用户量往往比较小,基于种子人群进行广告投放存在广告覆盖面小、达不到预期的流量等缺陷,广告数据平台或者购物数据平台(DMP)通过解析种子人群的显著性特征,并根据该特征对种子人群进行拓展,然后基于拓展后的人群进行广告投放,从而达到提升点击转化率或者购买转化率的目的。
[0003]现有的人群扩展方案主要包括以下两种:第一种、基于用户画像进行人群拓展。具体来说,通过用户画像分析为用户设置各类画像特征标签,分析种子人群中大部分用户具有的画像特征标签,然后将数据库中拥有高相似画像特征标签的人群列为拓展人群。第二种,基于分类算法进行人群拓展。具体来说,以种子人群为正样本、以候选人群为负样本训练分类模型,然后通过训练后的分类模型对候选人群进行筛选,以得到拓展人群。
[0004]在实现本专利技术过程中,专利技术人发现 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:响应于人群拓展任务的触发,确定用于人群拓展的候选用户集;根据第一提取规则从所述候选用户集中提取部分用户,然后将提取的所述部分用户和种子用户集作为正样本用户;根据第二提取规则提取部分用户作为负样本用户;根据所述正样本用户和负样本用户的用户特征数据对第一机器学习模型进行训练,以得到训练后的第一机器学习模型;根据所述训练后的第一机器学习模型从所述候选用户集中筛选出拓展用户集。2.根据权利要求1所述的方法,其特征在于,所述确定用于人群拓展的候选用户集包括:获取需要进行人群拓展的业务活动信息;根据所述业务活动信息查询数据库表,以得到与之对应的候选用户集;其中,所述业务活动信息包括业务活动涉及的目标商品的品牌标识、业务活动涉及的目标商品的品类标识、业务活动涉及的店铺标识中的至少一项。3.根据权利要求2所述的方法,其特征在于,所述候选用户集包括:短期兴趣用户集和中长期兴趣用户集;其中,所述短期兴趣用户集是基于用户的短期行为特征数据筛选出来的对所述目标商品感兴趣的用户集;所述中长期兴趣用户集是基于用户的中长期行为特征数据筛选出来的对所述目标商品感兴趣的用户集。4.根据权利要求3所述的方法,其特征在于,所述短期兴趣用户集包括:第一短期兴趣用户集、第二短期兴趣用户集和第三短期兴趣用户集;所述方法还包括:从近期对目标商品有第一类型的操作行为的第一用户集中筛选出第一短期兴趣用户集;确定所述目标商品的相似商品,然后从近期对所述相似商品有第一类型的操作行为的第二用户集中筛选出第二短期兴趣用户集;从近期对所述目标商品或者所述相似商品有第二类型的操作行为的第三用户集中筛选出第三短期兴趣用户集。5.根据权利要求4所述的方法,其特征在于,所述从近期对目标商品有第一类型的操作行为的第一用户集中筛选出第一短期兴趣用户集包括:获取近期对目标商品有第一类型的操作行为的第一用户集;根据训练后的第二机器学习模型...
【专利技术属性】
技术研发人员:张美娜,仲济源,
申请(专利权)人:北京京东世纪贸易有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。