一种直播平台潜在用户的提取方法及装置制造方法及图纸

技术编号:19220235 阅读:32 留言:0更新日期:2018-10-20 08:25
本申请公开的一种直播平台潜在用户的提取方法及装置,获取直播平台主站用户中的多个待提取用户,生成每个待提取用户的多维特征向量,将每个待提取用户的多维特征向量输入到直播平台潜在用户提取模型中进行处理,得到多个直播平台潜在用户。将提取直播平台潜在用户的问题转化为提取直播平台主站中与直播平台活跃用户相似、且与直播平台流失用户不同的用户的问题,将每个待提取用户的多维特征向量输入到直播平台潜在用户提取模型中进行处理,准确得到多个直播平台潜在用户,提高了提取直播平台潜在用户的准确率。

【技术实现步骤摘要】
一种直播平台潜在用户的提取方法及装置
本专利技术涉及互联网
,更具体的,涉及一种直播平台潜在用户的提取方法及装置。
技术介绍
随着直播的兴起,出现了很多大型真人互动视频直播社区,简称直播平台。随着直播平台业务的不断发展,如何挖掘直播平台的潜在用户成为各大直播平台的关键问题。直播平台一般为主站的一部分,主站的表现形式包括:视频播放平台、音乐播放平台、门户网站等。以视频播放平台为例,直播平台可以为视频播放平台中的一个直播板块。直播平台的主站中存在大量用户,其中存在不少用户有着观看直播平台的可能,他们很可能成为直播平台潜在用户。现有的挖掘直播平台潜在用户的方法一般为:通过简单的筛选规则从直播平台主站的海量用户中筛选直播平台潜在用户,例如,将观影时长、注册时间等指标做为筛选规则。显然,这种简单的筛选规则很难从海量用户中准确提取直播平台潜在用户。
技术实现思路
有鉴于此,本专利技术提供了一种直播平台潜在用户的提取方法及装置,通过使用直播平台活跃用户作为正样本、直播平台流失用户作为负样本训练直播平台潜在用户提取模型,通过直播平台潜在用户提取模型从直播平台主站中的用户中准确提取直播平台潜在用户。本文档来自技高网...

【技术保护点】
1.一种直播平台潜在用户的提取方法,其特征在于,包括:获取直播平台主站用户中的多个待提取用户;根据每个所述待提取用户在每个预设维度的特征值生成每个所述待提取用户的多维特征向量;将每个所述待提取用户的多维特征向量输入到直播平台潜在用户提取模型中进行处理,得到多个直播平台潜在用户,其中,所述直播平台潜在用户提取模型为以直播平台中的多个活跃用户的多维特征向量作为正样本,以多个流失用户的多维特征向量作为负样本,对预设逻辑回归模型进行训练得到的。

【技术特征摘要】
1.一种直播平台潜在用户的提取方法,其特征在于,包括:获取直播平台主站用户中的多个待提取用户;根据每个所述待提取用户在每个预设维度的特征值生成每个所述待提取用户的多维特征向量;将每个所述待提取用户的多维特征向量输入到直播平台潜在用户提取模型中进行处理,得到多个直播平台潜在用户,其中,所述直播平台潜在用户提取模型为以直播平台中的多个活跃用户的多维特征向量作为正样本,以多个流失用户的多维特征向量作为负样本,对预设逻辑回归模型进行训练得到的。2.根据权利要求1所述的方法,其特征在于,所述根据每个所述待提取用户在每个预设维度的特征值生成每个所述待提取用户的多维特征向量,包括:提取每个所述待提取用户在每个预设维度的特征值;分别对每个所述待提取用户在每个预设维度的特征值进行编码,得到每个所述待提取用户的多维特征向量。3.根据权利要求1所述的方法,其特征在于,所述将每个所述待提取用户的多维特征向量输入到直播平台潜在用户提取模型中进行处理,得到多个直播平台潜在用户,包括:将每个所述待提取用户的多维特征向量输入到直播平台潜在用户提取模型中进行处理,得到每个所述待提取用户的预测值;将预测值大于预设值的待提取用户确定为直播平台潜在用户。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取直播平台中的多个活跃用户和多个流失用户;生成每个所述活跃用户和所述流失用户的多维特征向量;以每个所述活跃用户的多维特征向量作为正样本,以每个所述流失用户的多维特征向量作为负样本,对预设逻辑回归模型进行训练,得到直播平台潜在用户提取模型。5.根据权利要求4所述的方法,其特征在于,所述获取直播平台主站用户中的多个待提取用户,包括:根据第一预设时间段内直播平台主站用户在直播平台主站的观影行为数据,确定所述直播平台主站中的多个待提取用户;所述获取直播平台用户中的多个活跃用户和多个流失用户,包括:根据第二预设时间段内直播平台用户在直播平台的观影行为数据和/或所述直播平台用户在直播平台的消费行为数据,确定直播平台中的多个活跃用户;将在第三预设时间段内访问过直播平台,在第二预设时间段内未访问过直播平台且访问过直播平台主站的用户,确定为所述直播平台中的流失用户,所述第三预设时间段为所述第二时间段之前的一段时间。6.根据权利要求4所述的方法,其特征在于,所述以每个所述活跃用户的多维特征向量作为正样本,以每个所述流失用户的多维特征向量作为负样本,对预设逻辑回归模型进行训练,得到直播平台潜在用户提取模型,包括:对每个所述活跃用户的多维特征向量和每个所述流失用户的多维特征向量进行L1正则化处理,得到多维特征向量每个预设维度的权重;根据多维特征向量每个预设维度的权重,在预设逻辑回归模型中对训练样本进行5-fold交叉验证,将潜在用户提...

【专利技术属性】
技术研发人员:林彬
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1