一种用户活跃度的预测方法、装置及其应用方法和系统制造方法及图纸

技术编号:14869565 阅读:62 留言:0更新日期:2017-03-21 01:34
本发明专利技术涉及互联网领域,公开了一种用户活跃度的预测方法、装置及其应用方法和系统,以解决现有技术中无法对用户将来的活跃情况进行预测的技术问题。该方法包括:获得终端采集的用户预设时间内的M种特征数据,M为正整数;基于M种特征数据中每种特征数据的特征参数,生成用户的用户向量;将用户向量输入逻辑回归模型,获得逻辑回归模型的输出结果作为在预设时间段之后用户对预定网络访问对象的用户活跃度值。达到了能够对用户的用户活跃度值进行预测的技术效果。

【技术实现步骤摘要】

本专利技术涉及互联网
,尤其涉及一种用户活跃度的预测方法、装置及其应用方法和系统
技术介绍
随着科学技术的不断发展,电子技术也得到了飞速的发展,电子产品的种类也越来越多,人们也享受到了科技发展带来的各种便利。现在人们可以通过各种类型的移动终端,享受随着科技发展带来的舒适生活。例如,智能手机、平板电脑等移动终端已经成为人们生活中一个重要的组成部分,用户可以使用智能手机、平板电脑等移动终端来听音乐、玩游戏等等,以减轻现代快节奏生活所带来的压力。通常情况下,电子设备都具备网络访问功能,电子设备通过和网络服务器的交互实现网络访问,并接收网络服务器提供的各种数据,其中,基于用户访问各个网站或者APP,各个网站或者APP能从中获得相关收益。故而,活跃用户对于网站或者APP而言至关重要,现有技术中往往只能对当前时间内用户是否活跃或者流失进行统计,存在着无法对用户将来的活跃情况进行预测的技术问题。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的用户活跃度的预测方法、装置及其应用方法和系统。第一方面,本专利技术实施例提供一种用户活跃度的预测方法,包括:获得终端采集的用户预设时间内的M种特征数据,M为正整数;基于所述M种特征数据中每种特征数据的特征参数,生成所述用户的用户向量;将所述用户向量输入逻辑回归模型,获得所述逻辑回归模型的输出结果作为在所述预设时间段之后所述用户对预定网络访问对象的用户活跃度值;其中,所述逻辑回归模型基于多组采样样本进行逻辑回归训练获得,所述多组采样样本中的每组采样样本包含采样用户的所述M种特征数据;所述多组采样样本包含正样本和负样本,在采样时间之后的预设时间段内,所述正样本中的采样用户在所述预定网络访问对象的用户活跃度满足第一预设活跃度条件;在所述采样时间之后的预设时间段内,所述负样本中的采样用户在所述预定网络访问对象的用户活跃度值不满足所述第一预设活跃度条件。可选的,所述逻辑回归模型通过以下方式获得:获得多组采样样本,所述多组采样样本中的每组采样样本包含采样用户以及所述采样用户的所述M种特征数据;从所述多组采样样本中分别确定出正样本和负样本;采用所述正样本和所述负样本进行逻辑回归训练,进而获得所述逻辑回归模型。可选的,所述M种特征数据包括:用户行为特征类别、终端特征类别、用户个人特征类别中至少一个类别下的特征数据。可选的,所述用户行为特征类别包括:清理行为数据、访问应用程序的行为数据、下载应用程序的行为数据、点击应用程序的行为数据中的至少一种行为数据。可选的,所述终端特征类别包括:安装应用程序的数量、安装应用程序的名称、安装应用程序的版本、系统版本、内存参数、流量参数中的至少一种终端特征。可选的,所述用户个人特征类别包括:性别、年龄、职业、所在地、教育背景中的至少一种用户个人特征。可选的,所述预定网络访问对象包括:预定应用程序或者预定网站。第二方面,本专利技术实施例提供一种用户活跃度的预测方法,包括:获得终端采集的用户预设时间内的M种特征数据,M为正整数;将所述M种特征数据发送至网络服务器,以供所述网络服务器基于所述M特征数据确定出所述用户的用户向量并将所述用户向量输入逻辑回归模型,进而获得所述逻辑回归模型的输出结果作为在所述预设时间段之后所述用户对预定网络访问对象的用户活跃度值;其中,所述逻辑回归模型基于多组采样样本进行逻辑回归训练获得,所述多组采样样本中的每组采样样本包含采样用户的所述M种特征数据;所述多组采样样本包含正样本和负样本,在采样时间之后的预设时间段内,所述正样本中的采样用户在所述预定网络访问对象的用户活跃度满足第一预设活跃度条件;在所述采样时间之后的预设时间段内,所述负样本中的采样用户在所述预定网络访问对象的用户活跃度值不满足所述第一预设活跃度条件。可选的,所述M种特征数据包括:用户行为特征类别、终端特征类别、用户个人特征类别中至少一个类别下的特征数据。可选的,所述用户行为特征类别包括:清理行为数据、访问应用程序的行为数据、下载应用程序的行为数据、点击应用程序的行为数据中的至少一种行为数据。可选的,所述终端特征类别包括:安装应用程序的数量、安装应用程序的名称、安装应用程序的版本、系统版本、内存参数、流量参数中的至少一种终端特征。可选的,所述用户个人特征类别包括:性别、年龄、职业、所在地、教育背景中的至少一种用户个人特征。可选的,所述预定网络访问对象包括:预定应用程序或者预定网站。第三方面,本专利技术实施例提供一种基于用户活跃度的信息推送方法,包括:基于本专利技术任一实施例所介绍的用户活跃度的预测方法,确定出第一用户针对所述预定网络访问对象的所述用户活跃度值;基于所述第一用户的所述用户活跃度值,判断所述预设时间段后所述第一用户是否成为所述预定网络访问对象的流失用户;如果所述第一用户将成为所述流失用户,通过所述第一用户的终端向所述第一用户产生第一推送信息。可选的,在所述向所述第一用户产生第一推送信息之前,所述方法还包括:获取所述第一用户访问网络过程中的历史访问记录;基于所述历史访问记录确定出所述第一用户的兴趣特征;基于所述第一用户的兴趣特征确定出所述第一推送信息。可选的,所述历史访问记录为所述用户基于所述预定网络访问对象访问网络所获得历史访问记录。可选的,在所述向所述第一用户产生第一推送信息之前,所述方法还包括:基于所述第一用户与其他用户的所述M种特征数据确定出与所述第一用户的用户相似度值大于预设相似度值的推荐用户;确定所述推荐用户的兴趣特征;基于所述推荐用户的兴趣特征确定出所述第一推送信息。可选的,所述基于所述第一用户的所述活跃度值,判断所述预设时间段后所述第一用户是否成为所述预定网络访问对象的流失用户,包括:判断所述用户活跃度值是否小于预设阈值;在所述用户活跃度值小于所述预设阈值时,确定在所述预定时间段后所述第一用户将成为所述预定网络访问对象的流失用户。第四方面,本专利技术实施例提供一种基于用户活跃度的信息推送方法,包括:基于本专利技术任一实施例所介绍的用户活跃度的预测方法,确定出第二用户针对所述预定网络访问对象的所述用户活跃度值;基于所述第二用户的所述用户活跃度值,判断所述预设时间段后所述第一用户是否为所述预定网络访问对象的活跃用户;如果所述预设时间段后所述第二用户是否为所述预定网络访问对象的活跃用户,确定所述预设时本文档来自技高网...

【技术保护点】
一种用户活跃度的预测方法,其特征在于,包括:获得终端采集的用户预设时间内的M种特征数据,M为正整数;基于所述M种特征数据中每种特征数据的特征参数,生成所述用户的用户向量;将所述用户向量输入逻辑回归模型,获得所述逻辑回归模型的输出结果作为在所述预设时间段之后所述用户对预定网络访问对象的用户活跃度值;其中,所述逻辑回归模型基于多组采样样本进行逻辑回归训练获得,所述多组采样样本中的每组采样样本包含采样用户的所述M种特征数据;所述多组采样样本包含正样本和负样本,在采样时间之后的预设时间段内,所述正样本中的采样用户在所述预定网络访问对象的用户活跃度满足第一预设活跃度条件;在所述采样时间之后的预设时间段内,所述负样本中的采样用户在所述预定网络访问对象的用户活跃度值不满足所述第一预设活跃度条件。

【技术特征摘要】
1.一种用户活跃度的预测方法,其特征在于,包括:
获得终端采集的用户预设时间内的M种特征数据,M为正整数;
基于所述M种特征数据中每种特征数据的特征参数,生成所述用户的用户向量;
将所述用户向量输入逻辑回归模型,获得所述逻辑回归模型的输出结果作为在所述预
设时间段之后所述用户对预定网络访问对象的用户活跃度值;
其中,所述逻辑回归模型基于多组采样样本进行逻辑回归训练获得,所述多组采样样
本中的每组采样样本包含采样用户的所述M种特征数据;所述多组采样样本包含正样本和
负样本,在采样时间之后的预设时间段内,所述正样本中的采样用户在所述预定网络访问
对象的用户活跃度满足第一预设活跃度条件;在所述采样时间之后的预设时间段内,所述
负样本中的采样用户在所述预定网络访问对象的用户活跃度值不满足所述第一预设活跃
度条件。
2.如权利要求1所述的方法,其特征在于,所述逻辑回归模型通过以下方式获得:
获得多组采样样本,所述多组采样样本中的每组采样样本包含采样用户以及所述采样
用户的所述M种特征数据;
从所述多组采样样本中分别确定出正样本和负样本;
采用所述正样本和所述负样本进行逻辑回归训练,进而获得所述逻辑回归模型。
3.如权利要求1所述的方法,其特征在于,所述M种特征数据包括:用户行为特征类别、
终端特征类别、用户个人特征类别中至少一个类别下的特征数据。
4.一种用户活跃度的预测方法,其特征在于,包括:
获得终端采集的用户预设时间内的M种特征数据,M为正整数;
将所述M种特征数据发送至网络服务器,以供所述网络服务器基于所述M特征数据确定
出所述用户的用户向量并将所述用户向量输入逻辑回归模型,进而获得所述逻辑回归模型
的输出结果作为在所述预设时间段之后所述用户对预定网络访问对象的用户活跃度值;
其中,所述逻辑回归模型基于多组采样样本进行逻辑回归训练获得,所述多组采样样
本中的每组采样样本包含采样用户的所述M种特征数据;所述多组采样样本包含正样本和
负样本,在采样时间之后的预设时间段内,所述正样本中的采样用户在所述预定网络访问
对象的用户活跃度满足第一预设活跃度条件;在所述采样时间之后的预设时间段内,所述
负样本中的采样用户在所述预定网络访问对象的用户活跃度值不满足所述第一预设活跃
度条件。
5.一种基于用户活跃度的信息推送方法,其特征在于,包括:
基于权利要求1-4任一权利要求所述的用户活跃度的预测方法,确定出第一用户针对
所述预定网络访问对象的所述用户活跃度值;
基于所述第一用户的所述用户活跃度值,判断所述预设时间段后所述第一用户是否成
为所述预定网络访问对象的流失用户;
如果所述第一用户将成为所述流失用户,通过所述第一用户的终端向所述第一用户产
生第一推送信息。
6.一种基于用户活跃度的信息推送方法,其特征在于,包括:
基于权利要求1-4任一权利要求所述的用户活跃度的预测方法,确定出第二用户针对
所述预定网络访问对象的所述用户活跃度值;
基于所述第二用户的所述用户活跃度值,判断所述预设时间段后所述第一用户是否为
所述预定网络访问对象的活跃用户;
如果所述预设时间段后所述第二用户是否为所述预定网络访问对象的活跃用户,确定
所述预设时间段内所述第二用户针对所述预定网络访问对象的活跃数据;
基于所述活跃数据,判断所述第二用户针对所述预定网络访问对象的持续活跃时长是
否大于预设持续活...

【专利技术属性】
技术研发人员:张金晶李强常富洋
申请(专利权)人:北京奇虎科技有限公司奇智软件北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1