【技术实现步骤摘要】
一种基于数据挖掘的用户行为分析和预测的方法和装置
[0001]本专利技术属于机器学习(Machine Learning)和数据挖掘(Data Mining)领域,具体涉及一种基于数据挖掘的用户行为分析和预测的方法和装置。
技术介绍
[0002]计算机技术、互联网技术、通信技术、移动终端等发展迅速,使得用户行为逐渐从线下向线上迁移,从现实场景向互联网平台、终端产品等迁移。互联网和终端设备的大量普及,互联网经济的蓬勃发展,使用户与互联网平台和终端产品的交互成为日常生活的一部分,这进一步促进了互联网、终端产品、互联网经济等的发展,以及国民经济的发展。互联网平台和终端产品上的用户行为,往往反映了用户的需求和潜在想法,隐藏着直接和间接的商业价值。基于大数据对用户行为进行数据挖掘,可理解用户行为发生的逻辑,可实现对用户行为进行预测,可揭示用户行为与预测目标之间的关联(规则),以及可基于用户行为分析结果和提出的模型对互联网平台和终端产品设计方案进行评价和改进,以实现参与各方的多赢。
[0003]具有用户行为的互联网平台和终端产品很 ...
【技术保护点】
【技术特征摘要】
1.一种基于数据挖掘的用户行为分析和预测的方法,其特征在于,包括:从数据库中选取预测目标数据,以及与目标数据相关的用户行为元数据;采用基于行为信息的backtrack
‑
N统计方法和基于时间窗口的backtrack
‑△
t统计方法生成多种统计数据;将生成的统计数据与所述用户行为元数据按一定规则合并形成加强数据集;基于所述加强数据集训练预测模型。2.根据权利要求1所述的方法,其特征在于,在从数据库中选取预测目标数据之前,还包括:获取用户数据;对获取的用户数据进行预处理;将经过预处理后的数据进行整合并建立数据库。3.根据权利要求1所述的方法,其特征在于,采用基于行为信息的backtrack
‑
N统计方法生成多种统计数据,具体包括:从一个用户的每一条目标数据回溯N个该用户的行为数据进行统计处理,从而得到新的用于预测目标的统计数据。4.根据权利要求1所述的方法,其特征在于,采用基于时间窗口的backtrack
‑△
t统计方法生成多种统计数据,具体包括:从一个用户的每一条目标数据回溯
△
t时间段内该用户的行为数据进行统计处理,从而得到新的用于预测目标的统计数据。5.根据权利要求1所述的方法,其特征在于,基于所述加强数据集训练预测模型,具体包括:将所述加强数据集随机划分成训练集和测试集;根据任务特点确定多个合适的机器学习模型作为候选;从所述加强数据集按一定规则随机生成维度不变的数据集子集,用于快速验证候选模型的有效性;根据评价指标,从候选模型中确定出最优模型;对所述最优模型进行迭代优化;采用参数网格化搜索结合K重交叉验证对所述最优模型进行模型参数优化和模型验证。6.根据权利要求...
【专利技术属性】
技术研发人员:李沄沨,金源,许若华,张鹤,张之涛,
申请(专利权)人:中图科信数智技术北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。