当前位置: 首页 > 专利查询>海南大学专利>正文

一种多模型融合的用户属性预测方法技术

技术编号:34374964 阅读:44 留言:0更新日期:2022-07-31 13:01
本发明专利技术公开了一种基于Stacking多模型融合的用户属性预测方法,包括数据收集、特征工程、模型训练、交叉验证和精度评价;在数据收集中获取用户的广告点击浏览记录并将数据进行清洗以及分割;在特征工程中使用特征相关性热力图显示各特征之间的相关性并使用XGBoost算法得到各特征重要性排名,结合特征的相关性和重要性排名对特征进行筛选;在模型训练过程中使用逻辑回归、随机森林、极限树、XGBoost算法作为Stacking模型的第一层,使用LightGBM作为Stacking模型的第二层对特征进行训练;交叉验证时使用五折交叉验证方式;精度评价过程中使用准确率、召回率、F1值以及精确率对预测结果进行评价;本发明专利技术能对广告用户的性别和年龄进行预测。行预测。行预测。

A user attribute prediction method based on multi model fusion

【技术实现步骤摘要】
一种多模型融合的用户属性预测方法


[0001]本专利技术属于机器学习领域,涉及一种多模型融合的用户属性预测方法。

技术介绍

[0002]随着网络技术的快速发展,网络广告成为商家宣传的主要方式之一;在网络上发布广告,传播速度更快、传播范围更广,比线下发布广告的效率更高,因此网络上充满了各式各样的广告;在广告定向中,用户的搜索内容、浏览记录和基础属性等有着重要作用,其中基础属性性别、年龄至关重要,但并非所有用户都愿意公开自己的年龄、性别信息,因此会导致用户的基础属性数据缺失,就需要利用现有数据及相关算法进行预测。
[0003]目前现有研究主要采用 SVM、贝叶斯等传统机器学习方法,集成学习作为机器学习的重要部分也逐渐被应用于用户属性预测领域;现有的用户属性预测方法大多通过分析用户的搜索、浏览等互联网行为数据,结合贝叶斯网络算法、随机森林、SVM等单一机器学习算法对用户的性别及年龄进行预测;也有学者以微博用户为研究对象,基于用户昵称、标签、微博文本等对用户的性别、年龄进行预测推测,但其准确率仅为 73.6%;还有的预测方法将LightGBM和本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种多模型融合的用户属性预测方法,包括以下步骤:(1)数据采集:对广告用户的点击浏览历史进行记录,对浏览记录进行数值化处理得到训练样本,并将所述训练集划分为用于训练和测试的训练集和测试集;(2)特征工程:使用热力图对和特征之间的相关性进行分析,并使用XGBoost算法对各特征进行重要性排名,剔除掉相关性高,并重要性排名较低的特征,实现对特征的筛选;(3)模型训练:将逻辑回归、随机森林、极限树和XGBoost算法作为Stacking模型第一层的元分类器对数据,使用LightGBM作为Stacking模型第二层的...

【专利技术属性】
技术研发人员:黎才茂陈秋红林昊侯玉权李浩
申请(专利权)人:海南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1