【技术实现步骤摘要】
一种多模型融合的用户属性预测方法
[0001]本专利技术属于机器学习领域,涉及一种多模型融合的用户属性预测方法。
技术介绍
[0002]随着网络技术的快速发展,网络广告成为商家宣传的主要方式之一;在网络上发布广告,传播速度更快、传播范围更广,比线下发布广告的效率更高,因此网络上充满了各式各样的广告;在广告定向中,用户的搜索内容、浏览记录和基础属性等有着重要作用,其中基础属性性别、年龄至关重要,但并非所有用户都愿意公开自己的年龄、性别信息,因此会导致用户的基础属性数据缺失,就需要利用现有数据及相关算法进行预测。
[0003]目前现有研究主要采用 SVM、贝叶斯等传统机器学习方法,集成学习作为机器学习的重要部分也逐渐被应用于用户属性预测领域;现有的用户属性预测方法大多通过分析用户的搜索、浏览等互联网行为数据,结合贝叶斯网络算法、随机森林、SVM等单一机器学习算法对用户的性别及年龄进行预测;也有学者以微博用户为研究对象,基于用户昵称、标签、微博文本等对用户的性别、年龄进行预测推测,但其准确率仅为 73.6%;还有的预测方法 ...
【技术保护点】
【技术特征摘要】
1.一种多模型融合的用户属性预测方法,包括以下步骤:(1)数据采集:对广告用户的点击浏览历史进行记录,对浏览记录进行数值化处理得到训练样本,并将所述训练集划分为用于训练和测试的训练集和测试集;(2)特征工程:使用热力图对和特征之间的相关性进行分析,并使用XGBoost算法对各特征进行重要性排名,剔除掉相关性高,并重要性排名较低的特征,实现对特征的筛选;(3)模型训练:将逻辑回归、随机森林、极限树和XGBoost算法作为Stacking模型第一层的元分类器对数据,使用LightGBM作为Stacking模型第二层的...
【专利技术属性】
技术研发人员:黎才茂,陈秋红,林昊,侯玉权,李浩,
申请(专利权)人:海南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。