【技术实现步骤摘要】
点击率预测模型及其训练方法与应用装置
[0001]本专利技术涉及点击率预测
,更具体地说,本专利技术涉及一种点击率预测模型及其训练方法与应用装置。
技术介绍
[0002]随着信息技术的迅猛发展,诸如电子商务、新闻资讯、社交平台等各种在线服务层出不穷,在给人们生活带来便捷的同时,也造成了严重的“信息过载”问题,使得人们在数据海洋中难以找到满足自己需求的信息。推荐系统是缓解这一难题的重要技术手段之一,作为推荐系统核心功能模块的点击率预测技术备受学术界与工业界的关注,不同研究从不同的视角下提出各种点击率预测方法与模型,广泛地应用在各种各样的新闻推荐平台、电商平台和计算广告行业中。
[0003]在进行特征交互信息聚集时,现有广泛使用的点击率预测模型因子分解机通常都是采用交叉向量的求和池化手段,另外,现有的点击率预测模型对模型初始嵌入特征向量的优化工作很少考虑,这使得无法有效利用交叉向量细粒度的信息,从而损害模型的预测性能。
技术实现思路
[0004]本专利技术的一个目的是解决至少上述缺陷,并提供至少后面
【技术保护点】
【技术特征摘要】
1.点击率预测模型,其特征在于,包括:输入层,其用于将用户实例信息以独热编码或多热编码的高维稀疏数据读入;嵌入层,其用于将高维稀疏数据转化为低维稠密向量,得到用户与项目的嵌入表示;积增强层,其用于对嵌入表示在特征域层级、特征维度层级与全局特征比特层级进行压缩、激励和放缩,实现嵌入表示的优化;深度因子分解模块与深度残差网络模块,其用于对优化的嵌入表示进一步捕捉嵌入特征的高阶隐式交互信息;输出层,其用于集成深度因子分解模块与深度残差网络模块的输出,计算目标项目被点击的概率。2.如权利要求1所述的点击率预测模型,其特征在于,所述用户实例信息包括用户属性、项目属性或用户历史行为属性。3.点击率预测模型的训练方法,其特征在于,如权利要求1或2所述的点击率预测模型,训练方法包括:步骤1、初始化所述点击率预测模型的参数集合;步骤2、从所有实例样本中采样批量样本;步骤3、通过所述点击率预测模型的输入层将用户实例信息中的离散属性与离散化的连续属性进行独热形式或多热方式的稀疏编码,获得用户实例信息的高维稀疏表示;步骤4、通过所述点击率预测模型的嵌入层将用户实例信息的高维稀疏表示转化为低维稠密向量,得到用户与项目的嵌入表示;步骤5、通过所述点击率预测模型的积增强层对实例信息的低维嵌入表示特征域层级、特征维度层级与全局特征比特层级进行压缩、激励和放缩,实现嵌入表示的优化;步骤6、利用深度因子分解模块对基于积增强层优化的数据实例嵌入表示,进一步捕捉嵌入特征表示中的高阶隐式交互信息;步骤7、利用深度残差网络模块对基于积增强层优化的数据实例嵌入表示,进一步捕捉嵌入特征表示中的高阶隐式交互信息;步骤8、集成深度因子分解模块与深度残差网络模块的输出,计算目标项目被点击的预测分数;步骤9、利用项目点击实际情形与项目点击预测情形,计算基于交叉熵的点击预测损失Loss;步骤10、采用基于误差反向传播的Adam优化器优化交叉熵损失,调整所述预测模型的权重参数,且学习率在{0.0001,0.01}之间搜索;步骤11、以循环执行从步骤2到步骤10直到指定迭代数的方式训练所述预测模型。4.如权利要求3所述的训练方法,其特征在于,所述步骤4中通过如下方法获得用户与项目的嵌入表示e={e1,e2,
…
,e
m
}:e
i
=M
i
X
i
,i=1,2,
…
,me
j
=M
j
X
j
,i=1,2,
…
,m其中X
i
与X
j
分别是数据实例X的离散属性i与离散属性j的独热编码向量与多热编码向量,e
i
与e
j
分别表示当前输入实例X在特征域F
i
和F
j
对应的嵌入向量,M
i
是k
×
n
i
的实数矩阵,n
i
是特征域F
i
包含的特征数目,m是特征域集F={F1,F2,
…
,F
m
}的大小。
5.如权利要求4所述的训练...
【专利技术属性】
技术研发人员:黄发良,尹云飞,戴智鹏,张意晨,任皓,农伟骏,孙敬钦,
申请(专利权)人:南宁师范大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。