【技术实现步骤摘要】
基于领域交互信息强度因子分解机的电影点击率预估方法
本专利技术涉及推荐系统领域,具体涉及一种基于领域交互信息强度因子分解机的电影点击率预估方法,该方法基于领域信息解决输入数据稀疏问题以及特征交互问题。
技术介绍
随着互联网的飞速发展,网络信息浩如烟海,对于用户而言,如何在以指数级增长的资源中快速、准确地定位到自己需要的内容是一件极具挑战性的事情。同时对于商家而言,如何在正确的时间点将恰当的信息呈现给用户对商家的经济发展起到了关键导向。针对信息过载问题,推荐系统应运而生,通过利用用户画像、物品信息以及用户的搜索、点击、收藏等行为数据,对不同用户进行个性化推荐。用户点击率预测研究是推荐系统中十分重要的组成模块,也是程序化广告交易框架中智慧核心组件,学习和预测用户的行为模式对个性化推荐系统、智能信息检索等领域都有着极其重要的意义。点击率(Clickthroughrate,简称CTR)预估是大数据技术应用的经典问题之一。点击率预估的一个重要应该就是把最合适的广告或推荐产品找出来呈现给用户。目前,在广告、金融等推荐领域中,通常 ...
【技术保护点】
1.一种基于领域交互信息强度因子分解机的电影点击率预估方法,其特征在于,包含:/nS1、选定数据集作为数据样本,对数据样本进行预处理操作,将预处理后的数据样本划分为训练集和测试集;/nS2、对所述训练集的数据进行数据集成,得到低维稠密向量;/nS3、采用所述低维稠密向量训练基于领域交互信息强度因子分解机的电影点击率预估模型;/nS4、采用测试集和评价指标对步骤S3所得的电影点击率预估模型测试进行验证。/n
【技术特征摘要】
1.一种基于领域交互信息强度因子分解机的电影点击率预估方法,其特征在于,包含:
S1、选定数据集作为数据样本,对数据样本进行预处理操作,将预处理后的数据样本划分为训练集和测试集;
S2、对所述训练集的数据进行数据集成,得到低维稠密向量;
S3、采用所述低维稠密向量训练基于领域交互信息强度因子分解机的电影点击率预估模型;
S4、采用测试集和评价指标对步骤S3所得的电影点击率预估模型测试进行验证。
2.如权利要求1所述的基于领域交互信息强度因子分解机的电影点击率预估方法,其特征在于,所述步骤S2具体为:
将训练集的数据通过模型嵌入层完成输入向量压缩至低维稠密向量;
所述模型嵌入层为全连接的神经网络,所述模型嵌入层用于将编码后的稀疏数据转并为指定低维度的稠密向量。
3.如权利要求1所述的基于领域交互信息强度因子分解机的电影点击率预估方法,其特征在于,所述电影点击率预估模型包含FwFM模块和DNN模块,所述步骤S3具体包含:
将所述步骤S2所得的低维稠密向量输入到基于领域交互强度信息的因子分解机模型FwFM中进行低阶特征交互,并将其输出数据输入到Attention机制层进行加权处理,以获得FwFM模块的预测结果;
将所述步骤S2所得的低维稠密向量输入到深度神经网络DNN中进行高阶特征交互,得到DNN模块的预测结果;
将FwFM模块的预测结果和DNN模块的预测结果通过sigmoid函数激活得出电影点击率预估模型的预测结果,所述电影点击率预估模型的预测结果为:
其中,表示电影点击率预估模型的预测结果,yFwFM表示FwFM模块的预测结果,yDNN表示DNN模块的预测结果。
4.如权利要求3所述的基于领域交互信息强度因子分解机的电影点击率预估方法,其特征在于,所述Attention机制层的Attention机制计算方法为:
其中,aij为注意力值,hT为权重矩阵;W为Attention机制层初始权重;xi,xj分别表示第i列与第j列输入数据即特征分量;vi,vj分别表示xi,xj对应的隐向量,<vi,vj>表示隐向量的内积;F(i),F(j)分别表示特征分量i,特征分量j所属的领域,rF(i),F(j)为权重,其用于建模域F(i)与域F(j)之间的交互强度;b∈Rt,b为模型参数,R为实数集,t为模型隐含层数。
5.如权利要求3或4所述的基于领域交互信息强度因子分解机的电...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。