【技术实现步骤摘要】
一种基于场矩阵因子分解机改进的广告投放方法及系统
[0001]本专利技术属于推荐系统领域,具体涉及到点击率预测领域,以及从系数矩阵得到稠密矩阵的深度学习领域。
技术介绍
[0002]现如今我们处于一个信息爆炸的时代,怎样在海量的信息中找到自己想要的信息对于普通的用户来说极为的困难,对于商家来说,投放成功的广告是一件极其重要的问题,广告投放的好,可以为商家带来丰厚的利润,反之,高额的广告费用会让商家蒙受巨大的损失,针对类似问题,点击率预测是推荐系统中的一项重要研究工作。
[0003]点击率(Click through rate,简称CTR)预估是推荐系统中的经典问题之一。点击率预估主要就是寻找出用户最有可能点击的项目并按照概率大小排序。目前,在点击率预估领域,常使用的模型主要为逻辑回归模型,因子分解机模型及其结合多层感知机衍生出来的一系列模型。
[0004]但是这些模型有一些问题,一是特征之间的交互没有考虑特征域之间的关系,二是特征组合之间没有考虑特征组合与特征组合之间相互影响的关系。
[0005]经过检索,公开号为CN106777069A,一种基于矩阵因子分解的个性化推荐方法,其特征在于,包括:搭建面向大数据的计算平台;在已搭建的计算平台内计算目标用户和其它用户的相似性;基于矩阵因子分解并结合目标用户和其它用户的相似性对目标用户未选择过的商品进行评分预测;对目标用户未选择过的商品按照预测的评分大小进行排序后推荐给目标用户。该专利基于矩阵分解的模型,通过训练得出用户矩阵和商品矩阵,并通过用户矩阵 ...
【技术保护点】
【技术特征摘要】
1.一种基于场矩阵因子分解机改进的广告投放方法,其特征在于,包括以下步骤:收集广告数据并对所述广告数据进行预处理,将空值或者无用的数据进行填充或删除操作,并将连续型特征进行分桶处理为离散型特征,并进行one
‑
hot编码处理,并规划出训练集以及测试集;将预处理后的数据集输入到嵌入层,所述嵌入层是一层全连接神经网络,将高维稀疏的one
‑
hot特征转化为定长的低维稠密的特征向量;将嵌入层的输出部分分别输入到FmFM场矩阵因子分解机层和DNN深度神经网络层进行低阶特征交叉和高阶特征交叉,把FmFM和DNN层的输出进行加和并且经过sigmoid函数得到输出值,并且按照输出值排序进行广告投放。2.根据权利要求1所述的一种基于场矩阵因子分解机改进的广告投放方法,其特征在于,所述数据预处理具体包括:使用numpy,pandas工具包进行数据的填充与删除修改,通过使用sklearnbao包中KBinsDiscretizer方法将连续型特征进行分桶处理成离散型特征,再使用sklearn中的one
‑
hotEncoder进行处理所有的特征离散型特征;最后将数据集划分为训练集和测试集采用train_test_split方法。3.根据权利要求1所述的一种基于场矩阵因子分解机改进的广告投放方法,其特征在于,所述通过使用sklearnbao包中KBinsDiscretizer方法将连续型特征进行分桶处理成离散型特征,具体包括:KBinsDiscretizer首先对数据的范围按照一定的间隔分为若干份等长的区间,对属于同一个区间的数值取一个相同的值,不同的区间则取不同的值,因此连续型的特征也转换成了分类的特征类型;再使用sklearn中的one
‑
hotEncoder进行处理所有的特征离散型特征;one
‑
hotEncoder通过将离散的特征转变为特征矩阵,首先确定分类变量,其次转换为二进制向量表示;经过one
‑
hot处理后的向量得到的是稀疏矩阵。4.根据权利要求1
‑
3任一项所述的一种基于场矩阵因子分解机改进...
【专利技术属性】
技术研发人员:孙开伟,宣立德,冉雪,刘虎,李彦,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。