一种基于动态深度注意力模型的点击率预测方法技术

技术编号：28978981 阅读：13 留言：0更新日期：2021-06-23 09:25

本发明专利技术公开了一种基于动态深度注意力模型的点击率预测方法，包括以下步骤：S1、在客户端获取用户对推荐项目点击的多个原始数据组；S2、对存储在服务器的多个原始数据组进行预处理，得到多类别的特征数据；S3、将多类别的特征数据输入输入层，得到高维稀疏向量；S4、将高维稀疏向量输入嵌入层，通过嵌入层将高维稀疏向量映射为低维向量数据；S5、通过维数转换层将低维向量数据转换为标准维度向量数据；S6、通过交互层提取标准维度向量数据的高阶特征交互数据；S7、根据高阶特征交互数据，通过输出层计算点击率预测结果；本发明专利技术解决了现有点击率预测模型中忽略了对不同的特征需要不一样的计算资源的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于动态深度注意力模型的点击率预测方法
本专利技术涉及信息投放领域，具体涉及一种基于动态深度注意力模型的点击率预测方法。
技术介绍
对于大多数互联网公司，例如Google，Amazon和Facebook，推荐系统都是必不可少的。点击率(CTR)预测在推荐系统中起着至关重要的作用，该系统的任务是预测用户点击推荐项目(如广告，音乐或电影)的可能性。预测的性能对两个方面都有重要影响。一方面，它直接决定了商业提供者的最终收入。另一方面，它影响用户体验，这对公司的长期发展具有重要意义。由于其卓越的作用，它引起了人们对研究和工业的越来越多的兴趣。机器学习最近在点击率预测中发挥了关键作用。众所周知，特征工程通常被认为是成功完成机器学习任务的关键之一。除了使用原始特征之外，对原始特征进行有效转换以提高预测模型的性能通常也很重要。交叉特征是特征变换的主要类型，稀疏原始特征相乘来形成新特征。例如，向20至30岁的女性推荐玫瑰金iPhone是合理的。但是，要找到这种有意义的组合功能，很大程度上取决于领域专家。而且，几乎不可能手动进行所有有意义的组合。为了解决这个问题，现有提出了因式分解机(FM)来建模特征相互作用，并已被证明可用于各种任务。但是，由于其多项式拟合时间的限制，它通常适合于对低阶特征交互进行建模，而对于捕获高阶特征交互则不切实际。为了对高阶特征交互进行建模，已经提出了许多基于深度神经网络(DNN)的工作。这些模型更具表现力，并且可以探索大多数特征相互作用。最近的研究表明，当目标是大量不相关函数的集合时，DN...

【技术保护点】
1.一种基于动态深度注意力模型的点击率预测方法，其特征在于，所述动态深度注意力模型包括依次连接的输入层、嵌入层、维数转换层、交互层和输出层，其方法包括以下步骤：/nS1、在客户端获取用户对推荐项目点击的多个原始数据组；/nS2、将多个原始数据组上传至服务器进行存储，并对存储在服务器的多个原始数据组进行预处理，得到多类别的特征数据；/nS3、将多类别的特征数据输入输入层，得到高维稀疏向量；/nS4、将高维稀疏向量输入嵌入层，通过嵌入层将高维稀疏向量映射为低维向量数据；/nS5、通过维数转换层将低维向量数据转换为标准维度向量数据；/nS6、通过交互层提取标准维度向量数据的高阶特征交互数据；/nS7、根据高阶特征交互数据，通过输出层计算点击率预测结果。/n

【技术特征摘要】
1.一种基于动态深度注意力模型的点击率预测方法，其特征在于，所述动态深度注意力模型包括依次连接的输入层、嵌入层、维数转换层、交互层和输出层，其方法包括以下步骤：
S1、在客户端获取用户对推荐项目点击的多个原始数据组；
S2、将多个原始数据组上传至服务器进行存储，并对存储在服务器的多个原始数据组进行预处理，得到多类别的特征数据；
S3、将多类别的特征数据输入输入层，得到高维稀疏向量；
S4、将高维稀疏向量输入嵌入层，通过嵌入层将高维稀疏向量映射为低维向量数据；
S5、通过维数转换层将低维向量数据转换为标准维度向量数据；
S6、通过交互层提取标准维度向量数据的高阶特征交互数据；
S7、根据高阶特征交互数据，通过输出层计算点击率预测结果。

2.根据权利要求1所述的基于动态深度注意力模型的点击率预测方法，其特征在于，步骤S1中每个所述原始数据组包括：用户数据、推荐项目数据和是否点击。

3.根据权利要求1所述的基于动态深度注意力模型的点击率预测方法，其特征在于，所述步骤S3中输入层的输出为高维稀疏向量x，x＝[x1，...，xi，...，xM]，其中，xi为第i类特征数据，M为特征类别个数。

4.根据权利要求3所述的基于动态深度注意力模型的点击率预测方法，其特征在于，所述步骤S4中嵌入层的输入输出关系式为：
E＝[e1，...，ei，...，eM]
ei＝Vixi
其中，E为嵌入层输出的低维向量数据，为嵌入矩阵，为实数域，de为嵌入层的维度，ni为第i类特征可取的值的数量，ei为嵌入层输出的第i个低维向量。

5.根据权利要求4所述的基于动态深度注意力模型的点击率预测方法，其特征在于，所述步骤S5中维数转换层对第i个低维向量进行维度转换的公式为：
ai＝WAei+b

其中，ai为标准维度向量数据，WA为维数转换层的权重矩阵，dmodel为每个特征类别的维度，b为偏置。

6.根据权利要求5所述的基于动态深度注意力模型的点击率预测方法，其特征在于，所述步骤S6中交互层包括多个子层，每个所述子层包括：多头自注意力单元和Add＆Norm单元；
所述多头自注意力单元的输出数据和多头自注意力单元的输入数据均输入Add＆Norm单元的输入端中；所述多头自注意力单元的输入端作为子层的输入端；所述Add＆Norm单元的输出端作为子层的输出端。

7.根据权利要求6所述的基于动态深度注意力模型的点击率预测方法，其特征在于，所述多头自注意力单元的输入输出的关系式为：

其中，为第1个子层中多头自注意力单元的输入，第一个子层中多头自注意力单元的输出，Concat()表示将结果连在一起，WO为联结参数矩阵，h为头数，dv为值的维度，headi为第i个头的计算结果，WiQ为查询参数矩阵，dk为键的维度，WiK为键参数矩阵，WiV为值参数矩阵。

8.根据权利要求6所述的基于动态深度注意力模型的点击率预测方法，其特征在于，所述Add＆Norm单元输入输出的关系式为：

其中，为Add＆Norm单元的输出，LayerNorm()为归一化函数，为多头自注意力单元的输入，为多头自...

【专利技术属性】
技术研发人员：邵杰，刘树锦，陈得荣，
申请(专利权)人：四川省人工智能研究院宜宾，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人