基于随机梯度攻击的广告点击预测方法技术

技术编号：38860588 阅读：13 留言：0更新日期：2023-09-17 10:03

本发明专利技术提供一种基于随机梯度攻击的广告点击预测方法，该方法充分考虑到广告数据中的离散性数据和连续性数据的不同特点，针对嵌入层和网络层的不同情况，分别采用了随机性和非随机性的数学建模，并将两种数学建模予以组合，由此兼顾不同情况。同时，在数学模型中，可以灵活调整每个特征数据的攻击概率，且可攻击的相关特征数据也可以灵活调整，确保了数学模型的灵活性。型的灵活性。型的灵活性。

全部详细技术资料下载

【技术实现步骤摘要】
基于随机梯度攻击的广告点击预测方法

[0001]本专利技术涉及人工智能领域，具体而言，涉及一种基于随机梯度攻击的广告点击预测方法。

技术介绍

[0002]对抗训练是一种在深度学习领域广泛应用的方法，最初用于提升计算机视觉任务的算法稳定性。它通过利用梯度攻击构造对抗样本，从而使神经网络对噪声和扰动具有更强的鲁棒性。但是，在自然语言处理领域，由于神经网络的输入是离散的符号，无法直接利用梯度攻击来构造对抗样本。而在广告领域中，广告数据也包含大量的字符串数据和离散数据，因此类似于自然语言处理领域的情况，也无法在深度学习的对抗训练中直接利用梯度攻击来构造对抗样本。
[0003]目前，针对对抗训练的方法包括了一系列的技术，如FGSM、FGM、PGD、FreeAT、YOPO、FreeLb和SMART等。当前的改进方向主要集中在两个方面：如何找到最大的扰动以及如何提高对抗训练的速度。
[0004]传统的FGSM和FGM方法在一步计算中很难找到约束内的最优点。相比之下，PGD、FreeLB和SMART等技术通过多次迭代逐步调整扰动，以寻找最大扰动。PGD方法通过分步计算并将超出扰动半径的扰动映射回最大扰动球面上，但它只利用最后一次的梯度进行更新。FreeLB则取每一次的梯度进行加权平均，以获得更准确的扰动更新。SMART方法与其他对抗训练方法不同，它引入了两种对抗正则损失，并将其直接添加到模型的损失函数中。总之，对抗训练的最新改进主要集中在如何找到最大扰动以及如何提高训练速度上。
[0005]以上列举的对抗训练...

【技术保护点】

【技术特征摘要】
1.一种基于随机梯度攻击的广告点击预测方法，其特征在于，所述方法包括如下步骤：收集与广告点击相关的广告特征数据；所述广告特征数据顺次经嵌入层、深度神经网络、隐藏层，获得数据计算结果；在广告特征数据经过嵌入层之时针对广告特征数据中的离散型数据进行基于第一数学模型进行对抗训练，所述第一数学模型为：在广告特征数据经过深度神经网络中的第一网络层时在第一网络层中构建如下第二数学模型：将所述第一数学模型和第二数学模型相结合，形成针对所述数据计算结果的综合数学模型：上述综合数学模型的含义是，在训练数据集D上寻求最优参数θ以最小化扰动Δ引发的结构化风险，其中，训练数据集D是由广告特征数据构成的集合， L是损失函数， f为神经网络，ε表示扰动的约束常数，要求||Δ||≤ε，h
l
表示广告特征数据经过第一网络层处理后输出的隐向量，p
l
为每个广告特征数据被梯度攻击的概率，x表示源自于训练数据集的输入数据，y表示由于扰动Δ引发的...

【专利技术属性】
技术研发人员：朱火庚，林远平，蔡棱，沈鑫杰，
申请(专利权)人：广州钛动科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人