基于U-Net网络的互联网广告点击率预估方法技术

技术编号：21036631 阅读：29 留言：0更新日期：2019-05-04 06:15

本发明专利技术提出了一种基于U‑Net网络的互联网广告点击率预估方法，主要用以解决现有互联网广告点击率预估方法中存在的预估精度低的技术问题，包括如下步骤：获取训练数据集和测试数据集；获取原始特征索引矩阵和原始特征值矩阵；基于深度卷积神经网络U‑Net构建点击率预估模型；对点击率预估模型进行训练；获取互联网广告点击率预估结果。本发明专利技术提出的基于U‑Net网络的互联网广告点击率预估方法，提高了互联网广告点击率预估模型的泛化能力，加强了对互联网广告数据深层特征的提取，明显地提高了点击率预估的精度，可应用于互联网广告投放领域。

Click-through Rate Prediction Method of Internet Advertising Based on U-Net Network

全部详细技术资料下载

【技术实现步骤摘要】
基于U-Net网络的互联网广告点击率预估方法
本专利技术属于互联网
，涉及一种互联网广告点击率预估方法，具体涉及一种基于U-Net网络的互联网广告点击率预估方法，可应用于互联网广告投放领域。
技术介绍
随着电子商务的发展，互联网广告已成为一种新媒介广告进入人们的生活。通常，广告主在投放广告之前，希望了解网站上某广告位的已投放广告的点击率，并根据了解的点击率来制定预订广告位的决策。为给广告主提供预定广告位置决策的依据，可以对某广告位置上所投放的广告的点击率进行预估，以供广告主参考。现有技术进行广告点击率预估通常采用的方法是：用待预估广告的历史数据训练出预估模型，上述历史数据包括待预估广告的特征和实际点击率，将待预估广告的特征作为预估模型的输入，将预估模型的输出结果作为待预估广告的预估点击率。其中，模型进行点击率预估的精度，即预估的准确率依赖于模型针对输入数据特征的泛化能力，即对原始特征进行隐含特征提取的能力，其中隐含特征包含原始特征的交叉组合特征和原始特征的深层特征。互联网广告点击率预估方法根据所使用基础算法不同，主要分为基于机器学习模型的预估方法和基于深度神经网络模型的预估方法。其中，基于机器学习模型的预估方法主要利用矩阵分解方式对互联网广告数据进行点击率预估，随着网络用户不断地增加，无法应对互联网广告数据量大的问题。目前基于深度学习的互联网广告点击率预估方法的研究刚刚起步，其主要思想是利用深度神经网络进行训练数据的高阶特征的提取，从而实现互联网广告的点击率预估，该方法提高了在复杂场景下的点击率预估精度。例如，Guo等人于2017年5月在IJCAI发...

【技术保护点】
1.一种基于深度卷积神经网络U‑Net的互联网广告点击率预估方法，其特征在于，包括如下步骤：(1)获取训练数据集和测试数据集：(1a)选取N个按行排列且包含有原始特征和实际点击率的互联网广告数据，其中，每个广告数据的原始特征，包括广告所针对人群的特征和广告对应产品的特征，广告所针对人群的特征和广告对应产品的特征均由分类型特征和数值型特征组成，N≥500000；(1b)对互联网广告数据按行进行缺失值填补，并从得到的不包含空值的N个按行排列的互联网广告数据中选取M个广告数据作为测试数据，剩余广告数据作为训练数据，M≥20000；(1c)分别对训练数据和测试数据中的分类型特征进行类别编码，对数值型特征进行归一化，得到训练数据集和测试数据集；(2)获取原始特征索引矩阵和原始特征值矩阵：(2a)将训练数据集和测试数据集中数值型特征包含的数值分别按照从小到大的顺序进行排列，并将排列结果中每个数值对应的序号作为数值型特征索引，将排列结果中的每个数值作为数值型特征值，同时将训练数据集和测试数据集中分类型特征包含的类别分别按照从小到大的顺序进行排列，并将排列结果中的每个类别对应的序号作为分类型特征索引，...

【技术特征摘要】
1.一种基于深度卷积神经网络U-Net的互联网广告点击率预估方法，其特征在于，包括如下步骤：(1)获取训练数据集和测试数据集：(1a)选取N个按行排列且包含有原始特征和实际点击率的互联网广告数据，其中，每个广告数据的原始特征，包括广告所针对人群的特征和广告对应产品的特征，广告所针对人群的特征和广告对应产品的特征均由分类型特征和数值型特征组成，N≥500000；(1b)对互联网广告数据按行进行缺失值填补，并从得到的不包含空值的N个按行排列的互联网广告数据中选取M个广告数据作为测试数据，剩余广告数据作为训练数据，M≥20000；(1c)分别对训练数据和测试数据中的分类型特征进行类别编码，对数值型特征进行归一化，得到训练数据集和测试数据集；(2)获取原始特征索引矩阵和原始特征值矩阵：(2a)将训练数据集和测试数据集中数值型特征包含的数值分别按照从小到大的顺序进行排列，并将排列结果中每个数值对应的序号作为数值型特征索引，将排列结果中的每个数值作为数值型特征值，同时将训练数据集和测试数据集中分类型特征包含的类别分别按照从小到大的顺序进行排列，并将排列结果中的每个类别对应的序号作为分类型特征索引，将排列结果中的每个类别作为分类型特征值，分类型特征值的大小统一定义为a，a≥1；(2b)将数值型特征索引和分类型特征索引的组合保存为原始特征索引矩阵，同时将数值型特征值和分类型特征值的组合保存为原始特征值矩阵；(3)基于深度卷积神经网络U-Net构建点击率预估模型：将深度卷积神经网络U-Net收缩路径中的深度卷积模块替换为由P个c×c卷积层组成的深度收缩模块，并在深度收缩模块与该U-Net的输入层之间添加宽度线性收缩模块，将扩张路径中的嵌套卷积模块替换为包含P个转置卷积层和P个d×d卷积层的扩张模块，同时将扩张路径中的输出层替换为softmax分类器，得到点击率预估模型，其中，P≥2，c≥1，d≥1；(4)对点击率预估模型进行训练：(4a)...

【专利技术属性】
技术研发人员：刘若辰，张豪，焦李成，刘静，慕彩虹，张向荣，
申请(专利权)人：西安电子科技大学，
类型：发明
国别省市：陕西,61

全部详细技术资料下载我是这个专利的主人