一种基于迁移学习的在线广告受众排序方法技术

技术编号：11112194 阅读：91 留言：0更新日期：2015-03-05 13:12

一种基于迁移学习的在线广告受众排序方法，旨在根据互联网受众对广告的潜在相关性对受众进行排序，使得预算不足的长尾广告主能够通过购买排序靠前的固定数量的用户进行广告投放。本方法假设用户历史行为域与其对广告的偏好域在不同特征空间里，并通过定义相关性转换矩阵建立两者的关系，以减少非相关用户历史行为信息对其广告偏好的影响，进而提出一种改进的基于迁移学习的相关性计算算法——TransferBM25。在此基础上，该方法通过对广告历史数据的预处理、特征抽取、模型训练以及效果评测四个步骤，得到最终的受众排序模型，并根据该模型对广告受众进行排序，从而使得排序后排名靠前的用户具有更高的广告点击概率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及互联网广告数据预处理、特征抽取、模型训练、效果评测方法，特别涉及一种基于迁移学习的在线广告受众排序方法。
技术介绍
科技与互联网在全球的快速发展，带动了一个具有巨大经济价值的新兴产业——在线广告产业。在线广告区别于传统的线下购买的广告投放模式，具有可交互性、可定制、可跟踪、可送达的特点。根据其特点，为优化在线广告的投放效果，使广告主、媒体、受众的收益最大化，一个新兴的学科“计算广告学”诞生了。“计算广告学”旨在根据给定的用户和上下文内容，通过计算得到与之最匹配的广告并进行精准定向投放。行为定向是在线广告中一种主流的受众定向方式，其根据用户的在线历史行为如搜索和网页浏览日志等，将广告正确的投放给对其感兴趣的用户。传统的行为定向方式通过对用户行为进行建模，按照用户对广告的兴趣偏好输出成百上千的用户分段，且每个用户分段会被给予一个标签，如“体育”、“旅行”等，广告主会通过这些标签来判断是否够购买这些用户分段，以尽可能的将广告投放给对其产品感兴趣的受众。然而，这样的受众选择方法过于依赖人工经验，且用户分段中可能包含数百万的用户，一些长尾广告主由于预算有限无法负担起如此大量的用户。为了有效利用有限的预算，广告主希望选择更小范围的受众。根据用户对广告的潜在兴趣，并通过对广告与用户的相关性排序，广告主选择相关性排序靠前的固定数量的用户进行广告投放，从而获得更好的广告收益。该问题称为受众排序问题。受众排序依赖于传统...
一种基于迁移学习的在线广告受众排序方法

【技术保护点】
一种基于迁移学习的在线广告受众排序方法，其特征在于，包括如下步骤：数据预处理、特征抽取、模型训练和效果评测；步骤一：数据预处理过程如下：1)抽取广告标题及其描述信息；2)从互联网历史日志中，抽取用户长期的搜索引擎查询信息，并将其聚合在一起；步骤二：特征抽取过程如下：1)提出引入迁移知识的改进BM25算法——TransferBM25，用于计算广告与用户的相关性分数；2)计算用于排序学习模型训练的特征值；步骤三：模型训练过程如下：1)采用基于Pairwise的SVM Ranking排序学习模型进行训练；步骤四：实验评测过程如下：1)提出用于受众排序效果评价的指标；2)基于训练后的最优模型对测试数据集中的受众进行排序并对其效果进行评测。

【技术特征摘要】
1.一种基于迁移学习的在线广告受众排序方法，其特征在于，包括如下步骤：数据预处理、
特征抽取、模型训练和效果评测；
步骤一：数据预处理过程如下：
1)抽取广告标题及其描述信息；
2)从互联网历史日志中，抽取用户长期的搜索引擎查询信息，并将其聚合在一起；
步骤二：特征抽取过程如下：
1)提出引入迁移知识的改进BM25算法——TransferBM25，用于计算广告与用户的相关性
分数；
2)计算用于排序学习模型训练的特征值；
步骤三：模型训练过程如下：
1)采用基于Pairwise的SVM Ranking排序学习模型进行训练；
步骤四：实验评测过程如下：
1)提出用于受众排序效果评价的指标；
2)基于训练后的最优模型对测试数据集中的受众进行排序并对其效果进行评测。
2.根据权利要求1所述的基于迁移学习的在线广告受众排序方法，其特征在于步骤二：假
设用户历史行为域与其对广告的偏好域在不同特征空间里，并通过定义相关性转换矩阵建立两
者的关系，以减少非相关用户历史行为信息对其广告偏好的影响，定义R(a|q)来表示查询q与
广告a的相关性，其表达式为：
对于与广告相关性很差的查询，使用次数多，而召回的广告少，因此R(a|q)分值会很低；
而对于与广告相关性较强的查询而言，R(a|q)则会得到较高的分值；定义转换矩阵
T[i,j]＝R(aj|qi)，则引入迁移知识的用户查询矩阵为Utransfer＝Uquery*T，其中Uquery为原始用户
查询矩阵。
3.根据权利要求2所述的基于迁移学习的在线广告受众排序方法，其特征在于：步骤二中
所述的TransferBM25方法如下：
对于给定的广告A，用户U以及包含关键词q1...qn的广告查询Q，TransferBM25定义为：
TransferBM 25 ( A , U , Q ) = Σ i = 1 n IDF ( q i ) * R ( A | q i ) * f ( q i , U ) * ( k + 1 ) f ( q i , U ) + k * ( 1 - b + b * | U | avgdl ) ]]>其中f(qi,U)为qi在用户历史查询U中出现的词频，其计算方法为f(qi,U)＝|qi|/|q∈U|，
|U|为用户历史查询中包含的关键词个数，avgl为用户集合中所有用户历史查询中平均包含的

【专利技术属性】
技术研发人员：张立鑫，陈真勇，陈朋杰，熊璋，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人