一种广告点击率预测方法、装置及计算机设备制造方法及图纸

技术编号:31757751 阅读:21 留言:0更新日期:2022-01-05 16:41
本发明专利技术属于电商大数据推荐领域,涉及一种广告点击率预测方法、装置及计算机设备;所述方法包括获取电商平台的用户行为数据,用户肖像数据和广告数据;对用户行为数据进行预处理形成用户行为序列;将用户行为序列、用户肖像数据、广告数据分别进行编码表示,得到对应特征的嵌入向量;采用基于注意力机制的深度神经网络,提取出用户的兴趣表示向量;采用堆栈式自动编码机,提取出用户肖像特征与广告特征之间的隐形关系向量;将用户的兴趣表示向量和隐形关系向量输入到多层感知机中进行联合训练,得到广告点击率的预测结果;本发明专利技术能够有效提高电商平台广告的点击率,实现精准营销和推荐的效果。的效果。的效果。

【技术实现步骤摘要】
一种广告点击率预测方法、装置及计算机设备


[0001]本专利技术属于电商大数据推荐领域,特别涉及一种基于用户兴趣与时序行为的广告点击率预测方法、装置及计算机设备。

技术介绍

[0002]随着信息技术的发展,许多国内外互联网电商平台越来越关注在线广告系统的盈利效果,注重实现个性化、精准化的营销策略。广告点击率(CTR,Click Through Rate)是电商平台系统中最核心的指标之一,在广告推荐、网页搜索、赞助推荐等领域至关重要。点击率预测的准确度不仅会影响电商平台的收益,还会影响用户的满意度和消费体验。
[0003]在当前的电商平台中,尽管营销人员想知道网络访问者的反应,但是使用当前技术几乎不可能量化对网站的情感反应以及该网站对公司品牌的影响。不过,点击率却是很容易获得。点击率衡量的是页面访问者数量与该页面商品广告点击后并将其重定向到另一个页面的访问者的比例,在该页面中,他们可以购买商品或了解有关产品或服务的更多信息。通常,点击率越高,则表明该广告商品更有商业价值或是该营销活动更吸引人。大多数电商网站旨在通过点击率来调整主页商品广告的展示,做个性化推荐。
[0004]目前,许多国内外学者都对CTR模型展开了深入的研究,研究成果主要体现在以下几个方面:一方面,随着深度学习技术的发展,深度CTR模型逐步取代了需要人工特征工程的LR等基于机器学习的CTR模型。另一方面,一些深度CTR模型注重于特征的压缩与交互。此外,也有模型重点关注用户行为序列特征的提取。但是现阶段的广告点击率仍存在以下不足:
[0005]1.用户历史行为序列的时效性。传统时序模型忽略了顺序行为之间的时间间隔对用户兴趣表达的影响,传统的RNN可以很好地捕捉行为序列中的顺序关系之间的依赖关系,但用户行为不仅仅是顺序关系,行为的时间间隔和行为的特点等含有更多的先验信息,这些信息对用户兴趣的表示至关重要。
[0006]2.用户兴趣的泛化性和复杂性。用户的兴趣具有多样性并且有变化的趋势,用户在某一段时间内的喜好具有集中性,并且每种兴趣都有自己的演变趋势,不同种类的兴趣之间很少相互影响。
[0007]3.数据特征的维度高,隐性信息量大。电商平台广告数据输入特征除了用户行为序列特征外,上下文特征、广告特征等特征之间的关系也影响着点击率预估的准确度。这些特征维度高,隐含信息大,获取它们之间的关系变得困难。

技术实现思路

[0008]针对上述不足,本专利技术提出一种广告点击率预测方法、装置及计算机设备用以解决广告点击率的预测问题。
[0009]在本专利技术的第一方面,本专利技术提供了一种广告点击率预测方法,所述方法包括:
[0010]获取电商平台的用户行为数据,用户肖像数据以及广告数据;
[0011]对电商平台的用户行为数据进行预处理,并形成用户行为序列;
[0012]将用户行为序列、用户肖像数据、广告数据分别进行编码表示,得到对应特征的嵌入向量;
[0013]输入用户行为序列特征,采用基于时间因子的Time

GRU的深度神经网络,输出用户的兴趣表示向量;
[0014]输入用户的兴趣表示向量,采用基于注意力机制的AT

GRU的深度神经网络,模拟兴趣的更新过程,并输出用户的兴趣更新向量;
[0015]输入用户肖像特征和广告特征,采用堆栈式自动编码机,提取出用户肖像特征与广告特征之间的隐形关系向量;
[0016]将用户的兴趣表示向量和用户肖像特征与广告特征之间的隐形关系向量输入到多层感知机中进行联合训练,得到广告点击率的预测结果。
[0017]在本专利技术的第二方面,本专利技术还提供了一种广告点击率预测装置,所述装置包括:
[0018]获取模块,用于获取电商平台的用户行为数据,用户肖像数据以及广告数据;
[0019]处理模块,用于对电商平台的用户行为数据进行预处理,并形成用户行为序列;
[0020]嵌入模块,用于将用户行为序列、用户肖像数据、广告数据分别进行编码表示,得到对应特征的嵌入向量;
[0021]第一特征提取模块,用于输入用户行为序列特征,采用基于时间因子的Time

GRU的深度神经网络,输出用户的兴趣表示向量;
[0022]第二特征提取模块,用于输入用户的兴趣表示向量,采用基于注意力机制的AT

GRU的深度神经网络,模拟兴趣的更新过程,并输出用户的兴趣更新向量;
[0023]第三特征提取模块,用于输入用户肖像特征和广告特征,采用堆栈式自动编码机,提取出用户肖像特征与广告特征之间的隐性关系向量;
[0024]广告点击率预测模块,用于将用户的兴趣表示向量和用户肖像特征与广告特征之间的隐形关系向量输入到多层感知机中进行联合训练,得到广告点击率的预测结果。
[0025]在本专利技术的第三方面,本专利技术还提供了一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如本专利技术第一方面所述方法的步骤。
[0026]本专利技术的有益效果:
[0027]本专利技术利用电商平台的用户行为数据和目标广告数据,针对用户时序行为序列背后隐藏的用户兴趣,通过对其兴趣更新过程进行更新与建模得到兴趣表示,结合其它非时序特征之间的隐形关联进行广告点击率的预测,本专利技术能够有效提高电商平台广告的点击率,实现精准营销和推荐的效果。
附图说明
[0028]图1为本专利技术实施例中广告点击率预测框架图;
[0029]图2为本专利技术实施例中广告点击率预测方法流程图;
[0030]图3为本专利技术构建时序模型模拟用户兴趣特征示图;
[0031]图4为本专利技术构建注意力机制的兴趣更新模型示图;
[0032]图5为本专利技术引入一种非监督的特征提取方法示图;
[0033]图6为本专利技术是私立中广告点击率预测装置结构图。
具体实施方式
[0034]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0035]图1为本专利技术实施例中广告点击率预测框架图,如图1所示,在本实施例的预测框架中,主要包括四个部分,首先,采集用户行为数据,用户肖像数据以及广告数据;对这些数据进行处理后得到用户行为序列、用户肖像特征和广告特征;其次,采用数据特征处理的方式,利用用户行为序列构建出兴趣更新模型,再利用兴趣模拟模型得到用户的兴趣表示向量,同时还利用特征交互模型对用户肖像数据以及广告数据进行处理,提取出隐性关系向量;然后再结合用户最终兴趣表示和非时序特征隐形关系构建出点击率预测模型;利用该点击率预测模型可以预测出广告点击率,还可以根据广告点击率完成精准的广告推送。
[0036]图2为本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种广告点击率预测方法,其特征在于,具体包括以下步骤:获取电商平台的用户行为数据,用户肖像数据以及广告数据;对电商平台的用户行为数据进行预处理,并形成用户行为序列;将用户行为序列、用户肖像数据、广告数据分别进行编码表示,得到对应特征的嵌入向量;输入用户行为序列特征,采用基于时间因子的Time

GRU的深度神经网络,输出用户的兴趣表示向量;输入用户的兴趣表示向量,采用基于注意力机制的AT

GRU的深度神经网络,模拟兴趣的更新过程,并输出用户的兴趣更新向量;输入用户肖像特征和广告特征,采用堆栈式自动编码机,提取出用户肖像特征与广告特征之间的隐形关系向量;将用户的兴趣更新向量,用户肖像特征与广告特征之间的隐形关系向量分别输入到多层感知机中进行联合训练,得到广告点击率的预测结果。2.根据权利要求1所述的一种广告点击率预测方法,其特征在于,所述对电商平台的用户行为数据进行预处理包括去除无效的用户行为数据;按照用户的数量进行数据的统计,并按照每个用户的ID、浏览广告和时间戳信息拼接出原始的用户行为数据;采用多重插值的方法对统计后的用户行为数据进行补全;构建出基于时间差的用户行为序列;并根据用户ID对用户行为数据进行分组,将用户行为数据以时间的先后顺序排序,构成用户行为序列;对于其中的每一个行为序列,使用下一个行为的时间戳与当前行为的时间戳之差作为时间。3.根据权利要求1所述的一种广告点击率预测方法,其特征在于,所述输出用户的兴趣表示向量包括根据用户行为序列,采用基于时间因子的Time

GRU即时间门控循环单元学习用户的静态兴趣组状态集合;也即是根据输入的用户行为序列特征,计算出时间门权重;将所述时间门权重加入到更新门的第一更新策略中;通过时间门控循环单元中的重置门和更新门来选择出的静态兴趣组状态集合。4.根据权利要求3所述的一种广告点击率预测方法,其特征在于,所述第一更新策略表示为其中,h
t
表示Time

GRU中第t个隐藏兴趣状态;z
t
是Time

GRU中更新门;是逐元素相乘,T
t
表示时间门权重,h
t
‑1表示Time

GRU中第t

1个隐藏兴趣状态;T
t
=σ(W
t
[log(Δt+ζ),i
t
]);σ是sigmoid激活函数,W
t
表示时间门的第t个隐含状态矩阵;Δt表示时间因子,即当前行为的时间戳与上一个行为的时间戳之差;ζ表示时间门偏置;i
t
表示Time

GRU的输入向量;表示Time

GRU中第t个隐藏兴趣状态的临时状态。5.根据权利要求3或4所述的一种广告点击率预测方法,其特征在于,所述输出用户的兴趣更新向量包括根据所述静态兴趣组状态集合,计算每个兴趣状态与目标广告的注意力分数;根据静态兴趣组状态集合和所述注意力分数,采用基于注意力机制的AT

GRU即基于注意力机制的门控循环单元计算得到兴趣最终更新状态,也即是将注意力分数作为更新门,采用注意力分数的大小作为更新门的第二更新策略,通过该更新门和时间门控循环单元中的重置门来选择出的兴趣最终更新状态。
6.根据权利要求5所述的一种广告点击率预测方法,其特征在于,所述第二更新策略表示为其中,h'
t
...

【专利技术属性】
技术研发人员:肖云鹏朱江湖王蓉贾朝龙李暾李茜卢星宇
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1