一种基于机器学习的在线广告精准投放方法技术

技术编号:27491687 阅读:19 留言:0更新日期:2021-03-02 18:10
本发明专利技术公开了基于机器学习的在线广告精准投放方法,包括以下步骤:S10,数据采集;S20,特征标签提取;S30,TGCW在线分类学习;S40,类别生成;S50,广告投放。本发明专利技术针对大数据精准营销中用户画像的刻画,对用户的浏览行为生成的流数据进行分析从而对用户进行分类,以此实现针对各类别用户的精准广告投放。现针对各类别用户的精准广告投放。现针对各类别用户的精准广告投放。

【技术实现步骤摘要】
一种基于机器学习的在线广告精准投放方法


[0001]本专利技术属于机器学习领域,涉及一种基于机器学习的在线广告精准投放方法。

技术介绍

[0002]随着信息技术的迅猛发展,尤其是互联网行业的广泛应用,越来越多的领域出现了对海量高速到达的数据实时处理需求。在电商行业产生的业务数据大多数情况下可以看作动态到达的流式数据,与传统数据相比,这类数据具有动态性、无序性、无限性、不平衡和体积大等特点。而现代数字广告投放系统中常常以物拟人、以物窥人,所以在大数据的精准营销中刻画用户画像则需要考虑如何从用户的浏览行为生成的海量流数据中进行实时分析,对每一个样本进行精准分类,从而实现对每位用户进行精准的广告投放。
[0003]但是如果使用传统的批处理式的学习方法来对用户的浏览行为分析,一方面不仅存在学习时间长、学习效率低的问题,而且未考虑到数据的不平衡性,一定程度上会影响学习分类精度;另一方面难以针对增量数据有效地更新模型,即无法记忆大部分以前学得的模型,导致难以有效地使模型适应数据中发生的概念迁移和概念演化问题。传统的批处理模式的机器学习算法在当前大数据环境下变得越来越力不从心,而使用TGCW在线学习方法通过流式计算框架,在内存中直接对数据实时运算,有助于电商行业对用户行为流数据的学习,为广告的精准投放提供了有力的工具。
[0004]因此,鉴于以往的方法很难满足目前对于不平衡流数据在线分类,并且分类投放的精度仍有提升空间。现有技术至少存在以下缺点或问题:
[0005]1.传统的批处理学习方法难以记忆以前学得的模型,难以对增量数据进行高效快速的学习,这使得这些学习算法难以应用于精准快速的广告投放系统。
[0006]2.现有的在线学习算法在用于用户广告投放的在线分类学习时并未考虑数据的不平衡性。而现实中有很多类别存在不均衡问题,它是常见的,并且也是合理的,符合人们期望的,所以以往在线学习分类算法在广告投放的实际应用中未考虑数据不平衡性的问题亟待解决。
[0007]3.以往在线分类学习算法的分类精度仍有提高空间,所以广告投放的精准度仍可提升。

技术实现思路

[0008]本专利技术通过TGCW在线学习方法对在线用户流数据进行在线特征的精确选择,根据用户行为的特征对其进行分类,最终能够精准快速的将相应的广告投放至相应用户。本专利技术方法即解决了传统在线分类方法无解解决的不平衡流数据分类问题,同时提高了分类性能以实现广告投放精准度的提升。
[0009]本专利技术提出一种基于三维点云数据识别出变电站设备类型的分类方法,包括以下步骤:
[0010]S10,数据采集;
[0011]S20,特征标签提取;
[0012]S30,TGCW在线分类学习;
[0013]S40,类别生成;
[0014]S50,广告投放。
[0015]优选地,所述数据采集,为将用户数据通过云端收入到数据采集模块中。
[0016]优选地,所述用户数据包括用户的性别、年龄段、常驻地点、用户的平台行为特征、用户对内容的浏览时长和用户标签,其中,用户的平台行为特征包括用户的浏览内容、用户的购买记录、用户对内容的评分;用户标签包括用户兴趣、用户需求、用户偏好。
[0017]优选地,所述特征标签提取,为通过对数据采集模块中的数据进行统计,提取出特征和标签。
[0018]优选地,所述TGCW在线分类学习,为将提取的特征和标签输入至TGCW在线学习算法,进行增量学习以生成动态的分类学习模型,包括以下步骤:
[0019]S31,设置参数;
[0020]S32,初始化模型;
[0021]S33,将特征所对应的用户特征值输入TGCW在线学习算法;
[0022]S34,通过考虑数据的不平衡性以不同的代价参数为不同类数据设置权重,然后使用置信加权法对在线流数据进行在线特征选择,并通过截断梯度算法来选择可能实现最小代价敏感损失的特征,最后更新在线学习模型。
[0023]优选地,所述类别生成,为在将特征和无标签的流数据输入至TGCW在线学习算法后,学习得到模型对该特征值对应的用户进行分类,生成该用户对应的分类类别。
[0024]优选地,所述广告投放,为将该用户类别相应的广告推送至用户端。
[0025]本专利技术通过TGCW算法考虑用户行为数据的不平衡性以不同的代价参数为不同类数据设置权重,进行在线特征选择,以达到在线精确分类不平衡数据的目的,最终实现不同类别用户的广告精准实时的投放。本专利技术使用TGCW算法解决了传统在线学习算法欠考虑数据不平衡性的问题,提升了用户分类和广告投放的精度。至少有如下具体有益效果:
[0026]1、本专利技术将广告精准投放方案中的以往的常规在线学习算法替换为TGCW算法,
[0027]该算法增加了代价敏感性策略,用于处理不平衡流数据,很好的改善了常规算法对数据的不平衡性欠考虑的问题,并且提高了分类精度,能够更加高效精准的对用户浏览行为分析并投放相应的广告。
[0028]2、本专利技术中所述的TGCW在线分类学习模块能够将模型学习与模型预测同时进行。若输入的用户特征标签数据有标签,则更新学习模型;若无标签,则可预测该用户的用户类别。最终根据分类的类别向用户推送该类别对应的广告。
附图说明
[0029]图1为本专利技术方法实施例的基于机器学习的在线广告精准投放方法的步骤流程图;
[0030]图2为本专利技术方法一实施例的基于机器学习的在线广告精准投放方法的S30具体步骤流程图。
20岁,表示为20-30岁,表示为30-40岁,表示40-50岁,表示大于50岁)、常驻地点(其中表示该用户常驻地点为0区,表示为1区,为2区,表示为3区)、用户的平台行为特征:用户的浏览内容(((表示该用户浏览内容为篮球护腕,表示为浏览足球鞋,表示浏览羽毛球鞋,...)、用户对内容的评分内容的评分用户对内容的浏览时长(和用户标签:用户对球类运动的兴趣Y
i
(Y
i
∈{0,1,2,3}),Y
i
>0的标签值表示该条记录对应的用户兴趣类别为Y
i
,其中Y
i
=1表示用户球类兴趣为篮球,Y
i
=2表示用户兴趣为足球,Y
i
=3表示用户兴趣为羽毛球;若某条记录无标签,则标签设置为Y
i
=0。将TGCW在线学习算法的参数设置为重力参数g=0.1,K=10,γ=0,01,θ=0.01,C=0.3,η=0.9。然后将所统计得的输入至TGCW算法中,若该输入X
i
对应的Y
i
>0,则根据TGCW在线学习算法步骤更新X
i
对应的信任权参数ω即更新在线学习模型,并将更新后的新模型导入到用户类别生成模块,生成该条记录的用户类别并输入至广告投放模块;若Y
i
=0,则将该条记录输入至用户类别生成模块,根据当前该模块中的模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的在线广告精准投放方法,其特征在于,包括以下步骤:S10,数据采集;S20,特征标签提取;S30,TGCW在线分类学习;S40,类别生成;S50,广告投放。2.根据权利要求1所述的方法,其特征在于,所述数据采集,为将用户数据通过云端收入到数据采集模块中。3.根据权利要求2所述的方法,其特征在于,所述用户数据包括用户的性别、年龄段、常驻地点、用户的平台行为特征、用户对内容的浏览时长和用户标签,其中,用户的平台行为特征包括用户的浏览内容、用户的购买记录、用户对内容的评分;用户标签包括用户兴趣、用户需求、用户偏好。4.根据权利要求1所述的方法,其特征在于,所述特征标签提取,为通过对数据采集模块中的数据进行统计,提取出特征和标签。5.根据权利要求1所述的方法,其特征在于,所述T...

【专利技术属性】
技术研发人员:任程威胡冀
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1