一种广告标签的标注方法及系统技术方案

技术编号:13417824 阅读:52 留言:0更新日期:2016-07-27 14:51
本发明专利技术公开一种广告标签的标注方法及系统,该方法包括:获取各个广告的标签信息,并结合所述广告的标签信息获取各个广告标签之间的相似度;根据各个广告标签之间的相似度及各个广告的标签信息构建各个广告之间相似度的加权结构图;根据所述加权结构图得到各个广告标签之间的转移概率,并构建各个广告标签之间的概率转移矩阵;将标注有标签的广告与未标注标签的广告分别构建标签矩阵,并合并生成组合标签矩阵;将所述组合标签矩阵与所述概率转移矩阵相结合生成得分矩阵,将得分矩阵中的得分与预先设定的阈值进行比较,并将得分满足所述阈值的广告标签标注到未标注标签的广告上。本发明专利技术降低了广告标注标签的成本。

【技术实现步骤摘要】

本专利技术涉及广告数据处理的
,涉及一种对广告添加标签的方法及系统。
技术介绍
随着互联网等技术的不断发展,商品的广告从原始的在商品包装、广告牌等实体的广告形式慢慢发展为媒体等虚拟的广告形式。而现今,在网络媒体上发布广告进行产品的展现已经成为商家的常用手段,通过网络媒体展示产品的方式能取得比较好的产品营销效果。再者,现在各种技术都追求智能化及自动化功能,更能满足用户在实际生活中的需求,提高了用户在实际中的实际体验。现在的广告投放又提出基于用户兴趣进行推送投放的形式,根据用户的历史观看或点击数据,总结出用户的兴趣爱好或关注的领域,再向用户进行相关或相近内容的广告推荐,如此能够增加投放广告的用户点击率,从而增强商业宣传的营销效果,对于广告投放平台来讲也会增加广告投放的收益,这种广告的投放形式被称为广告的个性化投放。在广告的个性化投放过程中,使用广告标签给所投放的广告进行记录或者标记是识别广告属性,并按此获取相应的广告进行投放的重要步骤。广告的标签在广告的个性化投放中扮演着重要的角色,要想按照用户的兴趣爱好给用户进行相关广告的投放,首先要计算出广告与用户属性的相关性,根据该相关性判断用户对该广告的兴趣程度,而广告的标签又是进行广告与用户属性的相关性的特征,精准的广告标签能够用以准确地计算出广告与用户属性的相关性,进而通过计算得到的相关性准确地向用户投放其感兴趣的广告。目前的广告标签标注都是采用在该领域专业的技术人员或者用户本身在广告上标注标签的形式,但是,采用人工的方式,通过相关的技术人员给广告标注标签,不仅会增加标注广告标签的成本、造成漏标注、错标注的问题,而且也不能从工程上实现标签的自动化标注,同时,也很难实现广告标签标注的量化,不能通过反应每个广告标注的标签得分比较出选中广告与用户兴趣相关度的高低,也就不能从用户兴趣广告中挑选出最合适向该用户投放的广告,在一定程度上降低了用户观看个性化广告的体验。因此,提供一种能准确、自动化的广告标签标注方法是本领域亟待解决的问题。
技术实现思路
有鉴于此,本专利技术提供了一种广告标签的标注方法及系统,解决了不能从工程上实现标签的自动化标注的问题。为了解决上述技术问题,本专利技术提出一种广告标签的标注方法,该方法包括:获取各个广告的标签信息,并结合所述广告的标签信息获取各个广告标签之间的相似度;根据各个广告标签之间的相似度构建各个广告之间相似度的加权结构图;根据所述加权结构图得到各个广告标签之间的转移概率,并构建各个广告标签之间的概率转移矩阵;将标注有标签的广告与未标注标签的广告分别构建标签矩阵,并合并生成组合标签矩阵;将所述组合标签矩阵与所述概率转移矩阵相结合生成得分矩阵,将得分矩阵中的得分与预先设定的阈值进行比较,并将得分满足所述阈值的广告标签标注到未标注标签的广告上。在一可选实施例中,所述获取各个广告标签之间的相似度,包括:通过点击各个广告的用户信息得到各个广告之间的行为相似度;将各个广告的描述信息进行分词,再利用加权算法得到各个广告之间的描述信息相似度;根据各个广告之间的行为相似度及描述信息相似度进行线性加权融合,获取各个广告标签之间的相似度。在一可选实施例中,该方法利用以下公式获取各个广告标签之间的相似度:sim=α*behavior_sim+(1-α)*content_sim,其中,sim表示各个广告标签之间的相似度;behavior_sim表示行为相似度;content_sim表示描述信息相似度;α表示权重值,其范围为0≤α≤1。在一可选实施例中,所述根据各个广告标签之间的相似度构建各个广告之间相似度的加权结构图,包括:将各个广告标签作为节点、各个广告标签之间的相似度作为权重边构建各个广告之间相似度的加权结构图。在一可选实施例中,将所述组合标签矩阵与所述概率转移矩阵相结合生成得分矩阵,包括:根据所述组合标签矩阵与所述概率转移矩阵乘积生成新的组合矩阵,重复将所述新的组合矩阵中标注有标签的广告矩阵复原再与所述概率转移矩阵相乘直至收敛得到所述得分矩阵。在一可选实施例中,该方法还包括:当得分矩阵中所有的得分都不满足所述预先设定的阈值时,根据该得分矩阵中相应未标注标签广告的描述信息设置标签。另一方面,为实现上述广告标签的标注的方法,本专利技术还提出了一种广告标签的标注系统,包括:获取模块、构建模块、合并模块及处理模块,其中,所述获取模块,用于获取各个广告标签之间的相似度以及各个广告的标签信息;所述构建模块,包括:第一构建单元及第二构建单元,其中,所述第一构建单元,用于根据各个广告标签之间的相似度构建各个广告之间相似度的加权结构图;所述第二构建单元,用于根据所述加权结构图得到各个广告标签之间的转移概率,并构建各个广告标签之间的概率转移矩阵;所述合并模块,用于将标注有标签的广告与未标注标签的广告分别构建标签矩阵,并合并生成组合标签矩阵;所述处理模块,用于将所述组合标签矩阵与所述概率转移矩阵相结合生成得分矩阵,将得分矩阵中的得分与预先设定的阈值进行比较,并将得分满足所述阈值的广告标签标注到未标注标签的广告上。在一可选实施例中,所述获取模块包括:第一获取单元、第二获取单元及融合单元,其中,所述第一获取单元,用于通过点击各个广告的用户信息得到各个广告之间的行为相似度;所述第二获取单元,用于将各个广告的描述信息进行分词,再利用加权算法得到各个广告之间的描述信息相似度;所述融合单元,用于根据各个广告之间的行为相似度及描述信息相似度进行线性加权融合,获取各个广告标签之间的相似度。在一可选实施例中,所述所述融合单元,用于:利用以下公式获取各个广告标签之间的相似度:sim=α*behavior_sim+(1-α)*content_sim,其中,sim表示各个广告标签之间的相似度;behavior_sim表示行为相似度;content_sim表示描述信息相似度;α表示权重值,其范围为0≤α≤1。在一可选实施例中,所述第一构建单元,用于:将各个广告标签作为节点、各个广告标签之间的相似度作为权重边构建各个广告之间相似度的加权结构图。在一可选实施例中,所述处理模块,用于:根据所述组合标签矩阵与所述概率转移矩阵乘积生成新的组合矩阵,重复将所述新的组合矩阵中标注有标签的广告矩阵复原再与所述概率转移矩阵相乘直至收敛得到所述得分矩阵。在一可选实施例中,所述处理模块,还本文档来自技高网
...

【技术保护点】
一种广告标签的标注方法,其特征在于,包括:获取各个广告的标签信息,并结合所述广告的标签信息获取各个广告标签之间的相似度;根据各个广告标签之间的相似度及各个广告的标签信息构建各个广告之间相似度的加权结构图;根据所述加权结构图得到各个广告标签之间的转移概率,并构建各个广告标签之间的概率转移矩阵;将标注有标签的广告与未标注标签的广告分别构建标签矩阵,并合并生成组合标签矩阵;将所述组合标签矩阵与所述概率转移矩阵相结合生成得分矩阵,将得分矩阵中的得分与预先设定的阈值进行比较,并将得分满足所述阈值的广告标签标注到未标注标签的广告上。

【技术特征摘要】
1.一种广告标签的标注方法,其特征在于,包括:
获取各个广告的标签信息,并结合所述广告的标签信息获取各个广告标签之间的相似
度;
根据各个广告标签之间的相似度及各个广告的标签信息构建各个广告之间相似度的
加权结构图;
根据所述加权结构图得到各个广告标签之间的转移概率,并构建各个广告标签之间的
概率转移矩阵;
将标注有标签的广告与未标注标签的广告分别构建标签矩阵,并合并生成组合标签矩
阵;
将所述组合标签矩阵与所述概率转移矩阵相结合生成得分矩阵,将得分矩阵中的得分
与预先设定的阈值进行比较,并将得分满足所述阈值的广告标签标注到未标注标签的广告
上。
2.根据权利要求1所述的广告标签的标注方法,其特征在于,所述获取各个广告标签之
间的相似度,包括:
通过点击各个广告的用户信息得到各个广告之间的行为相似度;
将各个广告的描述信息进行分词,再利用加权算法得到各个广告之间的描述信息相似
度;
根据各个广告之间的行为相似度及描述信息相似度进行线性加权融合,获取各个广告
标签之间的相似度。
3.根据权利要求2所述的广告标签的标注方法,其特征在于,利用以下公式获取各个广
告标签之间的相似度:
sim=α*behavior_sim+(1-α)*content_sim,其中,sim表示各个广告标签之间的相似
度;behavior_sim表示行为相似度;content_sim表示描述信息相似度;α表示权重值,其范
围为0≤α≤1。
4.根据权利要求1所述的广告标签的标注方法,其特征在于,所述根据各个广告标签之
间的相似度构建各个广告之间相似度的加权结构图,包括:
将各个广告标签作为节点、各个广告标签之间的相似度作为权重边构建各个广告之间
相似度的加权结构图。
5.根据权利要求1-4任一项所述的广告标签的标注方法,其特征在于,所述将所述组合
标签矩阵与所述概率转移矩阵相结合生成得分矩阵,包括:
根据所述组合标签矩阵与所述概率转移矩阵乘积生成新的组合矩阵,重复将所述新的
组合矩阵中标注有标签的广告矩阵复原再与所述概率转移矩阵相乘直至收敛得到所述得
分矩阵。
6.根据权利要求1所述的广告标签的标注方法,其特征在于,当得分矩阵中所有的得分
都不满足所述预先设定的阈值时,根据该得分矩阵中相应未标注标签广告的描述信息设置
标签。
7.一种广告标签的标注系统,其特征在于,包括:获取模块、构建模块、合并模块及处理
模块,其中,...

【专利技术属性】
技术研发人员:袁树仑章岑杨田周盛潘柏宇王冀
申请(专利权)人:合一网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1