广告DSP定向投放广告的方法及终端技术

技术编号:18459247 阅读:68 留言:0更新日期:2018-07-18 12:53
本发明专利技术公开了一种广告DSP定向投放广告的方法及终端,其中该方法包括:对广告请求中的广告位的当前URL进行内容爬取,并分词处理,得到当前URL对应的词表;计算当前URL对应的词表的词向量;根据所述词向量和训练好的主题模型得到当前URL的主题向量;根据所述主题向量和训练好的文本分类模型得到当前URL的分类标签;在广告DSP的广告库中进行定向条件和所述分类标签的匹配。本发明专利技术基于实时爬取用户在终端浏览URL的内容,最终预测得到用户当前URL的分类标签,确定用户的实时兴趣,能够使得广告主针对用户实时兴趣等上下文内容定向投放广告,从而提高了广告投放的实时性和精确度。

The method and terminal of advertising DSP directed by advertising

The present invention discloses a method and terminal for ad DSP directed advertising, in which the method includes: crawling the current URL of the advertisement bit in the advertisement request, processing the word segmentation, getting the current URL corresponding word list, calculating the word vector of the current URL corresponding word list; according to the words Vector and the training subject The model gets the topic vector of the current URL; according to the subject vector and the trained text classification model, the current URL classification label is obtained; the orientation condition and the classified label are matched in the ad Library of the ad DSP. The invention is based on the real-time crawling of the content of the user browsing the URL in the terminal, and finally predicting the user's current URL classification label, determining the user's real time interest, enabling the advertiser to orientate the advertisement aiming at the context content such as the user's real time interest and so on, thus improving the real-time and accuracy of the advertising.

【技术实现步骤摘要】
广告DSP定向投放广告的方法及终端
本专利技术涉及互联网广告投放
,尤其涉及一种广告DSP定向投放广告的方法及终端。
技术介绍
广告需求方平台(Demand-SidePlatform,DSP)是伴随着互联网和广告业的飞速发展新兴起的网络广告领域,已在全球快速发展。在世界网络展示广告领域,DSP成为推动网络展示广告实时竞价(RealTimeBidding,RTB)市场快速发展的主要动力之一。广告DSP要想提高在线广告的投放效果,广告定向投放是最重要的核心点之一。广告定向投放不见得是广告DSP中最困难的技术,但是该技术是在线广告,特别是展示广告最核心的发展驱动力之一。目前,广告DSP定向投放广告绝大多数是根据用户的静态属性,如性别、年龄、职业和学历等人口属性,以及通过历史网络访问、点击和购买等行为对用户进行离线分析,构建好用户画像系统,如:给用户打上应用兴趣、浏览兴趣和游戏兴趣等标签,然后根据广告定向请求进行定向条件匹配进行广告投放。例如:在大多数广告主创建广告并同时增加用户画像标签作为定向条件后,用户一次广告请求过来,根据搭建的用户画像基础平台,我们知道该用户的画像标签,不仅要从广告库中按条件,如广告位尺寸等,搜索出广告,而且这些筛选出来的广告所附带的定向标签必须满足该用户的画像信息,才能成为该次广告请求定向投放广告的候选广告集。现有技术所用的定向标签需要搭建整个用户画像体系,成本和资源消耗巨大;此外,用户画像标签往往需要离线计算,存在数天延时,实时性不强,对效果广告这种实时性要求较高的场景,对兴趣偏好这种兴趣类的定向投放往往不精准。
技术实现思路
本专利技术实施例提供一种广告DSP定向投放广告的方法及终端,能提高广告定向投放的实时性和准确度。第一方面,本专利技术实施例提供了一种广告需求方平台定向投放广告的方法,所述方法包括:对广告请求中的广告位的当前统一资源定位符进行内容爬取,并分词处理,得到当前统一资源定位符对应的词表;计算当前统一资源定位符对应的词表的词向量;根据所述词向量和训练好的主题模型得到当前统一资源定位符的主题向量;根据所述主题向量和训练好的文本分类模型得到当前统一资源定位符的分类标签;在广告需求方平台的广告库中进行定向条件和所述分类标签的匹配。第二方面,本专利技术实施例提供了一种终端,该终端包括用于执行上述第一方面的方法的单元。第三方面,本专利技术实施例提供了另一种终端,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行上述第一方面的方法。第四方面,本专利技术实施例提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述第一方面的方法。本专利技术基于实时爬取用户在终端浏览URL的内容,最终预测得到用户当前URL的分类标签,确定用户的实时兴趣,能够使得广告主针对用户实时兴趣等上下文内容定向投放广告,从而提高了广告投放的实时性和精确度。附图说明为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种广告DSP定向投放广告的方法的示意流程图;图2是本专利技术另一实施例提供的一种广告DSP定向投放广告的方法的示意流程图;图3是本专利技术实施例提供的一种终端的示意性框图;图4是本专利技术另一实施例提供的一种终端示意性框图;图5是本专利技术另一实施例提供的一种终端示意性框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在此本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本专利技术。如在本专利技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本专利技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。如在本说明书和所附权利要求书中所使用的那样,术语“如果”或“若”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”或“若确定”或“若检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。请参见图1,图1是本专利技术实施例提供的一种广告DSP定向投放广告的方法的示意流程图。如图1所示,该广告DSP定向投放广告的方法可包括:S101,对广告请求中的广告位的当前URL进行内容爬取,并分词处理,得到所述当前URL对应的词表。其中,统一资源定位符(UniformResourceLocator,URL)是对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。互联网上的每个文件都有一个唯一的URL,它包含的信息指出文件的位置以及浏览器应该怎么处理它。通常,URL设置有广告位供曝光广告,用户通过终端,如手机、电脑、PAD等,浏览URL时产生广告请求,每个广告位存在自身属性,如广告位的大小等。对URL进行内容爬取的方法可以为:根据URL下载网页内容,针对每个网页的html结构特征,利用正则表达式,或者其他的方式,做文本解析,提取出想要的正文。本领域技术人员可以理解,也可采取其他爬取方法,本专利技术对此不作具体限制。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。现有的分词算法可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。按照是否与词性标注过程相结合,又可以分为单纯分词方法和分词与标注相结合的一体化方法。本领域技术人员可以理解,现有的分词方法均可以用于本专利技术,本专利技术对此不作具体限制。当接收到用户利用终端,如手机、电脑、PAD等,浏览URL时产生的广告请求,对广告请求中的广告位的当前URL进行内容爬取,并分词处理,得到所述当前URL对应的词表。可选地,在分词处理之后,可以先除去停用词,再得到所述当前URL对应的一组词表。这样处理能够提高词表的准确度,从而进一步提高广告定向投放的准确度。S102,计算所述当前URL对应的词表的词向量。其中,每个URL对应的一组词表可看作一篇文档,广告DSP包括多个离线数据URL,有多少个URL就有多少个文档。词向量是用来将文档本文档来自技高网...

【技术保护点】
1.一种广告需求方平台定向投放广告的方法,其特征在于,所述方法包括:对广告请求中的广告位的当前统一资源定位符进行内容爬取,并分词处理,得到当前统一资源定位符对应的词表;计算当前统一资源定位符对应的词表的词向量;根据所述词向量和训练好的主题模型得到当前统一资源定位符的主题向量;根据所述主题向量和训练好的文本分类模型得到当前统一资源定位符的分类标签;在所述广告需求方平台的广告库中进行定向条件和所述分类标签的匹配。

【技术特征摘要】
1.一种广告需求方平台定向投放广告的方法,其特征在于,所述方法包括:对广告请求中的广告位的当前统一资源定位符进行内容爬取,并分词处理,得到当前统一资源定位符对应的词表;计算当前统一资源定位符对应的词表的词向量;根据所述词向量和训练好的主题模型得到当前统一资源定位符的主题向量;根据所述主题向量和训练好的文本分类模型得到当前统一资源定位符的分类标签;在所述广告需求方平台的广告库中进行定向条件和所述分类标签的匹配。2.根据权利要求1所述的方法,其特征在于,所述计算当前统一资源定位符对应的词表的词向量,包括:通过TF-IDF算法计算当前统一资源定位符对应的词表的词向量。3.根据权利要求2所述的方法,其特征在于,所述通过TF-IDF算法计算当前URL对应的词表的词向量,包括:所述词向量d={x1,x2,……,xi,……,xM},其中,M为广告需求方平台离线数据的所有统一资源定位符对应的去重之后的总词表的个数,xi为所述总词表中第i个词在所述当前统一资源定位符对应的词表中的TF-IDF值。4.根据权利要求1-3任一项所述的方法,其特征在于,所述对广告请求中的广告位的当前统一资源定位符进行内容爬取,并分词处理,得到当前统一资源定位符对应的词表之前,还包括:训练主题模型得到训练好的主题模型;训练文本分类模型得到训练好的文本分类模型。5.根据权利要求4所述的方法,其特征在于,所述训练主题模型得到训练好的主题模型,包括:对广告需求...

【专利技术属性】
技术研发人员:黄程波
申请(专利权)人:深圳市金立通信设备有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1