广告博文的投放方法及装置、存储介质和计算设备制造方法及图纸

技术编号:18205242 阅读:40 留言:0更新日期:2018-06-13 06:45
一种广告博文的投放方法及装置、存储介质和计算设备,该方法包括:计算已曝光的广告博文之间的相似度,得到第一相似集合,其包括每条已曝光的广告博文分别对应的相似度大于预设阈值的其他已曝光的广告博文;当有新的广告博文上线时,计算新上线的广告博文与每条已曝光的广告博文之间的相似度,得到第二相似集合,其包括新上线的广告博文对应的相似度大于预设阈值的已曝光的广告博文;当需要向用户投放候选广告博文时,根据用户已浏览的广告博文、第一相似集合和第二相似集合,判断是否滤除候选广告博文,并将未滤除的各候选广告博文向用户进行投放。本申请在广告投放流程中增加了博文相似度计算,广告投放实时过滤相似博文,可提升用户体验。

【技术实现步骤摘要】
广告博文的投放方法及装置、存储介质和计算设备
本专利技术涉及互联网在线广告的广告投放系统,具体涉及一种广告博文的投放方法及装置、存储介质和计算设备。
技术介绍
目前微博广告投放时只针对同一博文ID(博文ID指一条微博博文的唯一标识,一个博文ID和其博文内容一一对应)的频次做了限制,即如果某个用户已经看过某个广告博文,则下次广告投放时,就不会再向这个用户投放相同博文ID的广告。但是如果两个博文的ID不同,但是内容相似或相同,广告投放系统则无法识别,仍然会向用户进行投放。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:用户如果在浏览微博的时候,一次看到两条内容十分相似甚至完全相同的广告博文,肯定会严重影响用户的使用体验。
技术实现思路
本专利技术实施例提供一种广告博文的投放方法及装置、存储介质和计算设备,以减少内容相似广告投放,以减小相似广告对同一用户的反复投放,提升用户体验。一方面,本专利技术实施例提供了一种广告博文的投放方法,其包括:计算已曝光的广告博文之间的相似度,得到第一相似集合,所述第一相似集合中包括每条已曝光的广告博文分别对应的相似度大于预设阈值的其他已曝光的广告博文;当有新的广告博文上线时,计算新上线的广告博文与每条已曝光的广告博文之间的相似度,得到第二相似集合,所述第二相似集合中包括新上线的广告博文对应的相似度大于预设阈值的已曝光的广告博文;当需要向用户投放候选广告博文时,针对每条候选广告博文,根据所述用户已浏览的广告博文、所述第一相似集合和所述第二相似集合,判断是否滤除该候选广告博文;并将未滤除的各候选广告博文向用户进行投放。另一方面,本专利技术实施例提供了一种广告博文的投放装置,其包括:离线相似度计算模块,用于计算已曝光的广告博文之间的相似度,得到第一相似集合,所述第一相似集合中包括每条已曝光的广告博文分别对应的相似度大于预设阈值的其他已曝光的广告博文;在线相似度计算模块,用于当有新的广告博文上线时,计算新上线的广告博文与每条已曝光的广告博文之间的相似度,得到第二相似集合,所述第二相似集合中包括新上线的广告博文对应的相似度大于预设阈值的已曝光的广告博文;广告投放过滤模块,用于当需要向用户投放候选广告博文时,针对每条候选广告博文,根据所述用户已浏览的广告博文、所述第一相似集合和所述第二相似集合,判断是否滤除该候选广告博文;并将未滤除的各候选广告博文向用户进行投放。此外,本申请还提供一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被执行时实现上述广告博文的投放方法。以及,一种计算设备,其包括处理器和存储器,该存储器上具有计算机程序,所述处理器加载并执行所述计算机程序以实现上述广告博文的投放方法。上述技术方案具有如下有益效果:本专利技术的实施例提出了一套技术方案,利用LSI算法识别相似博文,并通知给广告投放系统。广告投放系统在广告投放时,如果发现要投放的广告和用户之前看到过的广告是相似的,则不再向这个用户投放此广告而是改换其他广告进行投放,以提升用户体验。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术的实施例的一种广告博文的投放装置的逻辑功能框图;图2是本专利技术的实施例的一种广告博文的投放装置的详细功能框图;图3是本专利技术的实施例的广告博文的投放装置的详细工作流程图;图4是本专利技术的实施例的作为举例的相似度矩阵的示意图;图5是本专利技术的实施例的广告博文的投放方法的总体流程图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例1:如图1所示,本专利技术实施例的减少内容相似广告投放的装置包括:离线相似度计算模块100、在线相似度计算模块200和广告投放过滤模块300。离线相似度计算模块100,用于计算已曝光的广告博文之间的相似度,得到第一相似集合,所述第一相似集合中包括每条已曝光的广告博文分别对应的相似度大于预设阈值的其他已曝光的广告博文。在线相似度计算模块200,用于当有新的广告博文上线时,计算新上线的广告博文与每条已曝光的广告博文之间的相似度,得到第二相似集合,所述第二相似集合中包括新上线的广告博文对应的相似度大于预设阈值的已曝光的广告博文;新上线的博文是指广告主最新生成的广告博文,还未向用户投放。比如广告主通过微博提供的接口,新生成了一条圣诞节促销的广告,准备当天晚上投放。广告投放过滤模块300,用于当需要向用户投放候选广告博文时,针对每条候选广告博文,根据所述用户已浏览的广告博文、所述第一相似集合和所述第二相似集合,判断是否滤除该候选广告博文;并将未滤除的各候选广告博文向用户进行投放。待投放的博文是指符合投放某个微博用户的广告博文的集合。如某微博用户在刷微博时,微博端根据她的用户属性可以给她推送多条广告,比如汽车,奢侈品,化妆品等,这些广告构成一个候选集,经筛选后,只给她展示一条广告。图2是本专利技术的实施例的一种广告博文的投放装置的详细功能框图。如图2所示,在一个较佳的实施例中,该离线相似度计算模块100,具体可以包括:第一博文ID获取单元,用于从广告博文ID数据库中获取已曝光的所有广告博文ID;第一博文内容获取单元,用于根据已曝光的所有广告博文ID,从博文内容存储系统中获取相应的广告博文内容;博文内容存储系统具体可以采用redis存储系统,但不限于此。第一分词处理单元,用于将获取到的各广告博文内容逐条进行分词,得到每条广告博文内容的博文单词集合。第一停用词过滤单元,用于对每个博文单词集合进行停用词过滤。索引字典和稀疏向量生成单元,用于利用过滤完的所有博文单词集合生成索引字典,并根据该索引字典将过滤完的所有博文单词集合分别转换为对应的稀疏向量;其中,一个博文单词集合对应一个稀疏向量。LSI模型创建单元,用于利用转换得到的各稀疏向量和所述索引字典生成潜在语义索引LSI模型并进行保存。第一相似度计算单元,用于使用所述LSI模型计算每个博文单词集合与其他博文单词集合之间的相似度,得到一个相似度矩阵;该相似度矩阵是由各已曝光的博文单词集合别对应稀疏向量的集合形成一个相似度矩阵。矩阵是向量的集合,通过计算所有已曝光的广告博文任意两个之间的相似度生成矩阵(一条已曝光的广告博文和其他广告博文生成一个相似度向量,然后所有已曝光的广告博文的相似度向量的集合最终形成一个相似度矩阵)。第一相似度过滤单元,用于遍历所述相似度矩阵,将相似度大于预设阈值的广告博文ID提取出来,得到与每一广告博文ID的相似度大于预设阈值的广告博文ID集合,作为第一相似集合并保存至相似度存储系统。相似度存储系统具体可以采用redis存储系统,但不限于此。如图2所示,在一个较佳的实施例中,在线相似度计算模块200,具体可以包括:LSI模型加载单元,用于加载保存的LSI模型。第二博文ID获取单本文档来自技高网...
广告博文的投放方法及装置、存储介质和计算设备

【技术保护点】
一种广告博文的投放方法,其特征在于,包括:计算已曝光的广告博文之间的相似度,得到第一相似集合,所述第一相似集合中包括每条已曝光的广告博文分别对应的相似度大于预设阈值的其他已曝光的广告博文;当有新的广告博文上线时,计算新上线的广告博文与每条已曝光的广告博文之间的相似度,得到第二相似集合,所述第二相似集合中包括新上线的广告博文对应的相似度大于预设阈值的已曝光的广告博文;当需要向用户投放候选广告博文时,针对每条候选广告博文,根据所述用户已浏览的广告博文、所述第一相似集合和所述第二相似集合,判断是否滤除该候选广告博文;并将未滤除的各候选广告博文向用户进行投放。

【技术特征摘要】
1.一种广告博文的投放方法,其特征在于,包括:计算已曝光的广告博文之间的相似度,得到第一相似集合,所述第一相似集合中包括每条已曝光的广告博文分别对应的相似度大于预设阈值的其他已曝光的广告博文;当有新的广告博文上线时,计算新上线的广告博文与每条已曝光的广告博文之间的相似度,得到第二相似集合,所述第二相似集合中包括新上线的广告博文对应的相似度大于预设阈值的已曝光的广告博文;当需要向用户投放候选广告博文时,针对每条候选广告博文,根据所述用户已浏览的广告博文、所述第一相似集合和所述第二相似集合,判断是否滤除该候选广告博文;并将未滤除的各候选广告博文向用户进行投放。2.根据权利要求1所述的方法,其特征在于,所述计算已曝光的广告博文之间的相似度,得到第一相似集合,具体包括:从广告博文ID数据库中获取已曝光的所有广告博文ID;根据已曝光的所有广告博文ID,从博文内容存储系统中获取相应的广告博文内容;将获取到的各广告博文内容逐条进行分词,得到每条广告博文内容的博文单词集合;对每个博文单词集合进行停用词过滤;利用过滤完的所有博文单词集合生成索引字典,并根据该索引字典将过滤完的所有博文单词集合分别转换为对应的稀疏向量;利用转换得到的各稀疏向量和所述索引字典生成潜在语义索引LSI模型并进行保存;使用所述LSI模型计算每个博文单词集合与其他博文单词集合之间的相似度,得到一个相似度矩阵;遍历所述相似度矩阵,将相似度大于预设阈值的广告博文ID提取出来,得到与每一广告博文ID的相似度大于预设阈值的广告博文ID集合,作为第一相似集合并保存至相似度存储系统。3.根据权利要求2所述的方法,其特征在于,所述当有新的广告博文上线时,计算新上线的广告博文与每条已曝光的广告博文之间的相似度,得到第二相似集合,具体包括:加载保存的LSI模型;获取新上线的广告博文ID;根据新上线的广告博文ID,从博文内容存储系统中获取相应的广告博文内容;对获取到的广告博文内容进行分词,得到广告博文内容的博文单词集合;对所述博文单词集合进行停用词过滤;使用所述LSI模型计算新上线的博文单词集合与已曝光的每个博文单词集合之间的相似度,得到相似度向量;遍历所述相似度向量,将相似度大于预设阈值的广告博文ID提取出来,得到与新上线的广告博文ID的相似度大于预设阈值的广告博文ID集合,作为第二相似集合并保存至所述相似度存储系统。4.根据权利要求3所述的方法,其特征在于,所述当需要向用户投放候选广告博文时,针对每条候选广告博文,根据所述用户已浏览的广告博文、所述第一相似集合和所述第二相似集合,判断是否滤除该候选广告博文;并将未滤除的各候选广告博文向用户进行投放,具体包括:当接收到用户发起的广告投放请求时,选取所述用户对应的候选广告集,并取得相应的候选广告博文ID;根据用户ID从用户历史曝光存储系统中获取该用户已浏览的所有广告博文ID,生成第一广告博文ID列表;从相似度存储系统中存储的所述第一相似集合和第二相似集合中获得与该第一广告博文ID列表中的每个广告博文ID的相似度大于预设阈值的广告博文ID集合,并将获得的广告博文ID集合合并到所述第一广告博文ID列表中,得到第二广告博文ID列表;针对每一个候选广告博文ID,分别进行如下处理:检查当前候选广告博文ID是否存在于所述第二广告博文ID列表中,如果存在,则滤除当前候选广告博文ID;如果不存在,则保留当前候选广告博文ID;将未滤除的各候选广告博文向用户进行投放,并将投放后的各广告博文ID写入用户历史曝光存储系统。5.一种广告博文的投放装置,其特征在于,包括:离线相似度计算模块,用于计算已曝光的广告博文之间的相似度,得到第一相似集合,所述第一相似集合中包括每条已曝光的广告博文分别对应的相似度大于预设阈值的其他已曝光的广告博文;在线相似度计算模块,用于当有新的广告博文上线时,计算新上线的广告博文与每条已...

【专利技术属性】
技术研发人员:王欣李铁牛严明滕幻
申请(专利权)人:微梦创科网络科技中国有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1