【技术实现步骤摘要】
广告博文的投放方法及装置、存储介质和计算设备
本专利技术涉及互联网在线广告的广告投放系统,具体涉及一种广告博文的投放方法及装置、存储介质和计算设备。
技术介绍
目前微博广告投放时只针对同一博文ID(博文ID指一条微博博文的唯一标识,一个博文ID和其博文内容一一对应)的频次做了限制,即如果某个用户已经看过某个广告博文,则下次广告投放时,就不会再向这个用户投放相同博文ID的广告。但是如果两个博文的ID不同,但是内容相似或相同,广告投放系统则无法识别,仍然会向用户进行投放。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:用户如果在浏览微博的时候,一次看到两条内容十分相似甚至完全相同的广告博文,肯定会严重影响用户的使用体验。
技术实现思路
本专利技术实施例提供一种广告博文的投放方法及装置、存储介质和计算设备,以减少内容相似广告投放,以减小相似广告对同一用户的反复投放,提升用户体验。一方面,本专利技术实施例提供了一种广告博文的投放方法,其包括:计算已曝光的广告博文之间的相似度,得到第一相似集合,所述第一相似集合中包括每条已曝光的广告博文分别对应的相似度大于预设阈值的其他已曝光的广告博文;当有新的广告博文上线时,计算新上线的广告博文与每条已曝光的广告博文之间的相似度,得到第二相似集合,所述第二相似集合中包括新上线的广告博文对应的相似度大于预设阈值的已曝光的广告博文;当需要向用户投放候选广告博文时,针对每条候选广告博文,根据所述用户已浏览的广告博文、所述第一相似集合和所述第二相似集合,判断是否滤除该候选广告博文;并将未滤除的各候选广告博文向用户进行投放。另 ...
【技术保护点】
一种广告博文的投放方法,其特征在于,包括:计算已曝光的广告博文之间的相似度,得到第一相似集合,所述第一相似集合中包括每条已曝光的广告博文分别对应的相似度大于预设阈值的其他已曝光的广告博文;当有新的广告博文上线时,计算新上线的广告博文与每条已曝光的广告博文之间的相似度,得到第二相似集合,所述第二相似集合中包括新上线的广告博文对应的相似度大于预设阈值的已曝光的广告博文;当需要向用户投放候选广告博文时,针对每条候选广告博文,根据所述用户已浏览的广告博文、所述第一相似集合和所述第二相似集合,判断是否滤除该候选广告博文;并将未滤除的各候选广告博文向用户进行投放。
【技术特征摘要】
1.一种广告博文的投放方法,其特征在于,包括:计算已曝光的广告博文之间的相似度,得到第一相似集合,所述第一相似集合中包括每条已曝光的广告博文分别对应的相似度大于预设阈值的其他已曝光的广告博文;当有新的广告博文上线时,计算新上线的广告博文与每条已曝光的广告博文之间的相似度,得到第二相似集合,所述第二相似集合中包括新上线的广告博文对应的相似度大于预设阈值的已曝光的广告博文;当需要向用户投放候选广告博文时,针对每条候选广告博文,根据所述用户已浏览的广告博文、所述第一相似集合和所述第二相似集合,判断是否滤除该候选广告博文;并将未滤除的各候选广告博文向用户进行投放。2.根据权利要求1所述的方法,其特征在于,所述计算已曝光的广告博文之间的相似度,得到第一相似集合,具体包括:从广告博文ID数据库中获取已曝光的所有广告博文ID;根据已曝光的所有广告博文ID,从博文内容存储系统中获取相应的广告博文内容;将获取到的各广告博文内容逐条进行分词,得到每条广告博文内容的博文单词集合;对每个博文单词集合进行停用词过滤;利用过滤完的所有博文单词集合生成索引字典,并根据该索引字典将过滤完的所有博文单词集合分别转换为对应的稀疏向量;利用转换得到的各稀疏向量和所述索引字典生成潜在语义索引LSI模型并进行保存;使用所述LSI模型计算每个博文单词集合与其他博文单词集合之间的相似度,得到一个相似度矩阵;遍历所述相似度矩阵,将相似度大于预设阈值的广告博文ID提取出来,得到与每一广告博文ID的相似度大于预设阈值的广告博文ID集合,作为第一相似集合并保存至相似度存储系统。3.根据权利要求2所述的方法,其特征在于,所述当有新的广告博文上线时,计算新上线的广告博文与每条已曝光的广告博文之间的相似度,得到第二相似集合,具体包括:加载保存的LSI模型;获取新上线的广告博文ID;根据新上线的广告博文ID,从博文内容存储系统中获取相应的广告博文内容;对获取到的广告博文内容进行分词,得到广告博文内容的博文单词集合;对所述博文单词集合进行停用词过滤;使用所述LSI模型计算新上线的博文单词集合与已曝光的每个博文单词集合之间的相似度,得到相似度向量;遍历所述相似度向量,将相似度大于预设阈值的广告博文ID提取出来,得到与新上线的广告博文ID的相似度大于预设阈值的广告博文ID集合,作为第二相似集合并保存至所述相似度存储系统。4.根据权利要求3所述的方法,其特征在于,所述当需要向用户投放候选广告博文时,针对每条候选广告博文,根据所述用户已浏览的广告博文、所述第一相似集合和所述第二相似集合,判断是否滤除该候选广告博文;并将未滤除的各候选广告博文向用户进行投放,具体包括:当接收到用户发起的广告投放请求时,选取所述用户对应的候选广告集,并取得相应的候选广告博文ID;根据用户ID从用户历史曝光存储系统中获取该用户已浏览的所有广告博文ID,生成第一广告博文ID列表;从相似度存储系统中存储的所述第一相似集合和第二相似集合中获得与该第一广告博文ID列表中的每个广告博文ID的相似度大于预设阈值的广告博文ID集合,并将获得的广告博文ID集合合并到所述第一广告博文ID列表中,得到第二广告博文ID列表;针对每一个候选广告博文ID,分别进行如下处理:检查当前候选广告博文ID是否存在于所述第二广告博文ID列表中,如果存在,则滤除当前候选广告博文ID;如果不存在,则保留当前候选广告博文ID;将未滤除的各候选广告博文向用户进行投放,并将投放后的各广告博文ID写入用户历史曝光存储系统。5.一种广告博文的投放装置,其特征在于,包括:离线相似度计算模块,用于计算已曝光的广告博文之间的相似度,得到第一相似集合,所述第一相似集合中包括每条已曝光的广告博文分别对应的相似度大于预设阈值的其他已曝光的广告博文;在线相似度计算模块,用于当有新的广告博文上线时,计算新上线的广告博文与每条已...
【专利技术属性】
技术研发人员:王欣,李铁牛,严明,滕幻,
申请(专利权)人:微梦创科网络科技中国有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。