一种用于网络论坛的广告投放方法及装置制造方法及图纸

技术编号:14117330 阅读:38 留言:0更新日期:2016-12-08 00:32
本发明专利技术涉及互联网应用技术领域,特别是一种用于网络论坛的广告投放方法及装置。该方法包括:获取用户的关键词和在排期内的每个广告的关键词,所述用户的关键词包括至少一个用户关键词,所述广告的关键词包括至少一个广告关键词;在词‑向量库中查找用户关键词和广告关键词对应的向量;根据用户关键词和广告关键词对应的向量,计算每个用户关键词与每个广告关键词的余弦相似度,累加用户的所有用户关键词与同一广告的所有广告关键词的余弦相似度,将累加结果作为用户和该广告的匹配度;选取与用户匹配度最高的广告向用户投放。采用本发明专利技术能够找到具有语义相关的匹配词,实现针对不同用户的广告精准投放。

【技术实现步骤摘要】

本专利技术涉及互联网应用
,特别是一种用于网络论坛的广告投放方法及装置
技术介绍
随着互联网个性化时代的到来,广告投放亦出现根据用户属性精准投放的趋势。在精准投放方面,现有技术只能做到根据投放请求关键词和广告关键词的匹配,无法实现真正的语义相关,也就无法实现更加准确、丰富、对用户有联想能力的精准投放。比如:投放请求关键词为:“科幻”时,传统方法只能找到具有“科幻”的关键词广告,不能实现关键词关联。如果通过人工关联关键词方法,比如关联“科幻”和“玄幻”,能一定程度实现模糊匹配,但是人工关联词库中的词汇有限,且无法准确判断两个词的语义相关度,进而不能准确关联到匹配度高的词汇,也就无法实现精准的广告投放。广告投放的另一个关键在于获得用户关键词,用户关键词往往与用户信息关系紧密,如对不同性别、处于不同年龄阶段的用户针对性投放其感兴趣的广告。一般来说,电商网站的用户信息往往比较真实,如地址、交易信息等,但对于论坛网站(例如天涯社区)这类虚拟社区,因本身不存在真实的交易,用户在虚拟社区中使用的身份信息与其真实信息往往存在较大差异,因此难以获得贴近真实的用户关键词,进而无法对这些用户进行精准的广告投放。
技术实现思路
为了克服现有技术的缺陷,本专利技术提供一种用于网络论坛的广告投放方法及装置,为实现精准投放广告的目的,本专利技术结合论坛这类虚拟社区的特点做了两方面的改进,一方面,计算用户关键词与广告关键词的相似度,并进行相似度排序,选择相似度最高的广告进行投放,另一方面,通过修正用户的注册数据推测用户性别、年龄段,以及分析用户访问轨迹生成用户兴趣标签,从而获得贴近真实的用户关键词。本专利技术采用技术方案如下:一种用于网络论坛的广告投放方法,包括:获取用户的关键词和在排期内的每个广告的关键词,所述用户的关键词包括至少一个用户关键词,所述广告的关键词包括至少一个广告关键词;在词-向量库中查找用户关键词和广告关键词对应的向量;根据用户关键词和广告关键词对应的向量,计算每个用户关键词与每个广告关键词的余弦相似度,累加用户的所有用户关键词与同一广告的所有广告关键词的余弦相似度,将累加结果作为用户和该广告的匹配度;选取与用户匹配度最高的广告向用户投放。优选地,所述获取用户的关键词具体为:从所述用户画像库中提取用户的关键词;在获取用户的关键词和在排期内的每个广告的关键词之前还包括:根据用户信息及用户访问过的帖子获得用户的性别、年龄段和兴趣标签,将所述性别、年龄段和兴趣标签作为用户的关键词;将所述用户信息及用户的关键词进行对应存储,形成用户画像库。具体地,所述根据用户信息及用户访问过的帖子获得用户的性别和年龄段包括:收集论坛中已确认性别、年龄段的用户的用户信息及其访问过的所有帖子,分析所有所述帖子的主题分布,生成多个大类主题;根据所述用户信息及其访问过的帖子所属大类主题,建立性别、年龄段和对应大类主题的标签训练数据,使用神经网络算法训练获得帖子主题对应的性别和年龄段的概率模型;收集需要修正性别和年龄段的用户访问过的所有帖子,提取每个帖子的关键词,计算所述关键词与所述大类主题的相似度,选取相似度最高的大类主题作为用户最关心的主题,将用户最关心的主题输入所述概率模型,推测得到用户的性别和年龄段。具体地,所述根据用户信息及用户访问过的帖子获得用户的兴趣标签包括:根据论坛中所有帖子的主题,创建多个兴趣主题;提取用户历史访问的每个帖子的关键词,计算所述关键词与所述兴趣主题的相似度,确定帖子所属兴趣主题,并将确定的所述兴趣主题的关键词作为用户的兴趣标签。进一步地,在获取用户的关键词和在排期内的每个广告的关键词之前还包括:对论坛帖子中的文本执行分词处理,得到文本的单词;对所述文本的单词执行向量化处理,得到每个单词的向量;将所述单词和向量对应存储,形成词-向量库。相应地,本专利技术还提供了一种用于网络论坛的广告投放装置,包括:获取模块,用于获取用户的关键词和在排期内的每个广告的关键词,所述用户的关键词包括至少一个用户关键词,所述广告的关键词包括至少一个广告关键词;查找模块,用于在词-向量模块中查找用户关键词和广告关键词对应的向量;关键词匹配模块,用于根据用户关键词和广告关键词对应的向量,计算每个用户关键词与每个广告关键词的余弦相似度,累加用户的所有用户关键词与同一广告的所有广告关键词的余弦相似度,将累加结果作为用户和该广告的匹配度;执行模块,用于选取与用户匹配度最高的广告向用户投放。进一步地,所述装置还包括:第一处理模块,用于根据用户信息及用户访问过的帖子获得用户的性别、年龄段和兴趣标签,将所述性别、年龄段和兴趣标签作为用户的关键词;用户画像模块,用于存储用户信息及与用户信息对应的用户的关键词。具体地,所述第一处理模块包括:第一预处理单元,用于收集网络论坛中已确认性别、年龄段的用户的用户信息及其访问过的所有帖子,分析所有所述帖子的主题分布,生成多个大类主题;模型生成单元,用于根据所述用户信息及其访问过的帖子所属大类主题,建立性别、年龄段和对应大类主题的标签训练数据,使用神经网络算法训练获得帖子主题对应的性别、年龄段的概率模型;第二预处理单元,用于收集需要修正性别、年龄的用户访问过的所有帖子,提取每个帖子的关键词,计算所述关键词与所述大类主题的相似度,选取相似度最高的大类主题作为用户最关心的主题,第一确定单元,用于将用户最关心的主题输入所述概率模型,推测得到用户的性别和年龄段。具体地,所述第一处理模块还包括:第三预处理单元,用于根据论坛中所有帖子的主题,创建多个兴趣主题;提取单元,用于提取用户历史访问的每个帖子的关键词;第二确定单元,用于计算所述关键词与所述兴趣主题的相似度,确定帖子所属兴趣主题,并将确定的所述兴趣主题的关键词作为用户的兴趣标签。进一步地,所述装置还包括:第二处理模块,用于对论坛帖子中的文本执行分词处理,得到文本的单词;对所述文本的单词执行向量化处理,得到每个单词的向量;所述词-向量模块,用于存储单词及与所述单词对应的向量。本专利技术的有益效果是:(1)本专利技术通过计算用户关键词与广告关键词的相似度,并进行相似度排序,选择相似度最高的广告进行投放。采用本专利技术能够找到具有语义相关的匹配词,实现针对不同用户的广告精准投放。(2)通过修正用户的注册数据推测用户性别、年龄段,以及分析用户访问轨迹生成用户兴趣标签,从而获得贴近真实的用户关键词,提升了用户画像的准确度。(3)传统的生成兴趣标签方法,基本都是定义一些兴趣判别公式,然后计算满足公式的程度来判断兴趣,本专利技术采用模糊兴趣方式,采取多个关键词共同描绘一个兴趣主题,并使用统一方法,避免了每次都要针对不同兴趣标签定义不同公式,编程不同逻辑的麻烦,并且能更加准确、饱满的描绘用户兴趣。附图说明为了更清楚地说明本专利技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。图1是本专利技术实施例一的用于网络论坛的广告投放方法的流程图;图2是本专利技术实施例一的构建用户画像库的方法的流程图;图3是本专利技术实施例一的获得用户的性别和年龄段的方法的流程图:图4是本发本文档来自技高网...
一种用于网络论坛的广告投放方法及装置

【技术保护点】
一种用于网络论坛的广告投放方法,其特征在于,包括:获取用户的关键词和在排期内的每个广告的关键词,所述用户的关键词包括至少一个用户关键词,所述广告的关键词包括至少一个广告关键词;在词‑向量库中查找用户关键词和广告关键词对应的向量;根据用户关键词和广告关键词对应的向量,计算每个用户关键词与每个广告关键词的余弦相似度,累加用户的所有用户关键词与同一广告的所有广告关键词的余弦相似度,将累加结果作为用户和该广告的匹配度;选取与用户匹配度最高的广告向用户投放。

【技术特征摘要】
1.一种用于网络论坛的广告投放方法,其特征在于,包括:获取用户的关键词和在排期内的每个广告的关键词,所述用户的关键词包括至少一个用户关键词,所述广告的关键词包括至少一个广告关键词;在词-向量库中查找用户关键词和广告关键词对应的向量;根据用户关键词和广告关键词对应的向量,计算每个用户关键词与每个广告关键词的余弦相似度,累加用户的所有用户关键词与同一广告的所有广告关键词的余弦相似度,将累加结果作为用户和该广告的匹配度;选取与用户匹配度最高的广告向用户投放。2.根据权利要求1所述的方法,其特征在于,所述获取用户的关键词具体为:从所述用户画像库中提取用户的关键词;在获取用户的关键词和在排期内的每个广告的关键词之前还包括:根据用户信息及用户访问过的帖子获得用户的性别、年龄段和兴趣标签,将所述性别、年龄段和兴趣标签作为用户的关键词;将所述用户信息及用户的关键词进行对应存储,形成用户画像库。3.根据权利要求2所述的方法,其特征在于,所述根据用户信息及用户访问过的帖子获得用户的性别和年龄段包括:收集论坛中已确认性别、年龄段的用户的用户信息及其访问过的所有帖子,分析所有所述帖子的主题分布,生成多个大类主题;根据所述用户信息及其访问过的帖子所属大类主题,建立性别、年龄段和对应大类主题的标签训练数据,使用神经网络算法训练获得帖子主题对应的性别和年龄段的概率模型;收集需要修正性别和年龄段的用户访问过的所有帖子,提取每个帖子的关键词,计算所述关键词与所述大类主题的相似度,选取相似度最高的大类主题作为用户最关心的主题,将用户最关心的主题输入所述概率模型,推测得到用户的性别和年龄段。4.根据权利要求2所述的方法,其特征在于,所述根据用户信息及用户访问过的帖子获得用户的兴趣标签包括:根据论坛中所有帖子的主题,创建多个兴趣主题;提取用户历史访问的每个帖子的关键词,计算所述关键词与所述兴趣主题的相似度,确定帖子所属兴趣主题,并将确定的所述兴趣主题的关键词作为用户的兴趣标签。5.根据权利要求1所述的方法,其特征在于,在获取用户的关键词和在排期内的每个广告的关键词之前还包括:对论坛帖子中的文本执行分词处理,得到文本的单词;对所述文本的单词执行向量化处理,得到每个单词的向量;将所述单词和向量对应存储,形成词-向量库。6.一种用...

【专利技术属性】
技术研发人员:蒙道忠王淳
申请(专利权)人:天涯社区网络科技股份有限公司
类型:发明
国别省市:海南;46

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1