一种基于场景信息推送广告的方法、系统及设备技术方案

技术编号:2836121 阅读:361 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及通信领域,提供了一种基于场景信息推送广告的方法、系统及设备。所述方法包括以下步骤:A.统计用户访问的网页,并根据从所述网页中提取的特征词生成兴趣向量;B.根据所述兴趣向量预测用户兴趣走向,并生成一个包含用户兴趣走向的场景信息;C.根据场景信息选择广告,并将所述广告推送至用户所在的客户端中。本发明专利技术通过对用户最近所浏览的网页进行统计,得到能够体现用户兴趣走向的场景信息,有效提高了广告推送的针对性;此外,还对用户反馈信息进行效果分析,从而进一步完善了广告推送过程。

【技术实现步骤摘要】

本专利技术涉及通信领域,更具体地说,涉及一种基于场景信息推送广告的方法、系统及设备
技术介绍
在这个以信息沟通为主导的经济时代,随着互联网技术的完善,网络智能广告也在迅猛发展。网络智能广告的核心技术是进行受众分析。也即,通过对互联网用户的网络行为进行分析得出用户特征信息,比如该用户的年龄、性别、地理位置、收入状况以及其感兴趣的领域等。受众分析的其中一个方面是进行场景分析,场景信息可以作为对那些冲动型购物的用户推送广告的依据。所谓场景分析,就是通过统计用户的网页浏览行为,如浏览历史、浏览活动等,从而分析得知用户的兴趣集中在哪些领域(例如,汽车、房产、旅游、数码、音乐、动漫、游戏、体育、交友、读书、军事、财经、文学、美食等),然后则可针对性地投放用户感兴趣的个性化广告。现有技术进行场景分析的具体过程包括(1)利用分词技术抽取网页特征词,对网页进行分类;(2)统计用户访问过的网页的数量,提取出所有网页的特征词,并将其并集作为候选特征词;(3)计算每个特征词出现在每个页面中的权值,从而得到兴趣向量;(4)根据兴趣向量生成场景信息,并在对其编码后写入Cookie中。其生成场景信息的具体过程包括对兴趣向量进行平均,再正则化(使权重之和为1),所得即为场景信息的取值。由上可知,现有技术所得到的场景信息仅仅是对用户兴趣的一个综合,无法体现用户兴趣走向,因此推送的广告不能非常精确地吻合用户实际的兴趣和需要。所谓用户兴趣走向,是指用户感兴趣的领域可能随时都在转移,而其转移趋势则被称为用户兴趣走向。现有技术的场景信息没有考虑该用户兴趣走向,因此在推送广告的针对性方面仍有待进一步完善。
技术实现思路
本专利技术的目的在于提供一种基于场景信息推送广告的系统,旨在解决现有技术推送广告的针对性不足的问题。本专利技术的目的还在于提供一种基于场景信息推送广告的设备,以更好地解决现有技术中存在的上述问题。本专利技术的目的还在于提供一种基于场景信息推送广告的方法,以更好地解决现有技术中存在的上述问题。为了实现专利技术目的,所述基于场景信息推送广告的系统包括服务器和客户端,所述服务器包括一个用于存储用户所访问的网页的数据库,一个用于根据用户所访问的网页获取场景信息的场景分析单元,和一个根据场景信息投放广告的广告推送单元,所述场景分析单元中包括一个兴趣走向预测模块,用于根据用户所访问的网页预测用户兴趣走向,并生成一个包含所述用户兴趣走向的场景信息。优选地,所述场景分析单元还包括特征词提取模块、兴趣向量生成模块;所述特征词提取模块用于从用户所浏览的网页中提取特征词;所述兴趣向量生成模块与特征词提取模块相连,用于计算所述特征词在用户所浏览的各网页中的权值,将所述特征词及其权值组成兴趣向量,并送入兴趣走向预测模块。优选地,所述服务器进一步包括一个效果分析单元,与所述广告推送单元相连,用于根据广告推送数据以及客户端反馈的用户点击数据,计算广告的曝光率和点击率。为了更好地实现专利技术目的,所述基于场景信息推送广告的设备,即与客户端相连的服务器,所述服务器包括一个用于收集并存储用户数据的数据库,一个用于根据用户数据获取场景信息的场景分析单元,和一个根据场景信息投放广告的广告推送单元,所述场景分析单元中包括一个兴趣走向预测模块,用于根据用户所访问的网页预测用户兴趣走向,并生成一个包含所述用户兴趣走向的场景信息。优选地,所述场景分析单元还包括特征词提取模块、兴趣向量生成模块;所述特征词提取模块用于从用户所浏览的网页中提取特征词;所述兴趣向量生成模块与特征词提取模块相连,用于计算所述特征词在用户所浏览的各网页中的权值,将所述特征词及其权值组成兴趣向量,并送入兴趣走向预测模块。为了更好地实现专利技术目的,所述基于场景信息推送广告的方法包括以下步骤A.统计用户访问的网页,并根据从所述网页中提取的特征词生成兴趣向量;B.根据所述兴趣向量预测用户兴趣走向,并生成一个包含用户兴趣走向的场景信息;C.根据场景信息选择广告,并将所述广告推送至用户所在的客户端中。优选地,所述步骤A之前还包括利用分词技术对网页进行分类。优选地,所述步骤A进一步包括A1.从用户访问的网页中提取特征词,并将所述特征词的并集作为候选特征词;A2.计算候选特征词中每一者的权值,并将特征词及其权值组织成一个兴趣向量。优选地,所述步骤B包括B11.对所述兴趣向量中的各个分量进行加权平均,其中各分量的权重取值与其时间顺序成反比;B12.对步骤B11输出的加权平均值进行正则化处理,并将运算结果作为场景信息进行编码。优选地,所述步骤B包括B21.将所述兴趣向量作为多维时间序列在对应时间点上的取值;B22.预测所述多维时间序列的下一个取值,并将所述下一个取值作为场景信息进行编码。本专利技术通过对用户最近所浏览的网页进行统计,得到能够体现用户兴趣走向的场景信息,有效提高了广告推送的针对性;此外,还对用户反馈信息进行效果分析,从而进一步完善了广告推送过程。附图说明图1是本专利技术中基于场景信息推送广告的系统结构图;图2是本专利技术的服务器中场景分析单元的内部结构图;图3是本专利技术的一个实施例中基于场景信息推送广告的系统结构图; 图4是本专利技术中基于场景信息推送广告的方法流程图;图5是本专利技术的一个实施例中基于场景信息推送广告的方法流程图。具体实施例方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本专利技术中,首先利用分词技术提取所有网页中的特征词,从而对网页进行分类;然后定期统计用户最近访问过的网页,将网页中的特征词的并集作为候选特征词,并计算每个特征词出现在每个网页中的权值,从而得到兴趣向量;再根据兴趣向量进一步得到一个能够体现用户兴趣走向的场景信息,从而可根据该场景信息针对性地推送广告到用户所在的客户端。图1示出了本专利技术中基于场景信息推送广告的系统结构,该系统包括服务器100,以及与其相连的多个客户端(客户端200、客户端300……客户端N)。应当说明的是,本专利技术所有图示中各设备之间的连接关系是为了清楚阐释其信息交互及控制过程的需要,因此应当视为逻辑上的连接关系,而不应仅限于物理连接。各客户端(客户端200、客户端300……客户端N)可为能够登录因特网并进行网络活动的各种终端设备,例如个人计算机(Personal Computer,PC)、个人数字助理(Personal Digital Assistant,PDA)、移动电话(Mobile Phone,MP)等,因此本专利技术的保护范围不应限定为某种特定类型的客户端。服务器100用于存储用户数据,并根据用户数据进行场景分析,然后基于所生成的场景信息推送广告至客户端。该服务器100典型的可为专用的广告伺服器,或者具有广告伺服功能的大型网站服务器等,因此本专利技术的保护范围不应限定为某种特定类型的服务器。进一步地,服务器100包括数据库101、场景分析单元102和广告推送单元103,其中(1)数据库101用于存储所收集到的用户数据,这些用户数据主要包括用户的浏览历史(即用户所浏览的网页)、用户的网络行为(例如对其感兴趣的链接的点击操作)等。(2)场景分析单元102与数据库101相连,本文档来自技高网
...

【技术保护点】
一种基于场景信息推送广告的系统,包括服务器和客户端,所述服务器包括一个用于存储用户所访问的网页的数据库,一个用于根据用户所访问的网页获取场景信息的场景分析单元,和一个根据场景信息投放广告的广告推送单元,其特征在于,所述场景分析单元中包括一个兴趣走向预测模块,用于根据用户所访问的网页预测用户兴趣走向,并生成一个包含所述用户兴趣走向的场景信息。

【技术特征摘要】

【专利技术属性】
技术研发人员:岳亚丁廖焕华宋大可刘奕慧龚磊曾海涛吴晓光
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1