网页广告匹配方法及系统技术方案

技术编号:2821574 阅读:194 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种网页广告匹配方法,包括以下步骤:当嵌有广告代码模块的网页中广告代码被触发时,广告代码模块向广告服务器发出广告请求;广告服务器根据广告请求判断网页能够正常提取关键词,如果不能正常提取关键词,则从该网页所在的网站的网页集合中获得符合预定条件的关键词;广告服务器将广告库中与关键词匹配的广告内容返回给广告代码模块进行匹配。本发明专利技术还涉及一种网页广告匹配系统,包括广告代码模块和广告服务器。本发明专利技术对网页所在的网站进行关键词的提取,这样可以弥补那些无法正常提取关键词的网页投放广告的需求,从而优化了内容广告的匹配范围,获得更好的广告效果。

【技术实现步骤摘要】

本专利技术涉及一种网页广告匹配方法及系统,尤其是一种内容广告匹配方 法及系统。
技术介绍
个很好的利益增长点。通常的方式是运用关键词匹配策略来进行广告投放,足条件的关键词,然后在广告库中将该关键词与广告进行匹配,并将匹配的 广告返回给网页,然后展现给浏览的用户。举例来说,如果用户浏览了一个网页中存在有较多的"mP3播放器"的词汇,广告服务器会判断这个词汇根 据预设规则计算出的权值(例如将词频与逆文本频率指数的乘积作为权值) 是否满足阈值而进行提取,当满足阈值时,会将"mp3播放器"与广告库中 的与mp3播》文器相关的广告调出,返回给该网页,并结合在该网页内,然后 展现给浏览的用户,这时用户所能看到的页面就是包含着内容相关广告的网 页。这种广告投放方式可以针对用户的兴趣提供相应的广告,效果要强于传 统的与内容无关的广告。但这种方式也有一定的缺陷,这是因为互联网上的 内容具有不规范、自由、分散等特点,很多情况下(具有框架的内嵌式网页、 嵌有脚本的动态网页)在网页中无法提取出关键词,这就使广告匹配无法进行。6
技术实现思路
本专利技术的目的是针对关键词匹配策略对于一些网页无法实现提取而导致 无法进行广告匹配的缺陷,提出了一种网页广告匹配方法及系统,能够优化 内容广告的匹配范围,达到更好的广告投放效果。为实现上述目的,本专利技术提供了一种网页广告匹配方法,包括以下步骤 当嵌有广告代码模块的网页中广告代码被触发时,所述广告代码模块向广告服务器发出广告请求;所述广告服务器根据所述广告请求判断所述网页能够正常提取关键词,如果不能正常提取关键词,则从该网页所在的网站的网页集合中获得符合预定条件的关键词;所述广告服务器将广告库中与所述关键词匹配的广告内容返回给所述广告代码模块进行匹配。为实现上述目的,本专利技术提供了一种网页广告匹配系统,包括 广告代码模块,用于当嵌有广告代码模块的网页中广告代码被触发时,向广告服务器发出广告请求;广告服务器,与所述广告代码模块相连,用于接收所述广告代码模块 发出的广告请求,并判断所述网页能够正常提取关键词,如果不能正常提 取关键词,则从该网页所在的网站的网页集合中获得符合预定条件的关键 词,并根据所述广告请求将广告库中与所述关键词匹配的广告内容返回给 所述广告代码模块进行匹配。基于上述技术方案,本专利技术具有以下优点本专利技术对网页所在的网站进 行关键词的提取,这样可以弥补那些无法正常提取关键词的网页投放广告的 需求,从而优化了内容广告的匹配范围,获得更好的广告效果。下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。附图说明图1为本专利技术网页广告匹配方法的第一实施例的流程示意图。 图2为本专利技术网页广告匹配方法的第二实施例的设置关键词列表的流程 示意图。图3为本专利技术网页广告匹配系统的第一实施例的结构示意图。 图4为本专利技术网页广告匹配系统的第二实施例的结构示意图。 图5为本专利技术网页广告匹配系统的第三实施例的结构示意图。 图6为本专利技术网页广告匹配系统的第四实施例的结构示意图。具体实施方式本专利技术的各个实施例从网站的网页集合中提取出关键词,然后根据关 键词匹配广告,而不是从被载入网页自身内容来提取关键词来匹配广告。 这种广告匹配方式主要用于解决一些网页无法提取出适当的关键词,从而 无法进行广告匹配的问题。将这种广告匹配方式与现有的广告匹配方式结 合,可以满足绝大多数网页的广告需求。方法实施例1如图l所示,为本专利技术网页广告匹配方法的第一实施例的流程示意图。 在这个实施例中,包括以下的步骤步骤IOI、当嵌有广告代码模块的网页被用户通过浏览器载入时,广告 代码被触发运行,向广告服务器发出广告请求。所谓广告代码可以是通过 计算机语言脚本表达的,用来读取广告信息或者传递网页格式信息等的代 码,可以采用JavaScript脚本,但不限于这种计算机语言脚本,以 JavaScript为例,通过"〈script language = " JavaScript "〉脚本代码 </script>"的形式将广告代码嵌入在网页中;步骤102、广告服务器接收到广告请求后,根据该广告请求对该网页 是否能够正常提取关键词进行判断,是则执行步骤104,否则执行步骤103;步骤103、广告服务器从该网页所在的网站的网页集合中获得符合预定条件的关键词,然后执行步骤105;步骤104、广告服务器直接从网页的文本内容中提取关键词;步骤105、广告服务器将广告库中与关键词匹配的广告内容返回给广 告代码模块进行匹配。广告库可以采用数据库形式,多个广告内容以记录 的方式存储,每个广告内容对应于一个广告标识。对于无法正常从网页中提取关键词的情况,可以根据筛选的不同要求 来选择不同的预定条件。所谓预定条件 一般是指通过预定规则计算出的权 值是否符合阈值,例如在一个或多个网页的文本内容中某个词出现的频率 是否达到阈值,或者词频(Term Frequency,简称TF )与逆文本频率指数 (Inverse Document Frequency,简称IDF)的乘积是否达到阈值等。这种无法正常从网页中提取关键词的情况具体到网页来说,可能是由 于网页框架或者动态网页等问题导致无法提取关键词,这时通过该网页的 网站来提取关键词便成为了 一种有效的替代方式,例如某个与足球有关的 新闻网页,其上级目录可能也是相关的与足球或与体育有关的内容,本发 明实施例在提取关键词时对上级目录中的网页集合进行内容的提取,与提 取出的关键字相匹配的广告与该网页的内容的类属有关,也实现了内容广 告的针对性。因此本实施例的方案可以直接应用,也可以作为从当前网页 提取关键词失败时的替代方式。方法实施例2如图2所示,为本专利技术网页广告匹配方法的第二实施例的设置关键词列 表的流程示意图。与上一实施例相比,本实施例中在步骤103中需要先读取 预先设置的与网页集合关联的关键词列表,并根据该关键词列表对关键词 进行筛选。其中需要先对与网页集合关联的关键词列表进行设置,设置流 程包括步骤201、广告服务器选取该网页所在网站的网页集合,并读取所述 网页集合的文本内容。所谓网页集合可以是网站的一级域名下的全部网页或部分网页,或者是网站与该网页对应的二级域名下的全部网页或部分网 页,又或者是该网页的向上一级或更多级别目录下的全部网页或部分网 页,具体选择哪种网页集合可以预先根据网站类型进行设定,对于门户网站,可以考虑上级目录或更高级的目录下的网页;而对于专业网站,可以 采用 一级域名下的全部网页或部分网页等。在选择网页集合时,可以根据页面所在的网站的组织结构通过层次聚 类算法(Hierarchical Clustering Algorithms)来获取粒度信息,而层 次聚类算法在现有的各种文献中已有较多介绍,例如S. C. Johnson (1967): "Hierarchical Clustering Schemes" Psychometrika, 2:241-254 , R. D'andrade (1978): "U-Statistic Hierarchical Clustering" Psychometrika, 4: 58-67等。然后就可以根据得到的粒度信 息和随机策略在该网页所在网站中本文档来自技高网...

【技术保护点】
一种网页广告匹配方法,其特征在于,包括以下步骤: 当嵌有广告代码模块的网页中广告代码被触发时,所述广告代码模块向广告服务器发出广告请求; 所述广告服务器根据所述广告请求判断所述网页能够正常提取关键词,如果不能正常提取关键词,则从该网页所在的网站的网页集合中获得符合预定条件的关键词; 所述广告服务器将广告库中与所述关键词匹配的广告内容返回给所述广告代码模块进行匹配。

【技术特征摘要】

【专利技术属性】
技术研发人员:王闯李毅明刘京毅张川王湛于建强郭眈李彦宏
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1