基于搜索引擎的定向广告推送方法技术

技术编号:2832653 阅读:721 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于搜索引擎的定向广告推送方法。目前的广告推广工作无法解决精确匹配的问题,竞价排名等广告形式虽然能够实现比较好的匹配,但广告主只能被动等待潜在客户找到自己,而且搜索引擎厂商无法有效解决点击欺诈的问题。为解决上述问题,本发明专利技术包括以下步骤:(1)收集管理提供交易信息的客户资料;从互联网上抓取带有联系方式的寻求交易信息;(2)提取客户提供的交易信息,寻找有此需求的从互联网上抓取的带有联系方式的寻求交易信息,向该寻求交易信息的联系方式发送以所述客户提供的交易信息为内容的广告。本发明专利技术可以帮助推广方进行针对性极强、成本极低的产品或服务推广,同时可以方便、及时地解决广告接受者的需求问题。

【技术实现步骤摘要】

本专利技术涉及一种。技术背景爬虫是一个自动下载网页的程序。爬虫程序根据既定的抓取目标,有选择的访问万维网 上的网页与相关的链接,获取所需要的信息。爬虫并不追求大的覆盖,而将目标定为抓取与 某一特定主题内容相关的网页,为相关用户査询准备数据资源。目前有推广需求的组织和个人一般都是采用各类形式的广告来进行推广工作。但是,无 论是户外广告、传统媒体广告还是投放在互联网上的广告,都无法解决精确匹配的问题。譬 如看到房产中介广告的人可能根本不需要租房服务或进行二手房买卖。无法精确匹配的后果 就是投入产出比很不理想。搜索引擎(例如传统的通用搜索引擎AltaVista,百度,Yahoo!和Google等)的竞价排名服 务等新型广告形式虽然能够实现比较好的匹配,但是广告客户购买了竞价关键词后,只能被 动等待潜在客户找到自己,效率低,时效性不强。而且直到现在,各个搜索引擎厂商都还无 法有效解决欺诈点击的问题,这就意味着广告主相当一部分资金可能是无效的。此外,通用 搜索引擎在某些领域的搜索效果不佳,这些领域的广告主在通用搜索引擎上的竞价排名效果 因而就不是很有效。
技术实现思路
针对现有广告形式和技术存在的缺陷和不足,本专利技术提供一种基于搜索引擎的定向广告 推送方法,能利用爬虫技术针对客户需要的特定内容自动、及时地完成信息的抓取、分类和发送。为了达到上述专利技术目的,本专利技术,包括以下步骤-(1) 收集管理提供交易信息的客户资料;从互联网上抓取带有联系方式的寻求交易信息;(2) 提取客户提供的交易信息,寻找有此需求的从互联网上抓取的带有联系方式的寻求交易信息,向该寻求交易信息的联系方式发送以所述客户提供的交易信息为内容的广告。其中,所述步骤(1)中使用爬虫程序自动从互联网上抓取带有联系方式的寻求交易信息 的网页。上述的基于垂直搜索引擎的定向广告推送方法中,所述步骤(1)中的客户资料包括客 户提供的交易信息内容、替客户发送广告的次数。其中,所述步骤(2)进一步包括以下步骤(21) 将从互联网上抓取的带有联系方式的寻求交易信息按内容分类,建立分类索引, 分类索引下为同一类的各寻求交易信息的联系方式及简要内容;(22) 提取客户资料,寻找与客户需要的内容相一致的分类索引;(23) 向所述分类索引下的联系方式发送所述客户提供的交易信息为内容的广告,并更 新客户资料。作为优选,步骤(21)中新从互联网上抓取的寻求交易信息排在原有寻求交易信息之前。进一步的,步骤(2)中广告发送形式包括手机、电话、电子邮件或邮件。上述的中,特定的寻求交易信息包括租房信息、购 房信息、购物信息、票务信息、餐饮信息、招聘信息。上述的中,步骤(23)中更新客户资料包括将记录的替客户发送广告的次数减l。通过本专利技术,可以帮助推广方进行针对性极强、成本 极低的产品或服务推广,同时可以方便、及时地解决广告接受者的需求问题,也克服了传统 竞价排名中的点击欺诈问题。附图说明图l为本专利技术流程图;图2为本专利技术数据抓取程序工作图。具体实施方式下面结合附图对本专利技术作进一步的详细说明互联网上的网页之间通过URL互相连接,形成一个网状结构。爬虫是抓取网页的程序, 它从某些页面入口,在这张网上爬行,并将遇到的web页面抓取下来,存到本地。为高效获 取信息,本系统专用爬虫做了大量的优化手段,能够有针对性的从海量网页中筛选出含有可 能的潜在用户的信息。如图2所示,工作流程如下-1,首先获取抓取起始URL列表。为了提高效率,我们利用了现有的通用搜索引擎获取信 息的能力,在通用搜索引擎中査询关键词,获得与联系信息高度相关的网页,作为抓取的起 始点。2,爬虫开始运行,从起始URL列表入口,依次抓取URL对应的web页面,并对页面内容 进行分析。分析工作包括从web页面中抽取潜在用户的联系信息和周围相关描述文字,提取 该web页面中的URL,利用一些领域信息决定每个URL的抓取优先级(优先级越高,表明URL 对应web页面的信息越有用,优先抓取)。3,将上歩获取的URL再次交给爬虫抓取,如此反复。在此过程中,除了收集潜在用户联 系信息以外,还收集一些对于提高抓取效率有用的领域信息,这些信息对于预测待抓取URL 对应Web页面的价值有极大的帮助。本专利技术基于三个部分广告客户管理部分、数据抓取部分和广告发送部分。广告客户管理部分用于管理发送广告的客户,比如,有客户手中掌握着北京亚运村一带 二手房的房源,该客户希望向有意在亚运村一带购买二手房的人推销自己手中的房源,那么 广告客户管理部分记录该客户提供的交易信息,所述交易信息包括该客户广告推广的客户类 型(亚运村二手房求购)、广告的具体内容(二手房的户型、朝向、大小、具体位置、己使 用年限、价格、产权等信息)以及为该客户发送广告的次数。另外,广告客户管理部分还负 责添加、修改、删除客户资料以及提取客户提供的交易信息到广告发送部分。数据抓取部分利用爬虫技术定时或不定时地从互联网上搜索并抓取海量网页,从这些网 页中提取出带有联系方式的网页,将这些网页存入网页数据库。广告发送部分负责从网页数据库中提取带有联系方式的网页,并利用分析软件对这些数 据进行语义和语境分析,根据分析结果把网页中的寻求交易信息按照内容进行分类,建立分 类索引,比如,把所有求购北京亚运村地区二手房的寻求交易信息归入亚运村二手房求购 目录下,寻求交易信息按照时效性倒排,即越新的寻求交易信息排在顶端,越旧的排在底端。 如果这时广告客户管理部分发送来关键字(也就是客户广告推广的客户类型)为亚运村二 手房求购的客户提供的交易信息,那么广告发送部分向亚运村二手房求购目录下的最 新的一定量的寻求交易信息的联系方式发送以所述客户提供的交易信息为内容的广告,发送 方式可以为短信、彩信、电话、电子邮件或邮件。当广告发送部分发送完广告后,广告客户管理部分将记录的替客户发送广告的次数减1。如图1所示,基于爬虫技术的本专利技术具体实施方式如下(101 )数据抓取部分利用爬虫软件自动从互联网上抓取海量网页;(102) 从这些网页中,提取出带有联系方式的网页,并将其存入系统的网页数据库中;(103) 有客户寻求关键字为五道口求租的特定的寻求交易信息,广告客户管理部 分记录该客户寻求的内容,需要为该客户提供服务的次数以及该客户的联系方式,包括手机 号码、电子邮箱、电话号码等;(104) 广告发送部分将网页数据库中带有联系方式的网页按内容分类,建立分类索引, 其中,把所有内容涉及五道口求租的网页中的联系方式及简要内容(如户型、价格、具 体地理位置等)分至五道口求租之下,各寻求交易信息的排序为倒排式,即越新的信息 越往前排,最新的信息在目录顶端,这样可以保证信息的时效性;(105) 提取客户资料,寻找与客户需要的关键字为五道口求租相一致的分类索引;(106) 将五道口求租下的最新的数条寻求交易信息以短信或彩信的形式发送给客户;(107) 将需要为该客户提供服务的次数减一,直到次数归零。当然,本专利技术还存在其他实施方式,比如将步骤(103)置于步骤(101)之前等本领域 技术人员可轻易想到的方式,在此不作赘述。本文档来自技高网...

【技术保护点】
一种基于搜索引擎的定向广告推送方法,其特征在于:包括以下步骤:(1)收集管理提供交易信息的客户资料;从互联网上抓取带有联系方式的寻求交易信息;(2)提取客户提供的交易信息,寻找有此需求的从互联网上抓取的带有联系方式的寻求交易信息,向该寻求交易信息的联系方式发送以所述客户提供的交易信息为内容的广告。

【技术特征摘要】
1、 一种基于搜索引擎的定向广告推送方法,其特征在于包括以下步骤(1) 收集管理提供交易信息的客户资料;从互联网上抓取带有联系方式的寻求交易信息;(2) 提取客户提供的交易信息,寻找有此需求的从互联网上抓取的带有联系方式的寻求 交易信息,向该寻求交易信息的联系方式发送以所述客户提供的交易信息为内容的广告。2、 根据权利要求1所述的基于搜索引擎的定向广告推送方法,其特征在于所述步骤(l) 中使用爬虫软件自动从互联网上抓取带有联系方式的寻求交易信息的网页。3、 根据权利要求l所述的基于垂直搜索引擎的定向广告推送方法,其特征在于所述歩 骤(1)中的客户资料包括客户提供的交易信息内容、替客户发送广告的次数。4、 根据权利要求1所述的基于搜索引擎的定向广告推送方法,其特征在于所述步骤(2) 进一步包括以下步骤(21) 将从互联网上抓取的带有联系方式的寻求交易信息按内容分类,...

【专利技术属性】
技术研发人员:陈华
申请(专利权)人:北京酷讯科技有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1