基于搜索引擎的广告投放方法、装置以及搜索引擎系统制造方法及图纸

技术编号:18446074 阅读:45 留言:0更新日期:2018-07-14 10:51
本发明专利技术提供了一种基于搜索引擎的广告投放方法、装置以及搜索引擎系统,其中的方法包括:建立与预设的广告相对应的广告特征索引矩阵,获取用户输入的查询文本信息,建立查询特征向量,计算每个广告特征向量与广告特征索引矩阵的查询特征向量之间的语义相似度,基于语义相似度确定用于进行投放的广告。本发明专利技术的方法、装置以及搜索引擎系统,对用户键入的搜索摘要与广告的标准类别描述信息进行快速匹配,提高搜索摘要与广告主题的匹配度,可以实现快速精准的广告投放;预先形成广告库并采用相似度模型能够保证高效地进行匹配,达到了短时间内精准投放广告的目的,同时保证用户隐私,并能够提高用户的使用感受。

Search engine based advertising method, device and search engine system

The invention provides an advertisement delivery method, a device and a search engine system based on a search engine. The methods include: establishing an advertisement feature index matrix corresponding to the preset advertisement, obtaining the query text information of the user input, establishing the query feature vector, and calculating each ad feature vector and ad special. The semantic similarity between the query feature vectors of the index matrix is determined, and the advertisements for the placement are determined based on semantic similarity. The method, device and search engine system of the invention can quickly match the search summary of the user and the standard category description information of the advertisement, improve the matching degree of the search summary and the advertisement theme, and realize the fast and accurate advertisement; the advertisement library is formed in advance and the similarity model can guarantee the high efficiency. Matching can achieve the goal of accurate advertising in a short time, at the same time, ensure user privacy and enhance user's experience.

【技术实现步骤摘要】
基于搜索引擎的广告投放方法、装置以及搜索引擎系统
本专利技术涉及数据挖掘
,尤其涉及一种基于搜索引擎的广告投放方法、装置以及搜索引擎系统。
技术介绍
随着信息时代的到来,互联网在生活中扮演着越来越重要的角色,广告投放也因此多了一种全新的方式。一种广告投放方法是通过搜索引擎进行广告的投放,在搜索业务中,搜索引擎的日搜索量多达数十亿次并且用户在使用搜索引擎时,所键入的内容都是他们感兴趣的,这样的场景是十分契合广告投放的。但是现行的通过搜索引擎进行广告的投放存在着一些缺陷。在大量的搜索中,总是存在着一些无效搜索,用户无法得到与其期望相匹配的结果,同时,就广告方面而言,传统的搜索引擎广告推荐方法一般通过第三方cookie,在进行搜索的时候,搜索引擎设置一个用户标识cookie,当访问了有搜索引擎推广广告的网页时候,此网页会根据之前留下的搜索关键词,生成广告链接,并展示给用户。但该方法涉及到隐私泄露问题,而且用户可以通过禁用cookie保护隐私,使广告推广变得不精准。
技术实现思路
本专利技术的一个或多个实施例提供一种基于搜索引擎的广告投放方法、装置以及搜索引擎系统。根据本公开的一个方面,提本文档来自技高网...

【技术保护点】
1.一种基于搜索引擎的广告投放方法,其特征在于,包括:基于广告语义索引模型建立与预设的广告相对应的广告特征索引矩阵;其中,所述广告特征索引矩阵中的每一列向量或每一行向量为与一条广告相对应的广告特征向量;获取用户输入的查询文本信息,对所述查询文本信息进行分词处理,获得查询特征词;基于所述广告语义索引模型和所述查询特征词建立查询特征向量;计算每个广告特征向量与所述查询特征向量之间的语义相似度;基于所述语义相似度确定用于进行投放的广告。

【技术特征摘要】
1.一种基于搜索引擎的广告投放方法,其特征在于,包括:基于广告语义索引模型建立与预设的广告相对应的广告特征索引矩阵;其中,所述广告特征索引矩阵中的每一列向量或每一行向量为与一条广告相对应的广告特征向量;获取用户输入的查询文本信息,对所述查询文本信息进行分词处理,获得查询特征词;基于所述广告语义索引模型和所述查询特征词建立查询特征向量;计算每个广告特征向量与所述查询特征向量之间的语义相似度;基于所述语义相似度确定用于进行投放的广告。2.如权利要求1所述的方法,其特征在于,所述基于广告语义索引模型建立与预设的广告相对应的广告特征索引矩阵包括:获取用于描述所述广告的标准类别描述信息;对所述标准类别描述信息进行分词处理,获得用于描述所述广告的描述特征词并生成分词词典;基于所述广告语义索引模型和所述描述特征词建立所述广告特征索引矩阵。3.如权利要求2所述的方法,其特征在于,所述基于所述广告语义索引模型和所述描述特征词建立所述广告特征索引矩阵包括:生成所述描述特征词的集合,形成与所述广告相对应的词袋;根据所述集合中的所述描述特征词的数量确定所述广告特征向量的维数;根据词频-逆文档率TF-IDF算法计算出每个描述特征词的权值,根据所述权值建立所述广告特征索引矩阵;其中,所述广告特征索引矩阵的行数为所述广告的数量,所述广告特征索引矩阵的列数为所述集合中的所述描述特征词的数量,所述广告特征索引矩阵中的每一列向量为与一条广告相对应的广告特征向量。4.如权利要求3所述的方法,其特征在于,所述广告特征索引矩阵W为:其中,所述W中的元素ωij是第i个描述特征词对于第j个标准类别描述信息的权值,第j个标准类别描述信息用于描述第j个广告;所述ωij=tfi,j×idfi;其中,词频nij是第i个描述特征词在第j个标准类别描述信息中的出现次数,∑knkj是在第j个标准类别描述信息中所有描述特征词出现的次数之和;逆文档率其中,D为所述标准类别描述信息的总数,{j:ti∈dj}表示包含有第i个描述特征词的标准类别描述信息数目。5.如权利要求4所述的方法,其特征在于,所述基于所述广告语义索引模型和所述查询特征词建立查询特征向量包括:基于所述分词词典对所述查询文本信息进行分词处理,获得所述查询特征词;基于所述查询特征词建立所述查询特征向量P0={p1,p2,…,pn}T,所述查询特征向量的维数为所述广告特征向量的维数;其中,所述查询特征向量P0中的元素pi=tfi*idfi,其中,mi是第i个查询特征词在所述查询文本信息中的出现次数,∑kmk是在所述查询文本信息中所有查询特征词出现的次数之和;idfi为与第i个查询特征词相同的所述描述特征词的逆文档率。6.如权利要求2所述的方法,其特征在于,所述计算每个广告特征向量与所述查询特征向量之间的语义相似度包括:计算所述广告特征索引矩阵中的每一列向量或每一行向量与所述查询特征向量的余弦相似度。7.如权利要求6所述的方法,其特征在于,所述基于所述语义相似度确定用于进行投放的广告包括:将计算获得的余弦相似度进行排序,基于排序结果选取与预设的广告推送数量阈值数量相同的所述广告特征向量;将选取的所述广告特征向量对应的广告推送给用户。8.如权利要求2所述的方法,其特征在于,还包括:利用网络爬虫技术收集与所述广告相对应的信息,将此信息添加在用于描述此广告的标准类别描述信息中;对于所述标准类别描述信息进行分词处理,根据分词结果生成所述分词词典。9.一种基于搜索引擎的广告投放装置,其特征在于,包括:索引矩阵建立模块,用于基于广告语义索引模型建立与预设的广告相对应的广告特征索引矩阵;其中,所述广告特征索引矩阵中的每一列向量或每...

【专利技术属性】
技术研发人员:杜珑祝景浩王小统
申请(专利权)人:浙江省公众信息产业有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1