一种否定关键词的获取方法及装置和搜索方法及装置制造方法及图纸

技术编号:9406292 阅读:90 留言:0更新日期:2013-12-05 06:08
本申请提供了一种否定关键词的获取方法和装置。所述方法包括:记录依据在页面的访问行为生成的访问行为数据,并在所述访问行为数据中提取访客访问的网页信息,以及各网页信息所对应的一个或多个查询词和各查询词对应的第一特征数据;在预置数据库中提取所述查询词对应的第二特征数据和点击率;将满足下述任一条件的查询词提取为否定关键词:条件1、第二特征数据大于第三预设阀值且第三特征收益数据小于第二预设阀值的查询词;条件2、点击率小于第一预设阀值且第三特征收益数据小于第二预设阀值的查询词;其中,所述第三特征数据等于第一特征数据,或为第一特征数据与第二特征数据的比值。本申请可以使选取的否定词更精确,减少错选漏选概率。

【技术实现步骤摘要】
一种否定关键词的获取方法及装置和搜索方法及装置
本申请涉及数据处理领域,特别是涉及一种否定关键词的获取方法和装置,以及一种搜索方法和装置。
技术介绍
针对搜索引擎关键词竞价广告系统,广告主在系统账户中购买关键词,每个关键词绑定一个广告。当一个用户查询词通过某种匹配方式匹配到广告主购买的关键词时,该关键词所绑定的广告将在查询词搜索结果展示页面显示。在某些情况下,对于查询词与广告的关键词进行匹配得出的搜索结果,广告主可能并不希望自己的广告出现在这些搜索结果中。例如,某广告主是一个出售电动车器材的商家,设置一个″电动车器材″的词组匹配,当搜索用户搜索″劣质电动车器材商家名录″或者″电动车器材维修点″这类搜索词的时候,该广告主的广告也会显示在搜索结果中,而且有可能显示在左侧搜索结果的上端。可以通过设定否定关键词来避免这种情况的发生,如上例,可以在该广告的关键词中添加否定关键词“劣质”,即只要用户搜索词中完整的包含了否定关键词(不论以何种词序),该广告都不会展示。当用户搜索″劣质摄影器材商家名录″时就不会展示该广告。当账户包含很多广泛匹配关键词时,否定关键词的作用非常关键。目前,否定关键词的主要来源是账户的搜索查询报告。投放广告之后,搜索引擎关键词竞价广告系统账户就将访客点击的广告,当前查询词和点击费用数据(用户点击广告后,广告主付给搜索引擎的费用)记录在搜索查询报告中。导出最近一个时期的搜索查询报告,对于点击费用数据比较高,以及点击率(点击次数除以展现次数)比较高的查询词,认为是可能对账户有价值的词,将这类词过滤掉;然后,对过滤后的查询词进行人工审核,再删掉一批可能对账户有价值的词,剩下的作为否定关键词调价到账户中。以上现有技术中存在的问题是,按照上述方案得到的否定关键词是点击次数较少的查询词,但相对于其较少的点击次数,访客在点击后展示的广告页面中的访问行为(能给广告主带来收益的行为,例如点击、注册、提交订单等)可能并不少,因此,按照上述方法选取否定关键词存在错选漏选的问题,得到的否定关键词不精确。因此,目前需要本领域技术人员解决的一个技术问题就是,提供一种否定关键词的获取机制,使选取的否定词更为精确,减少错选漏选概率。
技术实现思路
本申请所要解决的技术问题是提供一种否定关键词的获取方法,使选取的否定词更为精确,减少错选漏选概率。本申请还提供了一种否定关键词的获取装置,用以保证上述方法在实际中的应用及实现。为了解决上述问题,本申请公开了一种否定关键词的获取方法,包括:记录依据在页面的访问行为生成的访问行为数据,并在所述访问行为数据中提取访客访问的网页信息,以及各网页信息所对应的一个或多个查询词和各查询词对应的第一特征数据;在预置数据库中提取所述查询词对应的第二特征数据和点击率;将满足下述任一条件的查询词提取为否定关键词:条件1、第二特征数据大于第三预设阀值且第三特征收益数据小于第二预设阀值的查询词;条件2、点击率小于第一预设阀值且第三特征收益数据小于第二预设阀值的查询词;其中,所述第三特征数据等于第一特征数据,或为第一特征数据与第二特征数据的比值。优选的,所述在访问行为数据中提取访问的网页信息,以及各网页信息对应的一个或多个查询词和各查询词对应的第一特征数据的步骤包括:在访问行为数据中提取访问的网页信息,以及各网页信息所对应的搜索查询词和第一特征数据;对所述搜索查询词进行归一化处理,得到各网页信息对应的一个或多个查询词,以及各查询词对应的第一特征数据。优选的,所述网页信息为广告,所述第一特征数据为收益数据,所述第二特征数据为费用数据。优选的,所述第一特征数据包括点击收益数据、登录量、订单量、展现量和交易量中的一种或几种。优选的,所述搜索查询词位于,所述访问行为数据的http头信息的referer字段中。优选的,所述在预置数据库中提取查询词对应的第二特征数据和点击率的步骤包括:在预置数据库中提取记录的多个网页信息、各网页信息对应的一个或多个查询词,以及各查询词对应的第二特征数据和点击率;将网页信息、查询词和第一特征收益数据的对应关系,与预置数据库中提取的查询词、第二特征数据和点击率的对应关系进行匹配,得到各网页信息对应的一个或多个查询词,以及各查询词对应的第一特征数据,第二特征数据和点击率。优选的,所述预置数据库为广告账户。优选的,所述广告账户通过以下步骤记录各网页信息对应的查询词,以及各查询词对应的第二特征数据和点击率:由访客输入的搜索查询词,搜索关键词与之匹配的网页信息并进行展示;记录访客点击的网页信息、当前搜索查询词、第二特征数据,以及展示的广告网页信息;针对各网页信息,统计其展示次数和点击次数,并计算各网页信息的点击率;将记录的各个搜索查询词归一化处理为一个或多个查询词,得到各网页信息对应的一个或多个查询词,以及各查询词对应的第二特征数据和点击率。优选的,所述方法还包括:将相同的查询词所对应的各个数据进行合并。本申请还提供了一种搜索方法,包括:输入搜索查询词;将所述搜索查询词与数据库中各网页信息的关键词进行匹配,所述关键词包括匹配关键词和否定关键词,其中,所述否定关键词通过上述否定关键词的获取方法得出;若所述搜索查询词按照预设匹配方式与某网页信息的匹配关键词匹配,且不包含所述否定关键词,则将该网页信息作为搜索结果输出。本申请还提供了一种否定关键词的获取装置,包括:第一特征数据获取模块,用于记录依据在页面的访问行为生成的访问行为数据,并在所述访问行为数据中提取访客访问的网页信息,以及各网页信息所对应的一个或多个查询词和各查询词对应的第一特征数据;第二特征数据获取模块,用于在预置数据库中提取所述查询词对应的第二特征数据和点击率;否定关键词提取模块,用于将满足下述任一条件的查询词提取为否定关键词:条件1、第二特征数据大于第三预设阀值且第三特征收益数据小于第二预设阀值的查询词;条件2、点击率小于第一预设阀值且第三特征收益数据小于第二预设阀值的查询词;其中,所述第三特征数据等于第一特征数据,或为第一特征数据与第二特征数据的比值。本申请还提供了一种搜索装置,包括:搜索查询词输入模块,用于输入搜索查询词;匹配模块,用于将所述搜索查询词与数据库中各网页信息的关键词进行匹配,所述关键词包括匹配关键词和否定关键词,其中,所述否定关键词通过上述否定关键词的获取方法得出;搜索结果输出模块,用于若所述搜索查询词按照预设匹配方式与某网页信息的匹配关键词匹配,且不包含所述否定关键词,则将该网页信息作为搜索结果输出。与现有技术相比,本申请具有以下优点:本申请通过记录广告页面的访问行为数据,提取访问行为数据中触发各广告的查询词带来的收益数据,然后依据所述收益数据,以及广告帐户中记录的费用数据、点击率,将费用数据高且收益数据小,以及点击率低且收益数据小的查询词作为广告的否定关键词,有利于降低广告成本,提高广告收益,从而使得选取的否定关键词更为精确,减少漏选错选的概率。由于目前主流电子商务平台中,搜索引擎带来的流量在平台总流量中占有很大的比例,本申请对选取否定关键词的优化,可以为广告主引入更优质的流量。附图说明图1是本申请的一种否定关键词的获取方法实施例的流程图;图2是本申请的一种搜索方法实施例的流程图;图3是本申请的一种否定关本文档来自技高网
...
一种否定关键词的获取方法及装置和搜索方法及装置

【技术保护点】
一种否定关键词的获取方法,其特征在于,包括:记录依据在页面的访问行为生成的访问行为数据,并在所述访问行为数据中提取访客访问的网页信息,以及各网页信息所对应的一个或多个查询词和各查询词对应的第一特征数据;在预置数据库中提取所述查询词对应的第二特征数据和点击率;将满足下述任一条件的查询词提取为否定关键词:条件1、第二特征数据大于第三预设阀值且第三特征收益数据小于第二预设阀值的查询词;条件2、点击率小于第一预设阀值且第三特征收益数据小于第二预设阀值的查询词;其中,所述第三特征数据等于第一特征数据,或为第一特征数据与第二特征数据的比值。

【技术特征摘要】
1.一种否定关键词的获取方法,其特征在于,包括:记录依据在页面的访问行为生成的访问行为数据,并在所述访问行为数据中提取访客访问的网页信息,以及各网页信息所对应的一个或多个查询词和各查询词对应的第一特征数据,所述第一特征数据为收益数据;在预置数据库中提取记录的多个网页信息、各网页信息对应的一个或多个查询词,以及各查询词对应的第二特征数据和点击率,将网页信息、查询词和第一特征收益数据的对应关系,与预置数据库中提取的查询词、第二特征数据和点击率的对应关系进行匹配,得到各网页信息对应的一个或多个查询词,以及各查询词对应的第一特征数据,第二特征数据和点击率,所述第二特征数据为费用数据;将满足下述任一条件的查询词提取为否定关键词:条件1、第二特征数据大于第三预设阀值且第三特征收益数据小于第二预设阀值的查询词;条件2、点击率小于第一预设阀值且第三特征收益数据小于第二预设阀值的查询词;其中,所述第三特征数据等于第一特征数据,或为第一特征数据与第二特征数据的比值。2.如权利要求1所述的方法,其特征在于,所述在访问行为数据中提取访问的网页信息,以及各网页信息对应的一个或多个查询词和各查询词对应的第一特征数据的步骤包括:在访问行为数据中提取访问的网页信息,以及各网页信息所对应的搜索查询词和第一特征数据;对所述搜索查询词进行归一化处理,得到各网页信息对应的一个或多个查询词,以及各查询词对应的第一特征数据。3.如权利要求1所述的方法,其特征在于,所述网页信息为广告,所述第一特征数据为收益数据,所述第二特征数据为费用数据。4.如权利要求1所述的方法,其特征在于,所述第一特征数据包括点击收益数据、登录量、订单量、展现量和交易量中的一种或几种。5.如权利要求2所述的方法,其特征在于,所述搜索查询词位于,所述访问行为数据的http头信息的referer字段中。6.如权利要求1所述的方法,其特征在于,所述预置数据库为广告账户。7.如权利要求6所述的方法,其特征在于,所述广告账户通过以下步骤记录各网页信息对应的查询词,以及各查询词对应的第二特征数据和点击率:由访客输入的搜索查询词,搜索关键词与之匹配的网页信息并进行展示;记录访客点击的网页信息、当前搜索查询词、第二特征数据,以及展示的广告网页信息;针对各网页信...

【专利技术属性】
技术研发人员:郭雷孟晓楠
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1