【技术实现步骤摘要】
一种关键词权重确定方法、装置以及计算设备
本专利技术涉及互联网搜索
,特别涉及一种用于查询改写的关键词权重确定方法、装置以及计算设备。
技术介绍
查询改写(QueryRewrite,QR)是指,将用户输入的搜索词改写为一个或多个与该搜索词相似的关键词,然后,搜索引擎根据改写得到的关键词进行搜索。现在很多的机器学习方法(例如深度语义模型等)可以改写出几十或者几百个相似的关键词,受性能影响,只能选择少数几个词作为最终的改写结果。例如,在电商搜索广告场景下,广告主在电商平台为自己的广告产品购买关键词,又可称为竞价词(bid-word),由电商平台建立竞价词的倒排索引。当用户搜索的关键词(搜索词)与竞价词完全匹配时,可通过查找倒排索引进行广告产品的召回。但是,广告主并不清楚哪些搜索词可以给他带来流量,很多情况下其购买的竞价词并不能完全进行触发召回,为此需要通过查询改写的方式将搜索词改写为相似的竞价词,然后按照改写后的竞价词进行广告产品的召回。由于与搜索词相似的竞价词数量较大,为了使广告产品的整体变现效率更高,也 ...
【技术保护点】
1.一种关键词权重确定方法,包括:/n根据搜索日志,确定关键词集合中各关键词的实际搜索次数;/n计算关键词的实际搜索次数和该关键词的设定搜索次数的第一比值;/n根据所述第一比值确定关键词的权重,其中,所述权重与所述第一比值呈负相关。/n
【技术特征摘要】
1.一种关键词权重确定方法,包括:
根据搜索日志,确定关键词集合中各关键词的实际搜索次数;
计算关键词的实际搜索次数和该关键词的设定搜索次数的第一比值;
根据所述第一比值确定关键词的权重,其中,所述权重与所述第一比值呈负相关。
2.如权利要求1所述的方法,其中,所述根据所述第一比值确定关键词的权重,包括:
当所述第一比值小于1时,将关键词的权重更新为该关键词在上一周期的权重与所述第一比值之商;
当所述第一比值等于1时,将关键词的权重更新为该关键词在上一周期的权重与关键词的在线时长占比之积,其中,所述在线时长占比为关键词的在线时长与总时长的比值,所述在线时长为关键词的实际搜索次数达到设定搜索次数所对应的时长。
3.如权利要求2所述的方法,其中,当更新得到的权重大于1时,将该权重设置为1。
4.一种竞价词的排序权重生成方法,包括:
根据搜索日志,确定竞价词集合中各竞价词的期望收益和预算使用数据;
根据竞价词的期望收益和预算使用数据,确定竞价词的排序权重,其中,竞价词的排序权重与期望收益呈正相关,与预算使用率呈负相关;
将竞价词和排序权重相关联的存储为竞价词权重表。
5.如权利要求4所述的方法,其中,所述竞价词的期望收益为所有广告主在该竞价词上的消耗金额总和,与分配给该竞价词所关联的广告产品的流量数目,二者的比值。
6.如权利要求4或5所述的方法,其中,所述根据竞价词的期望收益和预算使用数据,确定竞价词的排序权重,包括:
为每个竞价词维系一个第一系数;
根据竞价词的预算使用数据确定竞价词的预算使用率和在线时长占比,所述预算使用率为所有广告主在该竞价词上的消耗金额总和与预算金额总和的比值,所述在线时长占比为所有广告主在该竞价词上的在线时长总和与总时长的比值,所述在线时长为广告主在该竞价词上的预算金额消耗完毕所对应的时长;
当竞价词的在线时长占比小于1时,将竞价词的第一系数更新为该竞价词在上一周期的第一系数与所述在线时长占比之积;
当竞价词的预算使用率小于1时,将竞价词的第一系数更新为该竞价词在上一周期的第一系数与所述预算使用率之商;
将竞价词的排序权重确定为该竞价词的期望收益与第一系数之积。
7.如权利要求5所...
【专利技术属性】
技术研发人员:陈晓伟,刘华晖,张红春,孟晓楠,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。