The invention provides a search control method and system. The method comprises: acquiring user quality labels corresponding to the user request, the user quality label is used according to the user history; and at least based on the quality of the user label given with user request corresponding to the search results. As a result, the corresponding level of search results can be returned according to the quality grade of the user. In addition, the search service level for some or all of the users can also be adjusted according to the current traffic of the search system.
【技术实现步骤摘要】
搜索控制方法和系统
本专利技术涉及网络技术,尤其涉及一种搜索控制方法和系统。
技术介绍
搜索服务方需要夜以继日地为网络用户提供各种各类的搜索服务。搜索后台是一个复杂的系统,每一次查询都会涉及到数百个节点的服务,耗费大量的机器资源。为了保证提供优质的搜索服务,搜索服务方需要识别爬虫,将其剔除搜索系统以保护优质资源。在传统的搜索系统中,爬虫识别功能单一,通常是统计IP或者用户ID等信息的访问频率等。如果访问频率高于某个阈值则返回一个输入验证码的页面,只有当用户输入了正确的验证码时才能继续正常的访问服务。这样的策略过于简单,没有针对搜索业务的场景进行优化,也没有针对不同级别的用户提供有针对性的服务内容,并且频繁返回验证码页面会导致用户的体验下降。
技术实现思路
鉴于如上至少一个问题,本专利技术提出了一种新的搜索控制方案。该控制方案能够基于用户的使用历史对正常用户进行分级,并且能够在日常搜索场景中根据需要对不同级别的用户返回不同的搜索结果内容。在系统发生灾难时,能够有选择地保障高优用户的搜索体验。另外,本专利技术的搜索控制方案优化了各类服务器、存储器和运营维护之间的关系,从而提升了搜索系统抗风险和防爬取的能力。根据本专利技术的一个方面,提出了一种搜索控制方法,包括:获取与用户请求相对应的用户质量标签,所述用户质量标签是根据用户使用历史得到的;以及至少基于所述用户质量标签给出与所述用户请求相对应的搜索结果。这样,能够根据一个用户的使用历史对该用户进行标记,并且根据该标记决定要返回给该用户的搜索结果。优选地,用户质量标签可以是对离线日志中用户的历史使用记录进行行为特征分析 ...
【技术保护点】
一种搜索控制方法,包括:获取与用户请求相对应的用户质量标签,所述用户质量标签是根据用户使用历史得到的;以及至少基于所述用户质量标签给出与所述用户请求相对应的搜索结果。
【技术特征摘要】
1.一种搜索控制方法,包括:获取与用户请求相对应的用户质量标签,所述用户质量标签是根据用户使用历史得到的;以及至少基于所述用户质量标签给出与所述用户请求相对应的搜索结果。2.如权利要求1所述的方法,其中,所述用户质量标签是对离线日志中用户的历史使用记录进行行为特征分析得到的标签。3.如权利要求1所述的方法,其中,所述用户质量标签是根据用户使用历史对用户进行分级的标签,并且至少基于所述用户质量标签给出与所述用户请求相对应的搜索结果包括:给出与所述用户请求相对应的、具有与所述用户质量标签相匹配的质量级别的搜索结果。4.如权利要求1所述的方法,其中,所述搜索结果包括具有不同质量级别的搜索结果,所述具有不同质量级别的搜索结果包括惩罚性搜索结果,所述惩罚性搜索结果包括要求输入验证码或是拒绝搜索。5.如权利要求4所述的方法,还包括:根据所述用户请求确定如下的至少一项:所述用户位于白名单中,和发出所述用户请求的应用不属于搜索控制目标,以及基于如上确定的至少一项,避免对所述用户请求给出惩罚性搜索结果。6.如权利要求4所述的方法,还包括:根据所述用户请求确定如下的至少一项:所述用户请求包括爬虫标记,所述用户位于黑名单中,和所述用户未通过正常用户验证,以及基于如上确定的至少一项,对所述用户请求给出惩罚性搜索结果。7.如权利要求1所述的方法,其中,基于所述用户质量标签和实时集群搜索状态给出与所述用户请求相对应的搜索结果。8.如权利要求7所述的方法,其中,在所述实时集群搜索状态指示搜索服务故障或拥塞时,优先保证针对所述用户质量标签指示的高级别用户给出的搜索结果的质量等级。9.如权利要求1所述的方法,其中,基于所述用户质量标签以及与所述用户请求相关的预定周期内的搜索频率给出与所述用户请求相对应的搜索结果,并且与所述用户请求相关的预定周期内的搜索频率包括如下的至少一项:所述用户的IP或cookie在预定周期内的搜索频率;送入所述用户请求的上层站点在预定周期内的搜...
【专利技术属性】
技术研发人员:丁亦川,张强,张添翼,
申请(专利权)人:广东神马搜索科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。