一种用于对搜索结果进行处理的方法和装置制造方法及图纸

技术编号:9060722 阅读:124 留言:0更新日期:2013-08-21 23:50
本发明专利技术的目的在于提供一种用于对搜索结果进行处理的方法和装置。根据本发明专利技术的方法包括:获取所述搜索结果中的多个结果地址;对所述多个结果地址分别执行多种单项聚合操作,以获得分别与所述多个结果地址相对应的多种单项聚合结果,其中,每种单项聚合操作包括基于所述结果地址对应的一种相关信息项、对所述多个结果地址执行的聚合操作;对所获得的多个单项聚合结果执行综合聚合操作。本发明专利技术的优点在于:能够有效地去除搜索结果中来自多个不同数据来源的重复资源,从而在保证搜索结果全面性的前提下,减少搜索结果的冗余,提升用户体验。

【技术实现步骤摘要】
一种用于对搜索结果进行处理的方法和装置
本专利技术涉及计算机
,尤其涉及一种用于对搜索结果进行处理的方法和装置。
技术介绍
随着搜索技术的发展,为了适应用户不同的搜索需求以及应对用户终端的多样化趋势,会通过不同的途径来获取多种资源,例如,从专门适用于移动终端的网页数据库获得的搜索结果以及专门用于为用户提供网页应用程序的资源数据库中的搜索结果将会同时提供给用户,从而使得在用户终端所获得的搜索结果中,存在不同数据来源之间的资源重复问题。从而使得用户终端所获得的搜索结果看似获得了较多结果,实际上可能包含了大量的重复内容,影响了用户获取多样化信息的效率,降低了用户的体验。
技术实现思路
本专利技术的目的在于提供一种用于对搜索结果进行处理的方法和装置。根据本专利技术的一个方面,提供一种用于对搜索结果进行处理的方法,其中,所述方法包括以下步骤:a获取所述搜索结果中的多个结果地址;b对所述多个结果地址分别执行多种单项聚合操作,以获得分别与所述多个结果地址相对应的多种单项聚合结果,其中,每种单项聚合操作包括基于所述结果地址对应的一种相关信息项、对所述多个结果地址执行的聚合操作;c对所获得的多个单项聚合结果执行综合聚合操作。根据本专利技术的一个方面,提供一种用于对搜索结果进行处理的搜索处理装置,其中,所述搜索处理装置包括:第一获取装置,用于获取所述搜索结果中的多个结果地址;单项聚合装置,用于对所述多个结果地址分别执行多种单项聚合操作,以获得分别与所述多个结果地址相对应的多种单项聚合结果,其中,每种单项聚合操作包括基于所述结果地址对应的一种相关信息项、对所述多个结果地址执行的聚合操作;综合聚合装置,用于对所获得的多个单项聚合结果执行综合聚合操作。根据本专利技术的方案,能够有效地去除搜索结果中来自多个不同数据来源的重复资源,从而在保证搜索结果全面性的前提下,减少搜索结果的冗余,提升用户体验。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1为根据本专利技术的一个方面的用于对搜索结果进行处理的方法流程图;图2为根据本专利技术的一个方面的用于对搜索结果进行处理的搜索处理装置的结构示意图。附图中相同或相似的附图标记代表相同或相似的部件。具体实施方式下面结合附图对本专利技术作进一步详细描述。图1示意出了根据本专利技术的一个方面的用于对搜索结果进行处理的方法流程图。根据本专利技术的方法包括步骤S1、步骤S2和步骤S3。其中,所述搜索结果包括至少一个结果地址信息。优选地,所述搜索结果包含来自多个数据来源的结果地址。更优选地,所述搜索结果中包含一般搜索结果,以及特殊搜索结果,其中,所述一般搜索结果包括在一般数据库中执行搜索获得的一般结果地址;所述特殊搜索结果包括在一个或多个特殊数据库中执行搜索获得的特殊结果地址。其中,所述特殊数据库基于特定用户需求或基于特定用户设备而建立。例如,为适应移动终端而建立的、包含适合在移动终端上展现的WAP网页的WAP网页数据库;又例如,将所获得的一般搜索结果作为数据库,并根据用户需求相关信息在该一般搜索结果中执行搜索优化,以获得精确搜索结果。其中,所述用户需求相关信息包括但不限于以下任一项:1)用户历史搜索信息;2)用户地域相关信息;3)用户属性信息,例如性别、年龄、职业等。其中,根据本专利技术的方法通过可联网的计算机设备实现。所述计算机设备包括一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。其中,所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。需要说明的是,所述计算机设备以及网络仅为举例,其他现有的或今后可能出现的计算机设备以及网络如可适用于本专利技术,也应包含在本专利技术保护范围以内,并以引用方式包含于此。参照图1,在步骤S1中,计算机设备获取所述搜索结果中的一个或多个结果地址。具体地,所述计算机设备根据预定获取规则,获取搜索结果中的一个或多个结果地址。其中,所述结果地址包括用于定位网页的链接地址信息,优选地,所述结果地址包括同一资源定位符(URL,UniversalResourceLocation)。其中,所述预定获取规则包括但不限于以下任一项:1)按照搜索结果中的结果地址的排序来预定个数的结果地址;例如,预定每次获取排名前N的结果地址,其中,本领域技术人员可根据实际情况和需求来确定N的数值。2)根据搜索结果的呈现方式,获取一个搜索结果网页上呈现的多个结果地址。例如,搜索结果页中每页展示20个结果地址,则计算机设备获取20个结果地址。3)随机获取预定个数的结果地址等。接着,在步骤S2中,计算机设备对所述多个结果地址分别执行多种单项聚合操作,以获得分别与所述多个结果地址相对应的多种单项聚合结果。其中,每种单项聚合操作包括基于所述结果地址对应的一种相关信息项、对所述多个结果地址执行的聚合操作。其中,每种单项聚合结果包括对多个结果地址执行每种单项聚合操作后所获得的一个或多个结果地址。其中,所述相关信息项包括但不限于以下任一种:1)与所述结果地址对应的网页的网页地址信息。优选地,所述网页地址信息包括同一资源定位符(URL,UniversalResourcesLocation)。优选地,所述网页地址信息包括但不限于以下任一种:i)当结果地址所对应的网站接收到来自移动设备的、基于所述结果地址发起的访问请求时,根据该移动设备的设备相关信息进行适配后所反馈的地址信息;ii)在互联网中对所述结果地址进行重定向后所获得的地址信息;iii)与所述结果地址对应的网址别名信息等。其中,所述移动设备包括但不限于何一种可与用户通过键盘、鼠标、遥控器、触摸板、或声控设备等方式进行人机交互的手持式电子产品。优选地,所述移动设备包括但不限于平板电脑、智能手机、PDA、游戏机等。其中,所述设备相关信息包括但不限于以下任一项信息:i)移动设备型号;例如,NokiaN90、iPhone4s,又例如,iPad2、iPadmini等。ii)移动设备所采用的操作系统;例如,iOS、Android等。iii)移动设备发起访问请求所采用的浏览器;例如,safari,Opera,百度浏览器等。2)与所述结果地址所对应的网页的网页内容信息;例如,所述结果地址对应的网页中所包含的文本内容信息等。3)与所述结果地址对应的域名信息。例如,结果地址中所包含的域名等。具体地,所述计算机设备对所述多个结果地址分别执行多种单项聚合操作,以获得分别与所述多个结果地址相对应的多种单项聚合结果的方式包括但不限于以下任一种:1)同时执行多种单项聚合操作,以分别获得各种单项聚合操作的单项聚合结果。例如,基于结果地址所对应的网页地址信息,分别对该多个结果地址执行一种单项聚合操作,以获得第一种单项聚合结果,同时,还基于结果地址的域名信息执行另一种单项聚合操作,以获得第二种单项聚合结果。2)依次执行多种单项聚合操作,以分别获得各种单项聚合操作的单项聚合结果。例如,先基于网页地址信息执行第一种单项聚合操作,获得第一种单项聚合结果后,接着基于网页内容信息执行单项聚合操作,并在获得第二种单本文档来自技高网...
一种用于对搜索结果进行处理的方法和装置

【技术保护点】
一种用于对搜索结果进行处理的方法,其中,所述方法包括以下步骤:a获取所述搜索结果中的多个结果地址;b对所述多个结果地址分别执行多种单项聚合操作,以获得分别与所述多个结果地址相对应的多种单项聚合结果,其中,每种单项聚合操作包括基于所述结果地址对应的一种相关信息项、对所述多个结果地址执行的聚合操作;c对所获得的多个单项聚合结果执行综合聚合操作。

【技术特征摘要】
1.一种用于对搜索结果进行处理的方法,其中,所述方法包括以下步骤:a获取所述搜索结果中的多个结果地址,其中,所述结果地址包括用于定位网页的链接地址信息;b对所述多个结果地址分别执行多种单项聚合操作,以获得分别与所述多个结果地址相对应的多种单项聚合结果,其中,每种单项聚合操作包括基于所述结果地址对应的一种相关信息项、对所述多个结果地址执行的聚合操作;c对所获得的多个单项聚合结果执行综合聚合操作;其中,所述方法还包括以下步骤:-分别获取所述单项聚合结果中各个结果地址所对应的单项评估信息;其中,所述步骤c包括以下步骤:-对所获得的多种单项聚合结果分别包含的一项或多项结果地址,根据各项结果地址所对应的单项评估信息,执行综合聚合操作;其中,所述综合聚合操作的结果包括多组结果地址,各组结果地址中的各个结果地址彼此相似,其中,所述方法还包括以下步骤:-基于所述综合聚合操作的结果,对所述搜索结果的去重操作。2.根据权利要求1所述的方法,其中,所述搜索结果中包含一般搜索结果,以及特殊搜索结果,其中,所述一般搜索结果包括在一般数据库中执行搜索获得的一般结果地址;所述特殊搜索结果包括在特殊数据库中执行搜索获得的特殊结果地址。3.根据权利要求1或2所述的方法,其中,所述每种单项聚合结果包括基于所述结果地址对应的一种相关信息项、对所述多个结果地址执行聚合操作后的一个或多个结果地址,其中,与该种单项聚合结果对应的单项聚合操作包括以下步骤:b1根据所述多个结果地址,获取与各个结果地址所对应的该种相关信息项;b2根据各个结果地址所对应的所述该种相关信息项,来比较各个结果地址对应的该种相关信息项是否相似,以根据所获得的比较结果来确定对应的单项聚合结果。4.根据权利要求3所述的方法,其中,所述步骤b2包括以下步骤:b21对各个结果地址,判断该结果地址对应的相关信息项与其他各个结果地址对应的相关信息项是否相似,并相关信息项相似的结果地址划入同一组,以获得一组或多组结果地址;b22根据所述一组或多组结果地址,确定单项聚合结果。5.根据权利要求4所述的方法,其中,所述步骤b22包括以下步骤:-由每组结果地址中选择一个或多个结果地址,作为该组结果地址的代表地址;-将所述一组或多组结果地址的所有代表地址作为所述单项聚合结果。6.根据权利要求1所述的方法,其中,所述单项评估信息包括以下任一项:-等级信息;-评分信息。7.根据权利要求1所述的方法,其中,所述相关信息项包括以下任一种:-与所述结果地址对应的网页的网页地址信息;-与所述结果地址所对应的网页的网页内容信息;-与所述结果地址对应的域名信息。8.一种用于对搜索结果进行处理的搜索处理装置,其中,所述搜索处理装置包括:第一获取装置,用...

【专利技术属性】
技术研发人员:刘伟田丰
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1