搜索结果的处理方法和装置制造方法及图纸

技术编号:12144312 阅读:85 留言:0更新日期:2015-10-03 01:43
本发明专利技术公开了一种搜索结果的处理方法和装置。其中,该方法包括:获取多个搜索结果,检索结果由检索系统依据检索式检索得出;对每个搜索结果进行聚合校验处理,得到每个搜索结果的聚类校验结果;比较每个搜索结果的聚类校验结果,若聚类校验结果之间的区别小于预定阈值,则将聚类校验结果之间的区别小于预定阈值的任意至少两个搜索结果进行聚类,得到聚类结果集合,聚类结果集合与检索式对应;将聚类结果集合中的至少一个搜索结果输出至前端进行显示。本发明专利技术解决了现有技术提供的搜索方法获取到的搜索结果重复率高,导致搜索结果不准确的技术问题。

【技术实现步骤摘要】

本专利技术涉及计算机互联网领域,具体而言,涉及一种搜索结果的处理方法和装置
技术介绍
随着大数据时代的来临,如何在海量数据中获取用户需要的信息已经成为热门的研究课题,现有技术的搜索引擎可以为用户提供搜索功能,使得用户在前端客户端输入搜索式之后,就可以从大量数据中筛选得到满足用户搜索需求的数据,即用户在搜索输入框中输入搜索式之后,搜索引擎就可以根据该搜索式查询得到对应的搜索结果给前段客户端,并显示在前段客户端中。上述搜索引擎提供的功能满足了为用户过滤无效信息的需求,但由于现有互联网中存在的数据量过大,数据来源也较多,因此搜索结果中存在大量实际内容重复的资源,导致用户查阅搜索结果效率低的问题。例如,以互联网提供的音乐资源为例,随着互联网音乐产业的飞速发展,用户通过互联网来搜索及点播音乐的需求越来越大,因此互联网上提供的音乐资源也是海量的。需要说明的是,针对音乐制作的现况,经常出现同一首歌收录在唱片公司发行多张的专辑中,因此,互联网可以针对一首音乐提供至少两个搜索结果,当用户进行歌曲搜索的时候,就出现了重复的歌曲内容,而且会同时全部展现。这种现有的展现全部歌曲的方式导致了用户仍旧面对的是大量数据,仍旧无法快速高效的获取最优的搜索结果给用户,对用户并非最佳体验。针对上述现有技术提供的搜索方法获取到的搜索结果重复率高,导致搜索结果不准确的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种搜索结果的处理方法和装置,以至少解决现有技术提供的搜索方法获取到的搜索结果重复率高,导致搜索结果不准确的技术问题。根据本专利技术实施例的一个方面,提供了一种搜索结果的处理方法,该方法包括:获取多个搜索结果,检索结果由检索系统依据检索式检索得出;对每个多个搜索结果进行聚合校验处理,得到每个搜索结果的聚类校验结果;比较每个搜索结果的聚类校验结果,若聚类校验结果之间的区别小于预定阈值,则将聚类校验结果之间的区别小于预定阈值的任意至少两个搜索结果进行聚类,得到聚类结果集合,聚类结果集合与检索式对应;将聚类结果集合中的至少一个搜索结果输出至前端进行显示。根据本专利技术实施例的另一方面,还提供了一种搜索结果的处理装置,该装置包括:获取模块,用于获取多个搜索结果,检索结果由检索系统依据检索式检索得出;聚合校验模块,用于对每个多个搜索结果进行聚合校验处理,得到每个搜索结果的聚类校验结果;聚类处理模块,用于比较每个搜索结果的聚类校验结果,若聚类校验结果之间的区别小于预定阈值,则将聚类校验结果之间的区别小于预定阈值的任意至少两个搜索结果进行聚类,得到聚类结果集合,聚类结果集合与检索式对应;输出模块,用于将聚类结果集合中的至少一个搜索结果输出至前端进行显示。在本专利技术实施例中,采用获取多个搜索结果,检索结果由检索系统依据检索式检索得出;对每个多个搜索结果进行聚合校验处理,得到每个搜索结果的聚类校验结果;t匕较每个搜索结果的聚类校验结果,若聚类校验结果之间的区别小于预定阈值,则将聚类校验结果之间的区别小于预定阈值的任意至少两个搜索结果进行聚类,得到聚类结果集合,聚类结果集合与检索式对应;将聚类结果集合中的至少一个搜索结果输出至前端进行显示的方式,通过对搜索式对应的多个搜索结果进行统一的聚合校验处理,使得每个搜索结果具备进行聚类的基础,聚合校验处理得到的聚类校验结果可以表征每个搜索结果进行后续聚类的聚类对象,在将聚类校验结果相同的搜索结果进行聚类之后,就可以得到聚类结果集合,由于该聚类结果集合将所有的搜索结果进行了归类划分,因此,在提取搜索式对应的聚类结果集合中的一个搜索结果进行显示之后,提供给前端客户端显示的搜索结果就不是所有搜索结果,而是去除了具备重复属性的搜索结果,从而解决了现有技术提供的搜索方法获取到的搜索结果重复率高,导致搜索结果不准确的技术问题,提升了用户获取信息的效率。为用户提供了优化后的搜索体验。【附图说明】此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是本专利技术实施例的一种运行搜索结果的处理方法的计算机终端的硬件结构框图;图2是根据本专利技术实施例一的搜索结果的处理方法的流程图;图3是根据本专利技术实施例一的以互联网提供的音乐资源为例的搜索结果的处理方法的详细流程图;图4是根据本专利技术实施例二的搜索结果的处理装置的结构示意图;图5是根据本专利技术实施例二的一种可选的搜索结果的处理装置的结构示意图;图6是根据本专利技术实施例二的一种可选的搜索结果的处理装置的结构示意图;图7是根据本专利技术实施例二的一种可选的搜索结果的处理装置的结构示意图;图8是根据本专利技术实施例二的一种可选的搜索结果的处理装置的结构示意图;图9是根据本专利技术实施例二的一种可选的搜索结果的处理装置的结构示意图;图10是根据本专利技术实施例二的一种可选的搜索结果的处理装置的结构示意图;图11是根据本专利技术实施例二的一种可选的搜索结果的处理装置的结构示意图;以及图12是根据本专利技术实施例的一种移动终端的结构框图。【具体实施方式】为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。下面对本申请涉及到的名词进行解释:歌曲元数据:指歌曲名、歌手名、专辑名等歌曲描述信息。md5算法:Message Digest Algorithm MD5 (中文名为消息摘要算法第五版)为计算机安全领域广泛使用的一种散列函数,用以提供消息的完整性保护。该算法的文件号为 RFC 1321(R.Rivest, MIT Laboratory for Computer Science and RSA Data SecurityInc.April 1992)。音频指纹技术:音频指纹技术(Aud1 fingerprinting technology)是一种通用音频处理技术。它能根据旋律准确识别歌名、歌手、专辑名等信息。识别后的歌曲无论在音乐播放软件中,还是在MP3播放器中都会显示正确信息。应用这项技术可以为每一首歌曲编制音频特征码,从而实现歌曲的精确匹配和识别。搜索功能:通过关键字查询信息的技术。实施例1本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图1是本专利技术实施例的一种运行搜索结果的处理方法的计算本文档来自技高网
...

【技术保护点】
一种搜索结果的处理方法,其特征在于,包括:获取多个搜索结果,所述检索结果由检索系统依据检索式检索得出;对每个搜索结果进行聚合校验处理,得到每个搜索结果的聚类校验结果;比较所述每个搜索结果的聚类校验结果,若所述聚类校验结果之间的区别小于预定阈值,则将所述聚类校验结果之间的区别小于预定阈值的任意至少两个搜索结果进行聚类,得到聚类结果集合,所述聚类结果集合与所述检索式对应;将所述聚类结果集合中的至少一个搜索结果输出至前端进行显示。

【技术特征摘要】

【专利技术属性】
技术研发人员:汤道生梁柱傅鸿城
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1