搜索方法及系统技术方案

技术编号:7898151 阅读:139 留言:0更新日期:2012-10-23 04:20
本发明专利技术涉及一种搜索方法及系统。该搜索方法包括以下步骤:获取用户输入的查询字符;对所述查询字符进行分类处理,得到查询字符的分类类别;根据所述查询字符及所属的分类类别进行检索,得到检索结果。上述搜索方法及系统,通过对用户输入的查询字符进行分类,再根据查询字符及分类类别进行检索,得到的检索结果更加准确的满足用户搜索需求,方便用户选择需要的检索结果,给用户的操作带来便利。

【技术实现步骤摘要】
搜索方法及系统
本专利技术涉及搜索领域,特别涉及一种搜索方法及系统。
技术介绍
随着互联网技术的发展,互联网越来越普及。用户从互联网获取数据的需求越来越强。互联网数据(如视频、新闻等)分享和观看站点越来越多,总的数据量相当庞大。搜索引擎的作用是帮助用户从海量的数据中查询满足需求的数据,为用户提供更好的数据推荐展现。传统的搜索仅根据关键字的匹配进行检索,检索得到的结果数量很多,不方便用户快速从中选择需要的数据,给用户操作带来不便。
技术实现思路
基于此,有必要提供一种搜索方法,方便用户选择需要的检索结果,给用户的操作带来便利。一种搜索方法,包括以下步骤:获取用户输入的查询字符;对所述查询字符进行分类处理,得到查询字符的分类类别;根据所述分类类别进行检索,得到检索结果。优选地,所述对查询字符进行分类处理,得到查询字符的分类类别的步骤具体包括:对信息站点进行数据内容抓取,提取分类关键词;从所述查询字符中提取查询关键词;将所述查询关键词与所述分类关键词进行匹配,得到所述查询关键词的分类类别。优选地,还包括步骤:对所述检索结果进行去重及排序处理;展现所述去重及排序处理后的检索结果。优选地,在对所述检索结果进行去重及排序处理的步骤之前还包括:获取各个检索结果的点击次数;将检索结果的点击次数与预定阈值比较,若大于所述预定阈值,则对所述检索结果的点击次数进行修正,若小于等于所述预定阈值,则保留所述检索结果的点击次数。优选地,所述对检索结果进行去重及排序处理的步骤具体包括:根据检索结果的网址、标题名称及信息完整度,从多个重复的检索结果中筛选出信息完整度最高的一个检索结果;根据点击次数权重对经过去重处理的检索结果进行排序。优选地,当搜索视频时,所述对检索结果进行去重及排序处理的步骤具体为:计算检索得到的视频的来源地址指纹,记为第一指纹;计算检索得到的视频缩略图的内容指纹,记为第二指纹;对检索得到的视频的标题字符串进行去噪处理,将去噪后的标题字符串和第二指纹进行计算得到第三指纹;根据第三指纹对检索得到的视频进行去重处理,删除重复的视频;对去重后具有相同第一指纹和/或第二指纹的视频根据点击次数权重、时长权重及视频标题与查询字符匹配权重进行排序。优选地,在所述对检索结果进行去重及排序处理的步骤之后还包括:将视频的缩略图转换为灰度图,根据灰度图的灰度值分析得出视频的缩略图的质量;根据视频的缩略图质量从高到低对视频进行排序。此外,还有必要提供一种搜索系统,方便用户选择需要的检索结果,给用户的操作带来便利。一种搜索系统,包括:信息获取模块,用于获取用户输入的查询字符;分类模块,用于对所述查询字符进行分类处理,得到所述查询字符的分类类别;检索模块,用于根据所述查询字符及所属的分类类别进行检索,得到检索结果。优选地,所述信息获取模块还用于对信息站点进行数据内容抓取,所述分类模块还用于从抓取的数据内容中提取分类关键词;所述分类模块还用于从所述查询字符中提取查询关键词,将查询关键词与分类关键词进行匹配,得到所述查询关键词的分类类别。优选地,还包括:处理模块,用于对所述检索结果进行去重及排序处理;展示模块,用于展现所述去重及排序处理后的检索结果。优选地,还包括统计分析模块,所述统计分析模块用于获取各个检索结果的点击次数,将检索结果的点击次数与预定阈值比较,若大于所述预定阈值,则对所述检索结果的点击次数进行修正,若小于等于所述预定阈值,则保留所述检索结果的点击次数。优选地,所述处理模块根据检索结果的网址、标题名称及信息完整度,从多个重复的检索结果中筛选出信息完整度最高的一个检索结果,根据点击次数权重对经过去重处理的检索结果进行排序。优选地,当搜索视频时,所述处理模块还用于计算检索得到的视频的来源地址指纹,记为第一指纹,计算检索得到的视频缩略图的内容指纹,记为第二指纹,对检索得到的视频的标题字符串进行去噪处理,将去噪后的标题字符串和第二指纹进行计算得到第三指纹,根据第三指纹对检索得到的视频进行去重处理,删除重复的视频,对去重后具有相同第一指纹和/或第二指纹的视频根据点击次数权重、时长权重及视频标题与查询字符匹配权重进行排序。优选地,还包括缩略图模块,所述缩略图模块用于对视频的缩略图转换为灰度图,根据灰度图的灰度值分析得出视频的缩略图的质量,所述处理模块根据视频的缩略图质量从高到低对视频进行排序。上述搜索方法及系统,通过对用户输入的查询字符进行分类,再根据查询字符及所属的分类类别进行检索,得到的检索结果更加准确的满足用户搜索需求,方便用户选择需要的检索结果,给用户的操作带来便利。【附图说明】图1为一个实施例中搜索方法的流程图;图2为图1中查询字符进行分类处理,得到查询字符的分类类别的具体流程图;图3为另一个实施例中搜索方法的流程图;图4为一个实施例中搜索系统的结构示意图;图5为另一个实施例中搜索系统的结构示意图。【具体实施方式】下面结合具体的实施例及附图对技术方案进行详细的描述。如图1所示,在一个实施例中,一种搜索方法,包括以下步骤:步骤S100,获取用户输入的查询字符。用户通过键盘、触摸屏等输入查询字符,如输入“建国大业”。步骤S110,对查询字符进行分类处理,得到查询字符的分类类别。如图2所示,将查询字符进行分类处理,得到查询字符的分类类别的具体步骤为:步骤S210,对信息站点进行数据内容抓取,提取分类关键词。抓取信息站点的数据内容进行简单的分类,从数据内容中提取各分类关键词,建立分类关键词表。如数据内容为视频,对视频进行分类,可分为电影、电视剧、综艺、动漫等类别,电影类别提取分类关键词如“冰河世纪”。综艺类别提取分类关键词如“天天向上”。另外,如数据内容为新闻数据,对新闻数据进行分类,如体育、娱乐、财经等。步骤S220,从查询字符中提取查询关键词。查询字符可包含一些多余字符,如“未来警察电影”,进行过滤处理,得到查询关键词“未来警察”。步骤S230,将查询关键词与分类关键词进行匹配,得到查询关键词的分类类别。将查询关键词与分类关键词表中的分类关键词进行匹配,得出该查询关键词属于哪个分类类别,如将“未来警察”与分类关键词进行匹配,得出属于电影类别。其中,每个分类类别中对应至少一个分类关键词。另外,对于同一数据内容有多个标题名称时,使用同义词映射方式进行分类匹配。如同一部电影,不同的名称,采用同义词映射方式分类。步骤S120,根据查询字符及所属的分类类别进行检索,得到检索结果。从查询字符中提取查询关键词后,根据查询关键词及分类类别进行检索,得到的检索结果大致满足用户的查询需求。在一个实施例中,步骤S120之后,还包括对检索结果进行整合的步骤。以视频检索为例,得到检索视频后,根据分类类别,电影、电视剧、动漫、综艺等,进行整合展现更加丰富的信息,如剧名、导演、主演、年代、地区、电视剧集数、剧情介绍、海报等。在一个实施例中,如图3所示,除了包括步骤S100至步骤S120,还包括:步骤S130,对检索结果进行去重及排序处理。检索结果中可能包含多个重复的数据,且对于同内容的数据,数据的质量差异较大,为了保证页面结果不重复,且用户有选择的余地,删除内容重复的数据,保留其中一个,具体步骤为:根据检索结果的网址、标题名称及信息完整度,从多个重复本文档来自技高网...
搜索方法及系统

【技术保护点】
一种搜索方法,包括以下步骤:获取用户输入的查询字符;对所述查询字符进行分类处理,得到查询字符的分类类别;根据所述查询字符及所属的分类类别进行检索,得到检索结果。

【技术特征摘要】
1.一种搜索方法,包括以下步骤:获取用户输入的查询字符;对所述查询字符进行分类处理,得到查询字符的分类类别,包括:对信息站点进行数据内容抓取,对所述数据内容进行分类,提取分类关键词,所述数据内容包括视频数据;从所述查询字符中提取查询关键词;将所述查询关键词与所述分类关键词进行匹配,得到所述查询关键词的分类类别;根据所述查询字符及所属的分类类别进行检索,得到检索结果;根据所属的分类类别对所述检索结果进行整合。2.根据权利要求1所述的搜索方法,其特征在于,还包括步骤:对所述检索结果进行去重及排序处理;展现所述去重及排序处理后的检索结果。3.根据权利要求2所述的搜索方法,其特征在于,在对所述检索结果进行去重及排序处理的步骤之前还包括:获取各个检索结果的点击次数;将检索结果的点击次数与预定阈值比较,若大于所述预定阈值,则对所述检索结果的点击次数进行修正,若小于等于所述预定阈值,则保留所述检索结果的点击次数。4.根据权利要求2所述的搜索方法,其特征在于,所述对检索结果进行去重及排序处理的步骤具体包括:根据检索结果的网址、标题名称及信息完整度,从多个重复的检索结果中筛选出信息完整度最高的一个检索结果;根据点击次数权重对经过去重处理的检索结果进行排序。5.根据权利要求2所述的搜索方法,其特征在于,当搜索视频时,所述对检索结果进行去重及排序处理的步骤具体为:计算检索得到的视频的来源地址指纹,记为第一指纹;计算检索得到的视频缩略图的内容指纹,记为第二指纹;对检索得到的视频的标题字符串进行去噪处理,将去噪后的标题字符串和第二指纹进行计算得到第三指纹;根据第三指纹对检索得到的视频进行去重处理,删除重复的视频;对去重后具有相同第一指纹和/或第二指纹的视频根据点击次数权重、时长权重及视频标题与查询字符匹配权重进行排序。6.根据权利要求5所述的搜索方法,其特征在于,在所述对检索结果进行去重及排序处理的步骤之后还包括:将视频的缩略图转换为灰度图,根据灰度图的灰度值分析得出视频的缩略图的质量;根据视频的缩略图质量从高到低对视频进行排序。7...

【专利技术属性】
技术研发人员:李翔黄斌强李盛韬
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1