一种搜索方法和装置制造方法及图纸

技术编号:7286947 阅读:162 留言:0更新日期:2012-04-21 14:35
本发明专利技术提供了一种搜索方法和装置,所述方法包括:接收查询信息,所述查询信息包括至少一个查询关键词;在预设知识库中确定与所述查询信息相关的第一扩展信息,所述预设知识库包括不同的扩展信息;依据所述查询信息和第一扩展信息调用第三方搜索引擎进行搜索;获取并输出所述搜索结果;确定所述搜索结果中与所述查询信息和第一扩展信息相关的第一匹配信息,作为扩展信息加入所述预设知识库中。通过本发明专利技术实施例可以提高搜索效率,且使得搜索结果更精确。

【技术实现步骤摘要】

本专利技术涉及计算机应用
,更具体的说是涉及一种搜索方法和装置
技术介绍
随着互联网信息技术的发展,互联网中可提供给用户的信息越来越庞大,各种搜索引擎应运而生,用户通过输入查询词进行检索,搜索引擎即可从索引数据库中匹配该查询词的搜索信息并输出。但是由于互联网中充斥着大量信息,搜索引擎输出的搜索信息大多类目繁杂,分类不明确,用户通常需要自己从输出的大量搜索信息中进行筛选,查找需要的信息内容,特别是在用户希望查询某一领域的信息内容时,由于搜索引擎输出的信息无明确分类,用户需要从搜索结果中逐一筛选,或者增加查询词汇反复搜索,因此需要耗费大量时间,从而导致搜索效率较低。
技术实现思路
有鉴于此,本专利技术提供了一种搜索方法和装置,用以解决现有的搜索方法导致搜索效率较低的技术问题。为实现上述目的,本专利技术提供如下技术方案一种搜索方法,该方法包括接收查询信息,所述查询信息包括至少一个查询关键词;在预设知识库中确定与所述查询信息相关的第一扩展信息,所述预设知识库包括不同的扩展信息;依据所述查询信息和第一扩展信息调用第三方搜索引擎进行搜索;获取并输出所述搜索结果;确定所述搜索结果中与所述查询信息和第一扩展信息相关的第一匹配信息,作为扩展信息加入所述预设知识库中。优选地,所述确定与所述查询信息相关的第一扩展信息包括计算查询信息与所述不同扩展信息的相关度值;确定相关度值大于第一阈值的扩展信息作为第一扩展信息。优选地,所述确定所述搜索结果中与所述查询信息和第一扩展信息相关的第一匹配信息包括提取所述搜索结果中的搜索词;分别计算搜索词与查询信息和第一扩展信息的相关度值;确定相关度值大于第二阈值的搜索词作为第一匹配信息。优选地,所述获取并输出所述搜索结果包括获取网络爬虫抓取的搜索结果,所述搜索结果为所述网络爬虫从抓取的初步搜索结果中确定与所述查询信息和第一扩展信息相关的第三匹配信息后,从所述初步搜索结果中确定的包含该第二匹配信息的搜索结果;将所述搜索结果输出。优选地,所述分别计算搜索词与查询信息和第一扩展信息的相关度值包括统计相同的搜索词在所述搜索结果中的出现次数;按照出现次数的多少,计算搜索词分别与查询信息和第一扩展信息的相关度值。优选地,所述查询信息还包括类目信息,则所述在预设知识库中确定与所述查询信息相关的第一扩展信息具体为在对应所述类目信息的预设知识库中确定与所述查询信息相关的第一扩展信息。优选地,所述确定所述搜索结果中与所述查询信息和第一扩展信息相关的第一匹配信息具体为确定用户所选择的目标搜索结果中与所述查询信息和第一扩展信息相关的第一匹配信息。一种搜索装置,该装置包括接收模块,用于接收用户的查询信息,所述查询信息包括至少一个关键词;扩展模块,用于在预设知识库中确定与所述查询信息相关的第一扩展信息,所述预设知识库包括不同的扩展信息;搜索模块,用于依据所述查询信息和相关信息调用第三方搜索引擎进行搜索;获取模块,用于获取并输出所述搜索结果;确定模块,用于确定所述搜索结果中与所述查询信息和第一扩展信息相关的第一匹配信息,作为扩展信息加入所述预设知识库中。优选地,所述扩展模块包括第一计算模块,用于计算查询信息与所述不同扩展信息的相关度值;扩展子模块,用于确定相关度值大于第一阈值的扩展信息作为第一扩展信息。优选地,所述确定模块包括提取模块,用于提取所述搜索结果中的搜索词;第二计算模块,用于分别计算搜索词与查询信息和第一扩展信息的相关度值;确定子模块,用于确定相关度值大于第二阈值的搜索词作为第一匹配信息。经由上述的技术方案可知,与现有技术相比,本专利技术提供了一种搜索方法和装置, 通过接收查询信息,在预设知识库中确定与查询信息相关的第一扩展信息,并根据该查询信息和第一扩展信息再调用第三方搜索引擎进行搜索,然后获取所述搜索结果并输出,由于通过增加预设知识库对查询信息进行了扩展,且预设知识库包括根据每一搜索结果提取出的第一匹配信息,因此对查询信息进行的扩展是符合用户意图的,使得输出的搜索结果更精确,也就减少了搜索操作,提高了搜索效率。而由于提高了搜索效率,使得用户无需反复查找或者重复搜索,因此也就减小的系统的运算量,进而提高了系统性能。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术一种搜索方法实施例1的流程图;图2为本专利技术一种搜索方法实施例2的流程图;图3为本专利技术一种搜索装置实施例1的结构示意图;图4为本专利技术一种搜索方法实施例2的结构示意图。具体实施例方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术的主要思想之一可以包括接收查询信息,并在预设知识库中确定与查询信息相关的第一扩展信息,然后根据该查询信息和第一扩展信息调用第三方搜索引擎进行搜索,获取所述搜索结果并输出,由于对查询信息进行了扩展,且预设知识库包括根据每一次搜索结果提取出的第一匹配信息,因此对查询信息进行的扩展是符合用户意图的,使得输出的搜索结果更精确,也就减少了搜索操作,提高了搜索效率。而由于提高了搜索效率, 使得用户无需反复查找或者重复搜索,因此也就减小的系统的运算量,进而提高了系统性能。参见图1,示出了本专利技术一种搜索方法实施例1的流程图,该方法可以包括步骤101 接收查询信息,所述查询信息包括至少一个关键词。所述查询信息可以包括用户通过操作界面输入的查询信息,其可以包括一个或者多个查询关键词。步骤102 在预设知识库中确定与所述查询信息相关的第一扩展信息,所述预设知识库包括不同的扩展信息。所述预设知识库是指对应某一类型,或者某一领域的知识库,例如关于旅游的知识库,关于体彩的知识库等,关于电子技术的知识库。其包括不同的扩展信息,可以是指词汇和/或多个词汇形成的词汇集。系统预设的知识库可以包括多个,对应不同类型或者不同领域。因此所述的查询信息还包括类目信息,每一类目对应一个知识库,则可以根据该类目信息查找到对应的知识库,并在该知识库中查找匹配的扩展信息,即得到第一扩展信息。查询信息包括至少一个关键词,而扩展信息可以是指词汇或者由多个词汇形成的词汇集,确定与查询信息相关的第一扩展信息,可以是通过计算不同扩展信息与查询信息的相关度值,并将相关度值大于第一阈值的扩展信息作为第一扩展信息。计算扩展信息与查询信息的相关度值可以采用多种方式,例如一种方式可以采用语义网技术赋值,例如查询信息只包括一个关键词,扩展信息为扩展词汇,则利用语义网络为关键词与扩展词汇赋予语义相关度值。语义网技术通常可以是指利用知网等知识源提供的分类体系,来计算词语之间的语义相关度值。所述知网是指以词语所代表概念为描述对象,揭示概念与概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库。例如查询信息为“医生”,则通过语义网赋值可以确定“医院” “患者”与“本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:曾相宗
申请(专利权)人:广东威创视讯科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术