搜索方法及搜索引擎技术

技术编号:6054049 阅读:246 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种搜索方法,包括以下步骤:S1、接收查询指令;S2、基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图;S3、将带有需求意图的所述查询指令在数据库中搜索,得到搜索结果;S4、输出所述搜索结果。与现有技术相比,本发明专利技术的有益效果是:在知识库的基础上,更好的理解用户输入的查询指令,分析查询指令的以图,解析查询指令的结构,对查询指令进行语义内容扩充,从而更好的指导搜索引擎选择优质的资源满足用户的搜索需求,使得用户搜索效率提高,节约网络流量。

Search method and search engine

The present invention provides a search method, which comprises the following steps: S1, receiving the inquiry instruction; S2, the knowledge base of the inquiry instruction needs intention based on the analysis of the inquiry instruction needs clear intention; S3, with the intention of the query instruction needs to search the database, search results, S4; the output of the search results. Compared with the existing technology, the beneficial effect of the invention is: Based on the knowledge base, query the user input to better understand instructions, instructions to analyze the query, query parsing instructions to query command structure, semantic content expansion, so as to better guide the search engine to choose high-quality resources to meet the user's search needs. Allows the user to search efficiency, saving network traffic.

【技术实现步骤摘要】

本专利技术涉及搜索引擎技术,尤其涉及一种基于知识库对查询指令进行需求分析与 解析的搜索方法及搜索引擎
技术介绍
随着互联网上信息的飞速增长,网络上充斥了越来越多的冗余信息,而对于在网 络上搜寻自己所需要信息的互联网用户而言,面对这些漫无边际的信息无疑像大海捞针。 搜索引擎的出现无疑在一定程度上为用户的搜索需求带来了很大便利。搜索引擎是一种在 网络上应用的软件系统,其以一定的策略在网络上搜集和发现信息,并在对信息进行处理 和组织后,为用户提供互联网上的信息搜索服务。通常,这种软件系统提供一个网页界面, 让用户在客户端通过浏览器软件提交搜索词,然后很快返回一个可能和用户输入的搜索内 容相关的信息列表。这个列表通常会包括上万个条目,每个条目代表一篇搜索到的相关网 页。过去十几年以来,相应地,众多的互联网搜索引擎及对应的网站应运而生,这中 间的佼佼者包括百度公司的百度搜索(WWW. baidu. com)和谷歌公司的谷歌搜索(www. google, cn)。现有的搜索引擎对用户输入的查询指令大多是基于查询指令字符理解的,例 如,用户输入查询指令为“Nokia手机”,基于现有的搜索引擎只能将该查询指令分词为 “Nokia”和“手机”,且通过该分词结果在网页数据库索引中进行检索,将文本包括“Nokia” 和“手机”的网页Url输入,形成搜索结果,然而这种搜索引擎并不能对用户的查询指令进 行内容与语义层次上的理解,例如,用户输入查询指令为“Nokia手机”,其并不能将这个查 询指令理解为“Nokia”为“手机”中的一种品牌;当然,更不能理解查询指令的需求意图,以 及查询指令的结构,不能对查询指令进行语义内容扩充等。对于用户输入的表达形式多样 化、需求意图多样化的查询指令,现有的基于字符的搜索引擎已经不能更好的满足用户的 需求,造成用于查找不全,需要多次输入不同的查询指令才可能找到需要的搜索结果,搜索 效率较低,浪费网络资源的问题。
技术实现思路
本专利技术的目的在于提供一种改进的搜索方法,其可在知识库的基础上,更好的理 解用户输入的查询指令,分析查询指令的以图,解析查询指令的结构,对查询指令进行语义 内容扩充。本专利技术的目的还在于提供一种实现上述搜索方法的改进的搜索引擎。为实现上述专利技术目的之一,本专利技术第一实施方式提供一种搜索方法,包括以下步 骤Si、接收查询指令;S2、基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图;S3、将带有需求意图的所述查询指令在数据库中搜索,得到搜索结果;S4、输出所述搜索结果。作为本专利技术的进一步改进,所述数据库为网页存储库或与所述需求意图相对应的 垂直搜索数据库。作为本专利技术的进一步改进,在所述S2步骤和S3步骤间,还包括语义扩充步骤基于所述知识库对所述查询指令进行语义扩充。作为本专利技术的进一步改进,所述“基于知识库对所述查询指令进行需求意图分析, 明确所述查询指令的需求意图”具体包括以下流程S200、通过用户历史行为库给知识库中的各个知识片段的各个需求意图打分,使 各个知识片段都具有相应的需求意图得分;S201、将所述查询指令与知识片段匹配,得到与所述查询指令相匹配的至少一个 知识片段;S202、将与所述查询指令相匹配的知识片段的需求意图得分加总,得到第一分 数;S203、通过与所述查询指令相匹配的知识片段在所述知识库中的从属关系,加减 所述第一分数,得到知识库整体需求得分;S204、判断所述知识库整体需求得分是否大于一设定阈值;S205、若大于所述设定阈值,则以所述知识库整体需求得分最高的需求类型作为 所述查询指令的需求意图;S206、若小于所述设定阈值,则判断所述查询指令无明显需求意图。作为本专利技术的进一步改进,所述“基于知识库对所述查询指令进行需求意图分析, 明确所述查询指令的需求意图”具体包括以下流程S200、通过用户历史行为库给知识库中的各个知识片段的各个需求意图打分,使 各个知识片段都具有相应的需求意图得分;S201、将所述查询指令与知识片段和表达模板匹配,得到与所述查询指令相匹配 的至少一个知识片段和一表达模板;S202、将与所述查询指令相匹配的知识片段的需求意图得分加总,得到第一分 数;S203、通过与所述查询指令相匹配的知识片段在所述知识库中的从属关系,加减 所述第一分数,得到知识库整体需求得分;S204、对所述查询指令在表达模板层面上进行打分,得到表达模板得分;S205、将知识库整体需求得分与表达模板得分的加权之和作为查询指令需求强度 得分;S206、判断所述查询指令需求强度得分是否大于一设定阈值;S207、若大于所述设定阈值,则以查询指令需求强度得分最高的需求类型作为所 述查询指令的需求意图;S208、若小于所述设定阈值,则判断所述查询指令无明显需求意图。为实现上述专利技术目的之一,本专利技术第二实施方式提供一种搜索方法,包括以下步骤Si、接收查询指令;S2、基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意 图,同时,基于所述知识库对所述查询指令进行语义扩充;S3、将带有需求意图并扩充语义的查询指令在数据库中搜索,得到搜索结果;S4、输出所述搜索结果。作为本专利技术的进一步改进,所述数据库为网页存储库或与所述需求意图相对应的 垂直搜索数据库。作为本专利技术的进一步改进,所述“基于知识库对所述查询指令进行需求意图分析, 明确所述查询指令的需求意图”具体包括以下流程S200、通过用户历史行为库给知识库中的各个知识片段的各个需求意图打分,使 各个知识片段都具有相应的需求意图得分;S201、将所述查询指令与知识片段匹配,得到与所述查询指令相匹配的至少一个 知识片段;S202、将与所述查询指令相匹配的知识片段的需求意图得分加总,得到第一分 数;S203、通过与所述查询指令相匹配的知识片段在所述知识库中的从属关系,加减 所述第一分数,得到知识库整体需求得分;S204、判断所述知识库整体需求得分是否大于一设定阈值;S205、若大于所述设定阈值,则以所述知识库整体需求得分最高的需求类型作为 所述查询指令的需求意图;S206、若小于所述设定阈值,则判断所述查询指令无明显需求意图。作为本专利技术的进一步改进,所述“基于知识库对所述查询指令进行需求意图分析, 明确所述查询指令的需求意图”具体包括以下流程S200、通过用户历史行为库给知识库中的各个知识片段的各个需求意图打分,使 各个知识片段都具有相应的需求意图得分;S201、将所述查询指令与知识片段和表达模板匹配,得到与所述查询指令相匹配 的至少一个知识片段和一表达模板;S202、将与所述查询指令相匹配的知识片段的需求意图得分加总,得到第一分 数;S203、通过与所述查询指令相匹配的知识片段在所述知识库中的从属关系,加减 所述第一分数,得到知识库整体需求得分;S204、对所述查询指令在表达模板层面上进行打分,得到表达模板得分;S205、将知识库整体需求得分与表达模板得分的加权之和作为查询指令需求强度 得分;S206、判断所述查询指令需求强度得分是否大于一设定阈值;S207、若大于所述设定阈值,则以查询指令需求强度得分最高的需求类型作为所 述查询指令的需求意图;S208、若小于所述设定阈值,则判断所述查询指令无明显需求意本文档来自技高网
...

【技术保护点】
一种搜索方法,其特征在于,所述搜索方法包括以下步骤:S1、接收查询指令;S2、基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图;S3、将带有需求意图的所述查询指令在数据库中搜索,得到搜索结果;S4、输出所述搜索结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘建柱
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1