一种搜索方法及装置制造方法及图纸

技术编号:7809466 阅读:191 留言:0更新日期:2012-09-27 08:36
本发明专利技术提供了一种搜索方法及装置,所述方法包括:对用户输入的搜索数据进行预处理;从预处理后的搜索数据中提取预设的数据结构,包括:核心查询三元组、析取关联查询三元组、合取关联查询三元组、条件关联查询三元组、否定条件关联查询三元组、条件关联候选词集合、否定条件候选关联词集合;将预设的数据结构映射为本体三元组;依据本体三元组,从预设的数据库中搜索与搜索数据相关的解答数据,并将解答数据提供给用户。所述方法搜索的依据为预设的本体三元组而非自然语言的关键字,搜索的范围为预设的数据库而非互联网,最终提供给用户的为解答数据,而非网页的列表,从而不需要用户进一步进行有用数据的甄选,所以,提高了搜索结果的准确性。

【技术实现步骤摘要】

本专利技术涉及计算机领域,尤其涉及一种搜素方法及装置。
技术介绍
互联网的迅猛发展和广泛普及,使得网络成为获得信息的重要来源,从互联网获取信息的有效手段之ー即是通过搜 索引擎进行关键字的捜索。现有的搜索引擎根据用户输入的关键字,从互联网中找出与关键字相关联的网页,经过排序后呈现给用户。可见,现有的搜索引擎最终向用户提供的只是网页的列表,通常情况下,这些网页中还可能包含ー些对用户无用的内容,例如广告等,用户要需要依次查询列出的网页,才能从中甄选出有用的信息,因而,现有的搜索引擎存在捜索结果定位不准确的问题。
技术实现思路
有鉴于此,本专利技术提供了一种搜索方法及装置,目的在于解决现有的搜索引擎搜索结果定位不准确的问题。为了实现上述目的,本专利技术实施例提供了以下技术方案一种搜索方法,包括对用户输入的捜索数据进行预处理;从预处理后的捜索数据中提取预设的数据结构,所述预设的数据结构包括核心查询三元组、析取关联查询三元组、合取关联查询三元组、条件关联查询三元组、否定条件关联查询三元组、条件关联候选词集合、否定条件候选关联词集合;将所述预设的数据结构映射为本体三元组;依据所述本体三元组,从预设的数据库中捜索与所述搜索数据相关的解答数据,并将所述解答数据提供给用户。优选地,所述对用户输入的捜索数据进行预处理包括接收用户输入的搜索数据;去除所述搜索数据中的冗余数据。优选地,从预处理后的捜索数据中提取预设的数据结构包括将所述预处理后的捜索数据按照预设的数据类型进行分类,以确定所述预处理后的捜索数据所属的数据类型;依据所述预处理后的捜索数据所属的数据类型,提取所述预处理后的捜索数据的核心查询三元组;依据所述核心查询三元组,获取所述预处理后的捜索数据的析取关联查询三元组、合取关联查询三元组、条件关联查询三元组、否定条件关联查询三元组、条件关联候选词集合、否定条件候选关联词集合。优选地,所述预设的数据类型包括特指问句、正反问句、是非问句和选择问句;所述特指问句包括有疑问代词的特指问句,有疑问动词的特指问句,以及无疑问词的特指问句。优选地,所述将所述预设的数据结构映射为本体三元组包括将核心查询三元组映射为核心本体三元组;将合取关联查询三元组映射为合取关联本体三元组;将析取关联查询三元组映射为析取关联本体三元组;将条件关联查询三元组映射为条件关联本体三元组;将否定条件关联查询三元组映射为否定条件关联本体三元组;将条件和否定条件关联候选词映射为条件或否定条件关联本体三元组。 优选地,所述依据所述本体三元组,从预设的数据库中捜索与所述搜索数据相关的解答数据包括将本体三元组中的核心本体三元组、析取本体三元组及合取本体三元组,中属于类的成分替换为其相应的候选实体;利用条件以及否定条件关联本体三元组,从所述候选实体中过滤其修饰的类对应的候选实体;利用析取关联三元组,从所述候选实体中过滤核心三元组中其修饰的类对应的候选实体;依据所述述候选实体中剩下的实体构建答案。一种搜索装置,包括预处理模块,用于对用户输入的捜索数据进行预处理;数据结构提取模块,用于从预处理后的捜索数据中提取预设的数据结构,所述预设的数据结构包括核心查询三元组、析取关联查询三元组、合取关联查询三元组、条件关联查询三元组、否定条件关联查询三元组、条件关联候选词集合、否定条件候选关联词集合;映射模块,用于将所述预设的数据结构映射为本体三元组;解答模块,用于依据所述本体三元组,从预设的数据库中捜索与所述搜索数据相关的解答数据,并将所述解答数据提供给用户。优选地,所述数据结构预设模块包括分类单元,用于将所述预处理后的捜索数据按照预设的数据类型进行分类,以确定所述预处理后的捜索数据所属的数据类型;核心查询三元组提取単元,用于依据所述预处理后的捜索数据所属的数据类型,提取所述预处理后的捜索数据的核心查询三元组;其它类型三元组获取単元,用于依据所述核心查询三元组,获取所述预处理后的捜索数据的析取关联查询三元组、合取关联查询三元组、条件关联查询三元组、否定条件关联查询三元组、条件关联候选词集合、否定条件候选关联词集合。优选地,所述解答模块包括候选实体生成单元,用于将本体三元组中的核心本体三元组、析取本体三元组及合取本体三元组,中属于类的成分替换为其相应的候选实体;过滤单元,用于利用条件以及否定条件关联本体三元组,从所述候选实体中过滤其修饰的类对应的候选实体;利用析取关联三元组,从所述候选实体中过滤核心三元组中其修饰的类对应的候选实体;构建单元,用于依据所述述候选实体中剩下的实体构建答案。本专利技术实施例提供的捜索方法及装置,对预处理后的捜索数据提取所述的数据结构,并将预设的数据结构映射为本体三元组,依据所述本体三组从预设的数据库中捜索相关的数据作为捜索结果提供给用户,所述搜索方法及装置捜索的依据为预设的本体三元组而非自然语言的关键字,捜索的范围为预设的数据库而非互联网,最終提供给用户的为解答数据,而非网页的列表,从而不需要用户进ー步进行有用数据的甄选,所以,提高了捜索结果的准确性。 附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图I为本专利技术实施例公开的ー种搜索方法的流程图;图2为本专利技术实施例公开的从预处理后的捜索数据中提取预设的数据结构的方法的流程图;图3为本专利技术实施例公开的ー种搜索装置的结构示意图;图4为本专利技术实施例公开的ー种搜索装置中数据结构预设模块的结构示意图;图5为本专利技术实施例公开的ー种搜索装置中解答模块的结构示意图。具体实施例方式本专利技术实施例公开了ー种搜索方法及装置,目的在于解决现有的捜索方法或捜索引擎存在的捜索结果定位不准确的问题,其核心专利技术点在于,对用户输入的捜索数据进行预处理;从预处理后的捜索数据中提取预设的数据结构,所述预设的数据结构包括核心查询三元组、析取关联查询三元组、合取关联查询三元组、条件关联查询三元组、否定条件关联查询三元组、条件关联候选词集合、否定条件候选关联词集合;将所述预设的数据结构映射为本体三元组;依据所述本体三元组,从预设的数据库中捜索与所述搜索数据相关的解答数据,并将所述解答数据提供给用户。下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例公开的ー种搜索方法,用于对用户输入的捜索数据搜索相关解答数据,如图I所示,包括SlOl :对用户输入的捜索数据进行预处理;预处理通常是指对原始数据进行的初步处理,本实施例中,预处理过程可以包括接收用户输入的搜索数据,去除所述搜索数据中的冗余数据。例如,用户输入“北京烤鸭怎么做? ”的捜索数据,其中除了包括文字外,还包括标点符号“ ? ”,而“?”对于搜索“北京烤鸭怎么做”的解答数据是无用的,属于冗余数据,因此,本实施中预处理过程要将其去掉。S102 :从预处理后的捜索数据中提取预设的数本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种搜索方法,其特征在于,包括 对用户输入的捜索数据进行预处理; 从预处理后的捜索数据中提取预设的数据结构,所述预设的数据结构包括核心查询三元组、析取关联查询三元组、合取关联查询三元组、条件关联查询三元组、否定条件关联查询三元组、条件关联候选词集合、否定条件候选关联词集合; 将所述预设的数据结构映射为本体三元组; 依据所述本体三元组,从预设的数据库中搜索与所述搜索数据相关的解答数据,并将所述解答数据提供给用户。2.根据权利要求I所述的方法,其特征在于,所述对用户输入的捜索数据进行预处理包括 接收用户输入的捜索数据; 去除所述搜索数据中的冗余数据。3.根据权利要求I所述的方法,其特征在于,从预处理后的捜索数据中提取预设的数据结构包括 将所述预处理后的捜索数据按照预设的数据类型进行分类,以确定所述预处理后的搜索数据所属的数据类型; 依据所述预处理后的捜索数据所属的数据类型,提取所述预处理后的捜索数据的核心查询三元组; 依据所述核心查询三元组,获取所述预处理后的捜索数据的析取关联查询三元组、合取关联查询三元组、条件关联查询三元组、否定条件关联查询三元组、条件关联候选词集合、否定条件候选关联词集合。4.根据权利要求3所述的方法,其特征在于,所述预设的数据类型包括 特指问句、正反问句、是非问句和选择问句; 所述特指问句包括有疑问代词的特指问句,有疑问动词的特指问句,以及无疑问词的特指问句。5.根据权利要求I所述的方法,其特征在于,所述将所述预设的数据结构映射为本体三元组包括 将核心查询三元组映射为核心本体三元组; 将合取关联查询三元组映射为合取关联本体三元组; 将析取关联查询三元组映射为析取关联本体三元组;将条件关联查询三元组映射为条件关联本体三元组; 将否定条件关联查询三元组映射为否定条件关联本体三元组; 将条件和否定条件关联候选词映射为条件或否定条件关联本体三元组。6.根据权利要求I所述的方法,其特征在于,所述依据所述本体三元组,从预设的数据库中搜索与所述搜索数据相关的解答数据...

【专利技术属性】
技术研发人员:朱明尹文科孙永录
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1