The invention discloses a method and device for retrieving based on relational database. The method comprises the following steps: setting the table Pinyin thesaurus and relational database; the user input searching conditions for error correction using the hot query thesaurus, to get into search keyword; according to the error correction query to get the retrieval keyword, determine the type of the search keyword; from the relational database to obtain word retrieval respectively, get the corresponding Chinese characters target resource list; when determining the type of the keyword is Chinese Pinyin, through the alphabet for the corresponding pinyin target resource list from the relational database.
【技术实现步骤摘要】
一种基于关系型数据库的检索方法及装置
本专利技术涉及计算机
,特别涉及一种基于关系型数据库的检索方法及装置。
技术介绍
在互联网技术飞速发展的今天,互联网公司蓬勃发展,竞争越来与激烈,用户对互联网产品的使用要求越来越高,提高用户体验性逐渐成为互联网产品设计中特别重要的一环。模糊检索功能,可以帮助用户快速准确高效的检索到自己想要的资源,用户可以使用关键字模糊检索,关键词语模糊检索,全拼检索,简拼检索,纠错查询以及混合检索的方式协助用户检索到目标资源。针对用户这一需求,很多大型的检索公司都是依靠大型的检索引擎实现,使用检索引擎可以快速高效的完成这一功能,但是使用引擎的维护需要耗费大量人力和物力。使用检索引擎首先将数据库中的目标数据拆分成单词,转换全拼,转换成简拼,然后将这些数据保生成一个庞大的索引文件,保存到本地磁盘中,该索引文件需要占用很大的磁盘空间。后期数据库中数据发生变化,需要及时的将数据增量更新到索引文件中,而且为保证数据的准确性,通常需要定期对索引文件进行全量更新,这需要消耗很大的人力。因为索引文件只是一个二进制文件,而且没有可视化的管理视图,维护人员很难查询到索引文件的数据状况。所以使用检索引擎检索消耗资源过大,不适用于中小型的软件公司。
技术实现思路
本专利技术的目的在于提供一种基于关系型数据库的检索方法及装置,解决了现有技术中检索引擎检索消耗资源过大的问题。根据本专利技术的一个方面,提供了一种基于关系型数据库的检索方法,包括以下步骤:在所述关系型数据库中设置热词库和拼音表;利用所述热词库对用户输入的检索条件进行纠错查询,以得到用于进行检索的检 ...
【技术保护点】
一种基于关系型数据库的检索方法,其特征在于,包括以下步骤:在所述关系型数据库中设置热词库和拼音表;利用所述热词库对用户输入的检索条件进行纠错查询,以得到用于进行检索的检索关键字或词;根据纠错查询得到的所述检索关键字或词,确定所述检索关键字或词的类型;当确定所述关键字或词的类型是汉字时,通过将所述汉字进行分词处理,从所述关系型数据库中分别对所获取分词进行检索,得到与所述汉字相对应的资源列表;当确定所述关键字或词的类型是汉语拼音时,通过所述拼音表,从所述关系型数据库中获取与所述汉语拼音相对应的目标资源列表。
【技术特征摘要】
1.一种基于关系型数据库的检索方法,其特征在于,包括以下步骤:在所述关系型数据库中设置热词库和拼音表;利用所述热词库对用户输入的检索条件进行纠错查询,以得到用于进行检索的检索关键字或词;根据纠错查询得到的所述检索关键字或词,确定所述检索关键字或词的类型;当确定所述关键字或词的类型是汉字时,通过将所述汉字进行分词处理,从所述关系型数据库中分别对所获取分词进行检索,得到与所述汉字相对应的资源列表;当确定所述关键字或词的类型是汉语拼音时,通过所述拼音表,从所述关系型数据库中获取与所述汉语拼音相对应的目标资源列表。2.根据权利要求1所述的方法,其特征在于,所述的利用所述热词库对用户输入的检索条件进行纠错查询,以得到用于进行检索的检索关键字或词包括:通过对用户输入的检索条件进行检测,确定所述检索条件是否正确;当确定所述检索条件不正确时,在所述热词库中查询与所述检索条件相对应的热词,并将所述热词作为用于进行检索的检索关键字或词。3.根据权利要求1所述的方法,其特征在于,所述的当确定所述关键字或词的类型是汉字时,通过将所述汉字进行分词处理,从所述关系型数据库中分别对所获取分词进行检索,得到与所述汉字相对应的资源列表包括:当确定所述关键字或词的类型是汉字时,利用包含字典文件的IKAnalyzer对所述关键字或词进行分词处理,得到与所述关键字或词相关的多个分词;从所建立的关系型数据库中获取每个分词的检索结果,并将每个分词的检索结果保存在内存中;统计所述每个分词的检索结果在所述内存中的保存次数,并按保存次数由高到低的顺序进行排列,得到与所述汉字相对应的资源列表。4.根据权利要求1所述的方法,其特征在于,所述的拼音表是指汉语拼音与其相对应的汉字之间的关系表;其中,所述汉语拼音包括汉语全拼和汉语简拼。5.根据权利要求4所述的方法,其特征在于,所述的当确定所述关键字或词的类型是汉语拼音时,通过所述拼音表,从所述关系型数据库中获取与所述汉语拼音相对应的目标资源列表包括:当确定所述关键字或词的类型是汉语拼音时,通过所述拼音表查找与所述汉语拼音相对应的汉字;根据所述汉语从所述关系型数据库中获取与所述汉字相对应的目标资源列表。6.根据权利要求1-5任一所述的方法,其...
【专利技术属性】
技术研发人员:谷永辉,
申请(专利权)人:威海捷讯通信技术有限公司,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。