数据库检索方法、装置、系统以及存储介质制造方法及图纸

技术编号:21628181 阅读:26 留言:0更新日期:2019-07-17 10:51
本发明专利技术公开了一种数据库检索方法、装置、系统以及存储介质,该方法包括:当接收到携带有第一检索条件的检索请求时,对第一检索条件进行处理,得到第二检索条件,所述第二检索条件对应的检索结果的数量不少于第一检索条件对应的检索结果的数量;使用第二检索条件进行检索,获得第一检索结果;确定第一检索结果中与所述第一检索条件匹配的第二检索结果。基于本发明专利技术公开的方法,可以先放宽第一检索条件得到第二检索条件,再用第二检索条件进行检索,这就保证符合第一检索条件的文本全部在第一检索结果中,再从中确定与第一检索条件匹配的第二检索结果,保证最终得到的第二检索结果既全面又准确,从而提高检索精确度。

Database retrieval methods, devices, systems and storage media

【技术实现步骤摘要】
数据库检索方法、装置、系统以及存储介质
本专利技术涉及自然语言处理领域,尤其涉及一种数据库检索方法、装置、系统以及存储介质。
技术介绍
分布式数据库,如ElasticSearch数据库,拥有强大的全文索引能力,可接近实时处理全文检索请求。目前,需要在ElasticSearch数据库中精确匹配某一内容时,主要采用分词手段进行ElasticSearch数据库检索:首先对检索条件和ElasticSearch数据库中的文本进行分词,然后再利用检索条件分词结果和文本分词结果进行匹配,从ElasticSearch数据库中查找到符合检索条件的目标文本。但是,由于检索条件分词结果中会重复出现检索条件末尾字符,这就容易出现本来符合检索条件的文本未被检索到的情况,从而导致检索精确度很低。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的数据库检索方法、装置、系统以及存储介质。具体技术方案如下:一种数据库检索方法,包括:当接收到携带有第一检索条件的检索请求时,对所述第一检索条件进行处理,得到第二检索条件,所述第二检索条件对应的检索结果的数量不少于所述第一检索条件对应的检索结果的数量;使用所述第二检索条件进行检索,获得第一检索结果;确定所述第一检索结果中与所述第一检索条件匹配的第二检索结果。优选的,所述对所述第一检索条件进行处理,得到第二检索条件,包括:确定所述第一检索条件中的检索子条件及各检索子条件间的逻辑关系,所述第一检索条件中的检索子条件由检索文本构成或者由逻辑非和检索文本构成;对于至少一个所述检索子条件,确定该检索子条件中的目标子条件;对至少一个所述目标子条件,对该目标子条件进行删减处理,将删减后的目标子条件替换该目标子条件,得到第二检索条件。优选的,对于包含逻辑非的每一个检索子条件,所述确定该检索子条件中的目标子条件,包括:将该包含逻辑非的检索子条件确定为目标子条件;所述对该目标子条件进行删减处理,包括:对该目标子条件的检索文本进行分词,得到至少一个第一检索词;判断所有所述第一检索词是否覆盖该目标子条件的检索文本;若否,删除所述目标子条件。优选的,对于不包含逻辑非的每一个检索子条件,所述确定该检索子条件中的目标子条件,包括:对该不包含逻辑非的检索子条件的检索文本进行分词,得到至少一个第二检索词;判断所述至少一个第二检索词中是否存在末尾字符与所述检索文本末尾字符相同的第二检索词,所述末尾字符与所述检索文本末尾字符相同的第二检索词中包含至少两个字符;若是,将所述末尾字符与所述检索文本末尾字符相同的第二检索词和该检索子条件的检索文本中剩余的各个第二检索词间通过逻辑与关联,构成目标子条件;所述对该目标子条件进行删减处理,包括:将该目标子条件中末尾字符与所述检索文本末尾字符相同的第二检索词的末尾字符删除。优选的,还包括:对删除末尾字符的各个第二检索词进行去重处理。一种数据库检索装置,包括:条件处理模块、检索模块和匹配模块;所述条件处理模块,用于当接收到携带有第一检索条件的检索请求时,对所述第一检索条件进行处理,得到第二检索条件,所述第二检索条件对应的检索结果的数量不少于所述第一检索条件对应的检索结果的数量;所述检索模块,用于使用所述第二检索条件进行检索,获得第一检索结果;所述匹配模块,用于确定所述第一检索结果中与所述第一检索条件匹配的第二检索结果。优选的,所述条件处理模块,具体用于:确定所述第一检索条件中的检索子条件及各检索子条件间的逻辑关系,所述第一检索条件中的检索子条件由检索文本构成或者由逻辑非和检索文本构成;对于至少一个所述检索子条件,确定该检索子条件中的目标子条件;对至少一个所述目标子条件,对该目标子条件进行删减处理,将删减后的目标子条件替换该目标子条件,得到第二检索条件。优选的,对于包含逻辑非的每一个检索子条件,所述条件处理模块,具体用于:将该包含逻辑非的检索子条件确定为目标子条件;对该目标子条件的检索文本进行分词,得到至少一个第一检索词;判断所有所述第一检索词是否覆盖该目标子条件的检索文本;若否,删除所述目标子条件。一种数据库检索系统,包括:存储器,用于存储程序;处理器,用于执行所述程序,所述程序运行时执行上述技术方案中任意一项所述的数据库检索方法。一种存储介质,其特征在于,其上存储有程序,所述程序被处理器执行时实现如权利要求上述技术方案中任意一项所述的数据库检索方法。借由上述技术方案,本专利技术提供的数据库检索方法、装置、系统以及存储介质,可以放宽检索条件中的第一检索条件,得到第二检索条件;然后使用第二检索条件在数据库中进行检索,得到第一检索结果;最后,从第一检索结果中确定与第一检索条件相匹配的第二检索结果。由于本专利技术可以先放宽第一检索条件得到第二检索条件,再用第二检索条件进行检索,这就保证符合第一检索条件的文本全部在第一检索结果中,再从中确定与第一检索条件匹配的第二检索结果,保证最终得到的第二检索结果既全面又准确,从而提高检索精确度。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了数据库检索方法的方法流程图;图2示出了数据库检索方法的部分方法流程图;图3示出了数据库检索方法的又一部分方法流程图;图4示出了数据库检索方法的再一部分方法流程图;图5示出了数据库检索装置的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。如图1所示,本专利技术实施例提供一种数据库检索方法,可以包括如下步骤:S10,当接收到携带有第一检索条件的检索请求时,对第一检索条件进行处理,得到第二检索条件,所述第二检索条件对应的检索结果的数量不少于第一检索条件对应的检索结果的数量;在执行步骤S10的过程中,第一检索条件是由检索子条件以及各检索子条件间的逻辑关系构成的,目前逻辑关系分为与逻辑和或逻辑两种,而检索子条件由检索文本或者逻辑非和检索文本构成;在对第一检索条件进行处理的过程中,可分别对每一个检索子条件依次进行处理,再组合处理后的各个检索子条件,从而得到检索结果的数量不小于第一检索条件的第二检索条件。在具体实现过程中,步骤S10中“对第一检索条件进行处理,得到第二检索条件”可以具体采用以下步骤,方法流程图如图2所示:S101,确定第一检索条件中的检索子条件及各检索子条件间的逻辑关系,所述第一检索条件中的检索子条件由检索文本构成或者由逻辑非和检索文本构成;在执行步骤S101的过程中,由于在分词的过程中,会自动去掉检索文本中所包含的标点符号,因此,采用包含有逻辑非的检索子条件来检索时,会出现文本漏检的情况。本文档来自技高网...

【技术保护点】
1.一种数据库检索方法,其特征在于,包括:当接收到携带有第一检索条件的检索请求时,对所述第一检索条件进行处理,得到第二检索条件,所述第二检索条件对应的检索结果的数量不少于所述第一检索条件对应的检索结果的数量;使用所述第二检索条件进行检索,获得第一检索结果;确定所述第一检索结果中与所述第一检索条件匹配的第二检索结果。

【技术特征摘要】
1.一种数据库检索方法,其特征在于,包括:当接收到携带有第一检索条件的检索请求时,对所述第一检索条件进行处理,得到第二检索条件,所述第二检索条件对应的检索结果的数量不少于所述第一检索条件对应的检索结果的数量;使用所述第二检索条件进行检索,获得第一检索结果;确定所述第一检索结果中与所述第一检索条件匹配的第二检索结果。2.根据权利要求1所述的方法,其特征在于,所述对所述第一检索条件进行处理,得到第二检索条件,包括:确定所述第一检索条件中的检索子条件及各检索子条件间的逻辑关系,所述第一检索条件中的检索子条件由检索文本构成或者由逻辑非和检索文本构成;对于至少一个所述检索子条件,确定该检索子条件中的目标子条件;对至少一个所述目标子条件,对该目标子条件进行删减处理,将删减后的目标子条件替换该目标子条件,得到第二检索条件。3.根据权利要求2所述的方法,其特征在于,对于包含逻辑非的每一个检索子条件,所述确定该检索子条件中的目标子条件,包括:将该包含逻辑非的检索子条件确定为目标子条件;所述对该目标子条件进行删减处理,包括:对该目标子条件的检索文本进行分词,得到至少一个第一检索词;判断所有所述第一检索词是否覆盖该目标子条件的检索文本;若否,删除所述目标子条件。4.根据权利要求2所述的方法,其特征在于,对于不包含逻辑非的每一个检索子条件,所述确定该检索子条件中的目标子条件,包括:对该不包含逻辑非的检索子条件的检索文本进行分词,得到至少一个第二检索词;判断所述至少一个第二检索词中是否存在末尾字符与所述检索文本末尾字符相同的第二检索词,所述末尾字符与所述检索文本末尾字符相同的第二检索词中包含至少两个字符;若是,将所述末尾字符与所述检索文本末尾字符相同的第二检索词和该检索子条件的检索文本中剩余的各个第二检索词间通过逻辑与关联,构成目标子条件;所述对...

【专利技术属性】
技术研发人员:王清华
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1