一种信息管理方法、信息管理系统及电子设备技术方案

技术编号:18894752 阅读:21 留言:0更新日期:2018-09-08 11:04
本申请公开了一种信息管理方法及系统,其中,该信息管理方法包括:获取待存储文件的结构化文本信息及非结构化文本信息;将所述结构化文本信息加入关系数据库中,将所述非结构化文本信息加入搜索引擎的索引中;当接收到输入的查询请求时,获取查询请求所携带的查询文本信息;基于预设的分解方案将所述查询文本信息分解为第一关键词、第二关键词及第三关键词,其中,第一关键词用于进行模糊查询,第二关键词用于进行精确查询,第三关键词用于同时进行模糊查询及精确查询;分别根据所述第一关键词、第二关键词及第三关键词在所述关系数据库和/或搜索引擎的索引中进行查询;返回查询的结果。本申请方案可以提高对非结构化数据的处理效率。

Information management method, information management system and electronic equipment

The application discloses an information management method and system, in which the information management method includes: obtaining structured text information and unstructured text information of a file to be stored; adding the structured text information to a relational database; adding the unstructured text information to the index of a search engine; and docking. When the inputted query request is received, the query text information carried by the query request is obtained; the query text information is decomposed into the first key word, the second key word and the third key word based on the preset decomposition scheme, in which the first key word is used for fuzzy query and the second key word is used for accurate query. Three keywords are used for both fuzzy and precise queries; queries are performed in the index of the relational database and/or search engine according to the first, second and third keywords respectively; and the results of the query are returned. This application scheme can improve the processing efficiency of unstructured data.

【技术实现步骤摘要】
一种信息管理方法、信息管理系统及电子设备
本申请属于信息
,尤其涉及一种信息管理方法、信息管理系统、电子设备及计算机可读存储介质。
技术介绍
信息管理系统一般均具备增加、删除、更新、查询相关信息等常用功能。通常来说,信息管理系统采用关系数据库作为后台信息的存储,以便于快速、可靠地处理用户的信息管理请求。然而,关系数据库虽然能够对结构化数据进行快速及可靠地处理,但在面对非结构化数据时,模糊查询仍存在着处理效率低下等问题。由于在实际应用中,信息管理系统通常被应用来处理包括结构化数据及非结构化数据在内的各种数据,这将导致信息管理系统无法满足用户的使用需求。
技术实现思路
有鉴于此,本申请提供了一种信息管理方法、信息管理系统、电子设备及计算机可读存储介质,可提高对非结构化数据的处理效率。本申请的第一方面提供了一种信息管理方法,上述信息管理方法包括:获取待存储文件的结构化文本信息及非结构化文本信息;将上述结构化文本信息加入关系数据库中,将上述非结构化文本信息加入搜索引擎的索引中;当接收到输入的查询请求时,获取上述查询请求所携带的查询文本信息;基于预设的分解方案将上述查询文本信息分解为第一关键词、第二关键词及第三关键词,其中,上述第一关键词用于进行模糊查询,上述第二关键词用于进行精确查询,上述第三关键词用于同时进行模糊查询及精确查询;分别根据上述第一关键词、第二关键词及第三关键词在上述关系数据库和/或上述搜索引擎的索引中进行查询;返回查询的结果。本申请的第二方面提供了一种信息管理系统,上述信息管理系统包括:第一获取模块,用于获取待存储文件的结构化文本信息及非结构化文本信息;加入模块,用于将上述结构化文本信息加入关系数据库中,将上述非结构化文本信息加入搜索引擎的索引中;第二获取模块,用于当接收到输入的查询请求时,获取上述查询请求所携带的查询文本信息;分解模块,用于基于预设的分解方案将上述查询文本信息分解为第一关键词、第二关键词及第三关键词,其中,上述第一关键词用于进行模糊查询,上述第二关键词用于进行精确查询,上述第三关键词用于同时进行模糊查询及精确查询;查询模块,用于分别根据上述第一关键词、第二关键词及第三关键词在上述关系数据库和/或上述搜索引擎的索引中进行查询;返回模块,用于返回查询的结果。本申请的第三方面提供了一种电子设备,上述电子设备包括存储器、处理器以及存储在上述存储器中并可在上述处理器上运行的计算机程序,上述处理器执行上述计算机程序时实现如上第一方面的方法的步骤。本申请的第四方面提供了一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现如上第一方面的方法的步骤。由上可见,通过本申请方案,在处理待存储文件时,首先获取待存储文件的结构化文本信息及非结构化文本信息,然后将上述结构化文本信息加入关系数据库中,将上述非结构化文本信息加入搜索引擎的索引中;在已存储的文件中进行查询时,若接收到输入的查询请求,则获取上述查询请求所携带的查询文本信息,并基于预设的分解方案将上述查询文本信息分解为第一关键词、第二关键词及第三关键词,其中,上述第一关键词用于进行模糊查询,上述第二关键词用于进行精确查询,上述第三关键词用于同时进行模糊查询及精确查询,然后分别根据上述第一关键词、第二关键词及第三关键词在上述关系数据库和/或上述搜索引擎的索引中进行查询,最终返回查询的结果。虽然关系数据库能够对结构化文本信息进行模糊查询,但其对非结构化文本信息进行模糊查询的效率非常低下,因而,本申请方案将关系数据库及搜索引擎松散耦合在一起,将待存储文件的数据进行分布式存储,并在需要查询时通过关系数据库进行精确查询,通过搜索引擎进行模糊查询。搜索引擎在面对非结构化文本信息时能够执行“快速的全文检索”式功能,弥补了关系数据库对非结构化信息进行模糊查询或基于关系数据库进行全文检索效率较低的缺陷,使得查询文本包括非结构化文本信息时,能够提升查询的速度及效率。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例提供的第一种信息管理方法的实现流程示意图;图2是本申请实施例提供的第二种信息管理方法的实现流程示意图;图3是本申请实施例提供的第三种信息管理方法的实现流程示意图;图4是本申请实施例提供的信息管理系统的结构示意图;图5是本申请实施例提供的电子设备的示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。为了说明本申请上述的技术方案,下面通过具体实施例来进行说明。实施例一下面对本申请实施例提供的一种信息管理方法进行描述,请参阅图1,本申请实施例中的信息管理方法包括:在步骤101中,获取待存储文件的结构化文本信息及非结构化文本信息;在本申请实施例中,当存在有待存储文件时,可以首先获取上述待存储文件的结构化文本信息及非结构化文本信息。其中,上述结构化信息中包括结构化数据,指的是能够用统一的结构加以表示的数据,包括但不限于数字及符号。例如,传统的关系数据模型及行数据等可存储于关系数据库中,用二维表结构表示;上述非结构化文本信息包括非结构化数据,指的是字段长短可变,且每个字段的记录又可以由可重复或不可重复的子字段构成的数据,包括但不限于各类办公电子文档,例如MicrosoftOffice生成的Word文档、PowerPoint文档、Excel文档、Access文档、Visio文档、Adobe生成的PDF文档及金山办公软件生成的WPS文档等。可选地,还可以获取上述待存储文档的半结构化文本信息,上述半结构化文本信息包括半结构化数据,其指的是介于结构化数据及非结构化数据之间的数据,例如XML、HTML文档就属于半结构化数据。上述半结构化数据通常是自描述的,其数据的结构和内容混杂在一起,没有明显的区分。具体地,关系数据库相比其他模型的数据库而言,有着如下优点:易于理解:关系数据库通常采用二维表结构,该二维表结构较为贴近逻辑世界的概念,其使用的关系模型相对网状、层次等其他模型来说更容易被用户所理解;使用方便:通用的结构化查询语言(StructuredQueryLanguage,SQL)使得操作关系数据库非常方便,专业人员(例如程序员或数据管理员等)可以方便地在逻辑层面操作关系数据库,而完全不必理解其底层实现;易于维护:丰富的完整性(实体完整性、参照完整性和用户定义的完整性)大大降低了数据冗余和数据不一致的概率;数据的灵活性:关系数据库的管理系统不是把数据简单堆积,而是在记录数据信息的基础上新增了很多的管理功能,如输入、输出、查询、编辑修改等;数据的安全性:根据用户的职责,不同级别的人对关系数据库具有不同的权限,关系数据库的管理系统应该确保数据的安全性;本文档来自技高网...

【技术保护点】
1.一种信息管理方法,其特征在于,包括:获取待存储文件的结构化文本信息及非结构化文本信息;将所述结构化文本信息加入关系数据库中,将所述非结构化文本信息加入搜索引擎的索引中;当接收到输入的查询请求时,获取所述查询请求所携带的查询文本信息;基于预设的分解方案将所述查询文本信息分解为第一关键词、第二关键词及第三关键词,其中,所述第一关键词用于进行模糊查询,所述第二关键词用于进行精确查询,所述第三关键词用于同时进行模糊查询及精确查询;分别根据所述第一关键词、第二关键词及第三关键词在所述关系数据库和/或所述搜索引擎的索引中进行查询;返回查询的结果。

【技术特征摘要】
1.一种信息管理方法,其特征在于,包括:获取待存储文件的结构化文本信息及非结构化文本信息;将所述结构化文本信息加入关系数据库中,将所述非结构化文本信息加入搜索引擎的索引中;当接收到输入的查询请求时,获取所述查询请求所携带的查询文本信息;基于预设的分解方案将所述查询文本信息分解为第一关键词、第二关键词及第三关键词,其中,所述第一关键词用于进行模糊查询,所述第二关键词用于进行精确查询,所述第三关键词用于同时进行模糊查询及精确查询;分别根据所述第一关键词、第二关键词及第三关键词在所述关系数据库和/或所述搜索引擎的索引中进行查询;返回查询的结果。2.如权利要求1所述的信息管理方法,其特征在于,所述基于预设的分解方案将所述查询文本信息分解为第一关键词、第二关键词及第三关键词,包括:基于预设的文字数量的阈值及文本信息的类型,将所述查询文本信息分解为第一关键词、第二关键词及第三关键词。3.如权利要求1所述的信息管理方法,其特征在于,所述分别根据所述第一关键词、第二关键词及第三关键词在所述关系数据库和/或所述搜索引擎的索引中进行查询,包括:调取所述关系数据库及所述搜索引擎;在所述关系数据库中根据所述第二关键词及第三关键词进行查询,获得精确查询结果;在所述搜索引擎的索引中根据所述第一关键词及第三关键词进行查询,获得模糊查询结果;所述返回查询的结果,包括:返回所述精确查询结果及模糊查询结果。4.如权利要求3所述的信息管理方法,其特征在于,所述返回查询的结果之前,所述信息管理方法还包括:对所述精确查询结果及模糊查询结果进行去重操作,以获得最终查询结果;所述返回查询的结果,包括:返回最终查询结果。5.如权利要求1至4任一项所述的信息管理方法,其特征在于,在接收到输入的查询请求之前,所述信息管理方法还包括:获取当前登录的用户身份信息;根据所述当前登录的用户身份信息,获取当前用户的历史查询记录中,各个关键词的词频;所述分别根据所述第一关键词、第二关键词及第三关键词在所述关系数据库和/或所述搜索引擎的索引中进行查询,包括:若所述第一关键...

【专利技术属性】
技术研发人员:熊文陈小军丁紫惠
申请(专利权)人:中国长城科技集团股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1