基于非结构化数据存储的多维业务属性检索装置及方法制造方法及图纸

技术编号:9490057 阅读:126 留言:0更新日期:2013-12-25 23:51
本发明专利技术涉及基于非结构化数据存储的多维业务属性检索装置及方法,其中,方法包括:系统数据读写层执行对非结构化数据存储中基本属性分类检索和关键字检索;多维数据检索处理层接收用户的检索请求,对用户请求进行分类;如果检索请求为关键字检索或非结构化数据存储中基本属性分类检索,则将检索请求转发至系统数据读写层;如果检索请求为业务属性分类检索,则判断检索请求是否存在于其维护的业务属性配置文件中;如果存在,则根据索引在非结构化数据存储中获取用户检索内容;如果尚未建立检索请求的索引,则执行对非结构化数据存储的检索请求获取检索内容;系统数据呈现层对系统数据读写层的检索结果和多维数据检索处理层的检索结果进行呈现。

【技术实现步骤摘要】
【专利摘要】本专利技术涉及,其中,方法包括:系统数据读写层执行对非结构化数据存储中基本属性分类检索和关键字检索;多维数据检索处理层接收用户的检索请求,对用户请求进行分类;如果检索请求为关键字检索或非结构化数据存储中基本属性分类检索,则将检索请求转发至系统数据读写层;如果检索请求为业务属性分类检索,则判断检索请求是否存在于其维护的业务属性配置文件中;如果存在,则根据索引在非结构化数据存储中获取用户检索内容;如果尚未建立检索请求的索引,则执行对非结构化数据存储的检索请求获取检索内容;系统数据呈现层对系统数据读写层的检索结果和多维数据检索处理层的检索结果进行呈现。【专利说明】
本专利技术涉及数据检索领域,特别涉及一种。
技术介绍
非结构化数据库是指其字段长度可变,并且每个字段的记录又可以由可重复或不可重复的子字段构成的数据库,用它不仅可以处理结构化数据(如数字、符号等信息)而且更适合处理非结构化数据(全文文本、图象、声音、影视、超媒体等信息)。非结构化数据存储主要是针对非结构化数据而产生的,与以往流行的关系数据库相比,其最大区别在于它突破了关系数据库结构定义不易改变和数据定长的限制,支持重复字段、子字段以及变长字段并实现了对变长数据和重复字段进行处理和数据项的变长存储管理,在处理连续信息(包括全文信息)和非结构化信息(包括各种多媒体信息)中有着传统关系型数据库所无法比拟的优势。非结构化数据:相对于结构化数据(即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据)而言,不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信届、O文档基本属性:在一个封闭系统中所有非结构化数据都具有的一般属性称为基本属性,这些属性不涉及数据的业务语义,常见的基本属性有名称、类型、大小、创建者、创建时间等。文档业务属性:不同业务类型的非结构化数据所具有的特有属性称为非结构化数据的业务属性,这些属性与数据的业务语义密切相关,不同类型的业务数据具有不同类型的业务属性,比如所属专业、设备种类、检修状态等。电力科学研究院等电力行业的技术支撑单位往往在多年的电力技术服务过程中积攒了大量的电子报告、图片、音频、视频等非结构化数据文档。为了方便的管理这部分非结构化数据,上述单位大都建立了自有的集中式非结构化数据的专业存储系统,以期提高非结构化文档的管理效率。在建立了非结构化数据存储系统后,面临的主要问题即如何根据业务需求从上述存储系统中找到所需的数据。目前基于目录索引的非结构化数据存储大多支持根据建设初期梳理的业务规则进行分类查询,或使用关键字进行标题和正文的索引。目前主流的非结构化数据存储解决方案包括IBM的ECM (Filenet)jMicrosoft的Sharepoint以及EMC的Documentum等。这些存储方案大都基于树形文件目录系统,即以文件目录的方式索引非结构化数据,从某个业务维度进行文档的多层次分类和存储。具体索引的业务维度一旦固定这种方式在一定程度上解决了非结构化文档的组织问题,可以使用非结构化数据的基本业务维度,如时间、所属部门等对文档进行分类存储和检索。然而,上述系统在建立后很难对已有的分类信息进行检索维度的调整。这时,如果需要以其他不同的业务维度对非结构化数据进行检索,就需要借助于原有平台提供的关键字搜索功能,将待检索的非结构化文档的业务属性设置为检索关键字进行搜索。如图1所示,为传统非结构化数据存储解决方案的数据检索示意图。在图1中,将用户的请求分为三类,第一类是按照基本属性维度进行的分类查看信息,这在原有的非结构化数据存储系统中即可通过非结构化文档的基本属性分类进行直接呈现;第二类是用户的搜索请求,用户通过指定关键字,对所需要的文档进行查找,这可以借助非结构化数据存储系统的关键字检索功能来实现;第三类是用户按照其它业务维度进行数据分类查看的请求,由于原系统中没有维护非结构化文档的业务属性信息,故无法直接呈现用户所需的信息,只能通过多次设定待查询的业务属性为关键字进行检索,将检索结果返回到数据呈现层进行整理。上述解决方案的主要缺点如下:I)上述方案中实际上只包含对基本属性的分类索引,没有针对业务属性的分类索弓I。使用关键字检索结果代替直接对文档按业务属性进行分类,再将关键字检索结果汇集呈现,会大大降低检索的速度,延长响应时间。2)由于使用关键字检索结果代替直接的业务属性分类检索,导致可能出现互斥业务属性分类的检索结果集合交集非空,即某项非结构化数据既出现在业务属性Al的检索结果中,也出现在与Al互斥的业务属性A2的检索结果中,造成检索结果的不准确。3)由于每次检索的结果都不做保存,因此下次对同样的业务属性进行检索时,还需要经历相同的关键字搜索和整理过程,在时间效率上没有改善;同时对用户经常搜索的关键字也没有记录,无法根据用户搜索的统计性结果进行系统的业务优化。
技术实现思路
本专利技术的目的是针对上述问题,提出一种,可以在原系统数据存储和分类索引的基础上实现统一视图的多维度业务属性分类检索,并可以根据用户进行关键字检索的统计数据提出分类建议,动态的创建业务分类维度。为实现上述目的,本专利技术提供了一种基于非结构化数据存储的多维业务属性检索装置,包括:系统数据读写层、系统数据呈现层和多维数据检索处理层;所述系统数据读写层,用于执行对非结构化数据存储中基本属性分类检索和关键字检索;所述多维数据检索处理层,用于接收用户的检索请求,对用户请求进行分类;如果所述检索请求为关键字检索或非结构化数据存储中基本属性分类检索,则将检索请求转发至所述系统数据读写层;如果所述检索请求为业务属性分类检索,则判断所述检索请求是否存在于其维护的业务属性配置文件中;如果存在,则根据索引在非结构化数据存储中获取用户检索内容;如果尚未建立所述检索请求的索引,则执行对非结构化数据存储的检索请求获取检索内容;所述系统数据呈现层,用于对所述系统数据读写层的检索结果和所述多维数据检索处理层的检索结果进行呈现。可选的,在本专利技术一实施例中,所述系统数据读写层进一步用于基本属性分类检索的检索结果转发至所述多维数据检索处理层。可选的,在本专利技术一实施例中,所述多维数据检索处理层进一步用于如果尚未建立所述检索请求的索引,则执行对非结构化数据存储的检索请求获取检索内容;同时将所述检索请求写入业务属性配置文件中。可选的,在本专利技术一实施例中,所述多维数据检索处理层进一步用于所述系统数据读写层转发过来的对基本属性分类检索的检索结果和业务属性分类检索的检索结果进行处理以相同的数据结构转发至所述系统数据呈现层。可选的,在本专利技术一实施例中,所述多维数据检索处理层进一步用于对所述关键字检索进行记录,统计用户对关键字的查询频率,并对出现频率高的关键字进行整理和筛选形成建议,根据所述建议用于及时在业务属性配置文件中创建新的业务分类索引。为实现上述目的,本专利技术还提供了一种基于非结构化数据存储的多维业务属性检索方法,所述方法包括:所述系统数据读写层执行对非结构化数据存储中基本属性分类检索和关键字检索;所述多维数据检索处理层接收用户的检索请求,对用户请求进行分类;如果所述检索请求为关键字检索或非本文档来自技高网
...

【技术保护点】
一种基于非结构化数据存储的多维业务属性检索装置,包括:系统数据读写层和系统数据呈现层;其特征在于,还包括:多维数据检索处理层;所述系统数据读写层,用于执行对非结构化数据存储中基本属性分类检索和关键字检索;所述多维数据检索处理层,用于接收用户的检索请求,对用户请求进行分类;如果所述检索请求为关键字检索或非结构化数据存储中基本属性分类检索,则将检索请求转发至所述系统数据读写层;如果所述检索请求为业务属性分类检索,则判断所述检索请求是否存在于其维护的业务属性配置文件中;如果存在,则根据索引在非结构化数据存储中获取用户检索内容;如果尚未建立所述检索请求的索引,则执行对非结构化数据存储的检索请求获取检索内容;所述系统数据呈现层,用于对所述系统数据读写层的检索结果和所述多维数据检索处理层的检索结果进行呈现。

【技术特征摘要】

【专利技术属性】
技术研发人员:徐小天王刚陈威陈乐然石磊
申请(专利权)人:国家电网公司华北电力科学研究院有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1