一种非结构化数据查询方法技术

技术编号:6963193 阅读:253 留言:0更新日期:2012-04-11 18:40
一种非结构化数据查询方法:(1)改进现有XML查询方法,使用非结构化智能查询语言AQL对XQuery语言进行扩展;(2)简化与非结构化数据查询无关的功能;(3)定义执行计划;(4)对AQL语句进行解析,识别实例文件字段;(5)分离语句中不同属性的描述字段;(6)根据步骤(5)的结果形成查询语句并生成执行计划。本发明专利技术根据待查数据四个刻面的条件约束实现基本属性、语义属性和底层特征的关联检索和实例查询,根据数据聚类时的特征约束实现智能查询,跨类检索时通过对关联点的约束实现不同类型数据的关联检索,可完全满足非结构化数据的查询需求。

【技术实现步骤摘要】

本专利技术涉及一种针对非结构化数据库,以四面体模型及XQuery语言为基础的非结构化数据查询方法,该方法使用非结构化数据智能查询语言AQUAdvanced Query Language, AQL,高级查询语言)。
技术介绍
关系数据库因其固有限制,不能满足互联网的应用需求,非结构化数据库应运而生。非结构化数据库以四面体模型为理论基础,四面体模型以基本属性、语义属性、底层特征和原始文件四个刻面来完整描述数据。其中基本属性和语义属性可以用XML数据库进行存储,现有的XML查询语言为XQuery,但XQuery只能用于查询XML格式的信息,不能实现视频、音频等多媒体信息基于内容的查询。非结构化数据库中存储的数据种类多并且规模庞大,对于这些数据的查询操作需求也是多样的,具体来说有三种基本查询、关联查询和智能查询,现有的查询方法无法完成新型的查询操作。
技术实现思路
本专利技术的技术解决问题克服现有技术的不足,提供一种实现非结构化数据查询的方法,根据对要查询的数据的四个刻面的条件约束实现多面查询和实例查询,根据数据聚类时特征选择的约束实现智能查询,通过对跨数据类检索时对关联点的约束实现多体查询,可以完全满足非结构化数据查询操作的需求。本专利技术的技术解决方案,该方法使用非结构化数据智能查询语言AQL,其特征在于步骤如下(1)使用的非结构化数据智能查询语言AQL对XQuery语言进行扩展,增加基本属性、语义属性、底层特征和聚类方式关键语句,以支持多面查询、实例查询、智能查询和多体查询;(2)简化与非结构化数据查询无关的功能,以提高解析效率;(3)定义执行计划用于表示非结构化数据查询的执行过程;G) AQL语句的解析过程为预处理,识别实例文件字段,若语句包含实例文件则记录文件,否则转到步骤(5);(5)按照AQL语法把语句中不同属性的描述字段分离;(6)根据步骤( 分离的不同字段形成对应的查询语句并生成执行计划。根据本专利技术的又一个方面,其中步骤(1)进一步包括步骤(1. a) AQL以XQuery语言的FLWOR语句为基础,在其后加入了用于指定实例文件路径的语句Fil印athClause,以fil印ath为实例文件关键字;(l.b)AQL扩展XQuery的where语句,增加基本属性关键字ki,语义属性关键字 sf,底层特征匹配方式关键字If关键字,以实现对数据不同面的约束;(1. c)AQL增加智能查询语句,以classify为关键字,用于指定聚类时的特征选择。根据本专利技术的又一个方面,其中步骤( 进一步包括(2. a)减少FLWOR语句的嵌套,在AQL中规定FLWOR语句的嵌套只能在for语句中进行;(2. b)限定return语句的返回值,规定嵌套在内层的FLWOR语句的返回值只能为数据的原始数据id。根据本专利技术的又一个方面,其中步骤C3)进一步包括(3. a)执行计划以XML文件格式存放;(3. b)执行计划按多体查询划分;(3. C)单体查询内部包含实例文件、查询范围、基本属性查询语句、语义属性查询语句、底层特征匹配方式和智能查询语句。根据本专利技术的又一个方面,其中步骤(6)进一步包括(6. a)分离基本属性、语义特征、底层特征查询的相应字段;(6. b)基本属性、语义特征的查询形成XQuery语句的形式,底层特征的查询形成符合AQL语言文法定义的查询语句;(6. c)根据步骤(6. b)形成的查询语句生成执行计划。本专利技术与现有技术相比的优点在于本专利技术考虑非结构化数据库的查询需求,保留XML查询功能的同时实现了基于内容的查询,同时也可以完成新型查询操作。附图说明图1为本专利技术的功能图;图2为本专利技术的解析流程;图3为本专利技术算法的多体查询执行流程;图4为本专利技术算法的多面查询执行流程;图5为本专利技术的功能测试结果;图6为本专利技术的性能测试结果。具体实施例方式下面参考附图,对本专利技术的实施例进行详细的说明。首先对本专利技术所针对的功能需求进行说明。根据非结构化数据库中数据查询功能的要求,该查询方法的功能(如图1所示)主要有1.基本查询利用数据的基本属性和语义特征,通过文本信息查找特定的数据;2.底层查询输入样本数据,如一副图像、一段语音或一段视频录像,通过底层特征匹配查找相似度最高的数据集;3.多面查询综合利用基本属性、语义特征与底层特征实现关联查询,准确快速定位数据;4.多体查询利用语义特征,实现多主题的多种数据类型的关联式查询;5.智能查询实现对查询结果的聚类、分类、多维数据分析等智能查询服务;6.综合查询上述功能可以嵌套执行,如智能查询可以在多面查询的基础上执行。非结构化数据查询方法所使用的智能查询语言AQL是在XQuery语言基础上扩展和简化而来,下面对此进行详细说明1.扩展底层查询功能:AQL中关于基本属性和语义特征的查询可以用XQuery语言实现,但四面体模型的底层特征不是以XML格式描述,所以XQuery不具备底层特征检索的功能,AQL对底层特征查询进行扩展;2.扩展智能查询功能智能查询包括对数据进行多维分析、聚类和分类操作, XQuery不具备对应功能,对此进行扩展;3.扩展多面查询功能多面查询是指对某个数据的基本属性、语义特征、底层特征三个面进行关联查询。在非结构化数据库中,每个数据的四个面特征是分别存储的,多面查询要由不同特征查询的结果合并后才能得到最终查询结果。XQuery不支持底层查询并且实现需要多层嵌套,为了完整实现多面查询功能并使AQL语言变得简明,对多面查询功能进行扩展;4.扩展多体查询功能多个体关联查询是指不同类型数据的关联查询,如图像与文本关联查询,需要对多个指定文集进行查询。XQuery无法在一条语句中完成对多个文集的检索,因此扩展多体查询功能;5.减少语句的嵌套在XQuery中,各个语句之间可以灵活嵌套。过多的嵌套对扩展之后的AQL多余,而且影响语言的简洁,对此进行简化,规定AQL语言的嵌套只能在for 语句中进行;6.限定return语句的返回值简化嵌套在内层的语句的返回值类型,规定只能返回原始数据id,便于多个文件的关联操作。下面给出AQL语言的文法定义1.最外层FLTOR语句文法FLffORExpr = ForClause LetClause ? WhereClause ? OrderByClause ? ReturnClause(FilePathClause) ?AQL语言最外层的结构以XQuery语言的FLWOR语句结构为基础,但在FLWOR语句后加入了用于指定输入文件路径的语句;2.内层嵌套的FLWOR语句文法FLffORExprInner:: = ForClause (LetClause) ? WhereClause ? OrderByClause ? ReturnClauseInner(FilePathClause) ?嵌套在内层的FLWOR语句与外层的FLWOR语句相比,区别主要在于return语句不同,内层的FLWOR语句只能返回所查数据的原始数据id,不能指定返回的具体数据项;3. for语句文法ForClause: = “ for" “ $〃 VarName“ in" TypePath( "("FLffORExprChange d,,),,)?for语句用于指定一次本文档来自技高网...

【技术保护点】
1.一种非结构化数据查询方法,该方法使用非结构化数据智能查询语言AQL,其特征在于步骤如下:(1)对现有XML查询方法进行改进,所使用的非结构化数据智能查询语言AQL对XQuery语言进行扩展,针对非结构化数据的特点,增加基本属性、语义属性、底层特征和聚类方式关键语句,以支持多面查询、实例查询、智能查询和多体查询;(2)简化与非结构化数据查询无关的功能,以提高解析效率;(3)定义执行计划用于表示非结构化数据查询的执行过程;(4)AQL语句的解析过程为:预处理,识别实例文件字段,若语句包含实例文件则记录文件,否则转到步骤(5);(5)按照AQL语法把语句中不同属性的描述字段分离;(6)根据步骤(5)分离的不同字段形成对应的查询语句并生成执行计划。

【技术特征摘要】

【专利技术属性】
技术研发人员:郎波段亚伟郑剑
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1