一种资源空间模型的存储与访问方法技术

技术编号:2918678 阅读:255 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种资源空间模型的存储方法,包括:输入一个资源空间模型;对资源空间模型中的所述轴和概念进行比特串编码,得到相应的多维比特串空间,所述比特串编码保留所述概念间的层次关系;保存轴或概念与其比特串编码之间的映射关系;根据所述的输入的资源空间模型,初始化所述多维比特串空间对应的索引树,得到一个底层索引树。本发明专利技术还公开了一种资源空间模型的访问方法。本发明专利技术可以完整地保持资源的分类语义,并可提高资源语义检索的效率。

【技术实现步骤摘要】

本专利技术涉及数据库
,特别涉及一种资源空间模型的存储与访问实现方法。
技术介绍
信息资源的存储是计算机科学面临的最基本问题之一,是辅助人们进行信息处理的核心技术。常见的信息资源存储方式可分为无结构化存储(如普通文本)、半结构化存储(如超文本标记语言文档和扩展标记语言文档)、结构化存储(如关系数据库表)。无结构存储方式中信息资源的语义通常是隐含和模糊的;半结构化存储中信息资源的语义仅部分明确,如扩展标记语言利用标记来指明文档某部分内容的语义;而结构化存储方式中资源的语义则是显式的,如关系数据库表根据若干预定义的属性来规范资源的存储和检索。资源空间模型(Resource Space Model)是一种新的结构化资源表示方法,其主要特征是利用分类语义组织资源。整个资源空间由若干轴构成,每根轴代表一个语义特征对资源的分类,类别由轴上的概念表示。每根轴上的概念之间可以存在层次关系,子代概念代表对属于父代概念类别的资源的进一步细分。例如,存在以下资源空间资源空间(性别(男、女),专业(计算机(软件、硬件),历史(古代史、近代史、现代史)))。该空间有两根轴,分别为“性别”和“专业”。“性别”轴上分类概念有“男”和“女”。“专业”轴上第一层分类概念有“计算机”和“历史”,属于“计算机”的资源可以被其子概念“软件”和“硬件”进一步细分。资源空间中一个点代表一种语义分类,存放所有属于该分类的资源。在参考文献1“Hai Zhuge,Resource spacemodel,its design method and applications(资源空间模型的设计方法和应用),Journalof Systems and Software,Volume72,Issue 1,June2004,Pages71-81”中有对关于资源空间模型的详细说明。资源空间模型已经具备了较为完善的范式理论指导其构建过程,但目前尚缺乏有效的存储机制,在存储介质上保持资源空间模型的分类语义。与现有技术中的其他空间模型相比,资源空间模型的一个优势在于对资源分类语义的维护,因此,实现资源空间模型在存储介质上的存储时,应当保持资源空间模型的分类语义信息。但现有技术中用于实现其他空间模型存储的机制并不能实现对资源空间模型中分类语义信息的保留。以与资源空间模型较为相近的多维空间模型为例,多维空间模型存储时,要求空间每一维上的坐标存在线性序,而资源空间模型中,每一维(轴)上坐标(概念)只有层次关系,不存在线性序,因此,现有的多维空间存储方法不能直接应用于资源空间模型的存储。如果用常用的关系数据库表作为资源空间模型的存储机制,也会丢失资源空间模型中概念间的层次语义关系,而且在多属性查询时效率不高。基于资源空间模型的上述特点,需要一种资源空间模型的存储实现方法,以及相应的访问实现方法。
技术实现思路
本专利技术的目的是克服现有的存储方法无法存储资源空间模型中概念间的层次语义关系,而且在多属性查询时效率不高的缺陷,从而提供一种资源空间模型的存储方法以及对存储后的资源空间模型进行访问的方法。为了实现上述目的,本专利技术提供了一种资源空间模型的存储方法,包括以下步骤步骤1)、输入一个资源空间模型,所述资源空间模型中包含有轴,轴上有表示资源分类的概念,在每个所述轴上,所述概念间存在层次关系;步骤2)、对资源空间模型中的所述轴和概念进行比特串编码,得到相应的多维比特串空间,所述比特串编码保留所述概念间的层次关系;步骤3)、保存所述轴或概念与其比特串编码之间的映射关系;步骤4)、根据所述的输入的资源空间模型,初始化所述多维比特串空间对应的索引树,得到一棵底层索引树。上述技术方案中,在所述的步骤2)与所述的步骤3)之间,对所述概念的比特串编码进行无损压缩编码。所述的无损压缩编码将比特串编码中的连续1比特序列用所含1的个数代替。上述技术方案中,在所述的步骤2)中,所述的比特串编码采用二叉树编码。在所述的二叉树编码中,首先将所述资源空间模型中每根轴上的概念树森林转换为二叉树,然后将所有轴构成的二叉树森林转换为单棵的二叉树;最后对所述单棵二叉树上指向左子树的边赋值0比特,指向右子树的边赋值1比特;对于所述单棵二叉树上的某一概念,从根节点起到所述概念所在节点经过的边的值拼接起来就是所述概念的比特串编码。上述技术方案中,在所述的步骤4)中,所述的初始化包括设定所述多维比特串空间的维数,保存单个索引树叶节点的连续磁盘空间大小,保存单个索引树中间节点的连续磁盘空间大小,设定页面负载因子、节点分裂因子、节点重插因子的值。本专利技术还提供了一种资源空间模型的访问方法,具体包括以下步骤步骤a)、用户提出资源访问请求,对用户给出的资源访问请求,通过所述的轴或概念与比特串编码间的映射关系将所述的资源访问请求转换为所述多维比特串空间理解的格式;步骤b)、根据资源访问请求,从与多维比特串空间对应索引树的根节点开始查找与资源访问请求相关的叶节点,确定所述叶节点的位置;步骤c)、在所述的叶节点上,实现所述的资源访问请求;步骤d)、返回所述资源访问请求的结果,并利用所述轴或概念与比特串编码间的映射关系将所述结果转化为所述资源空间模型中的资源表示格式,并显示给用户。上述技术方案中,所述的资源访问请求包括资源插入请求、资源删除请求、资源修改请求、资源范围查询请求和资源精确查询请求。上述技术方案中,在用户提出资源访问请求前,还需要定义所述多维比特串空间中的分类区域,设定多维比特串空间中的邻近度量标准,定义所述索引树的优化目标,并确定最优子区域的筛选方法和所述分类区域的分裂方法。所述的定义所述多维比特串空间中的分类区域的具体实现方法包括分类区域对应所述多维比特串空间中一块区域,其在每维上的投影是该维所有概念组成的集合的子集;分类区域是在索引树生成过程中动态产生的,在同一块分类区域中的分类点具有分类语义邻近性。所述的设定多维比特串空间中的邻近度量标准是指所述的多维比特串空间中分类语义的近似程度,它包括分类点间的邻近度,分类区域间的邻近度,分类点和分类区域间的邻近度,所述分类语义的近似程度通过计算同轴概念在概念层次树上的最短路径长度得到。上述技术方案中,所述的查找与资源访问请求相关的叶节点是指从根节点开始,根据最优子区域筛选法,每次进入当前节点的最优子区域对应的分支节点,直至到达树的叶节点。所述的最优子区域是包含插入资源后在空间体积、空间重叠体积和空间周长三方面总体增长最小的那个子区域。本专利技术的优点在于1、本专利技术采用资源空间模型实现对资源的存储可以完整地保持资源的分类语义。2、本专利技术的资源空间模型存储方法基于资源的分类语义在磁盘上保存资源,提高了资源语义检索的效率。3、本专利技术的资源空间模型存储方法对资源空间模型中的轴和概念进行比特串编码,仅根据概念的比特串码,就能判断其祖先后代关系、父子关系、兄弟关系等语义关系。4、本专利技术的资源空间模型存储方法实现了对概念比特串码的可选的压缩编码,避免过长的概念比特串码在存储时占用存储资源过多的问题。5、本专利技术的资源空间模型存储方法中定义了概念间的语义距离,该距离反映了人们对概念间语义关系的认识,概念间语义距离可以很容易地通过计算概念的比特串码得到。6、本专利技术通过对概念进行比特串编码,使本文档来自技高网
...

【技术保护点】
一种资源空间模型的存储方法,包括以下步骤:步骤1)、输入一个资源空间模型,所述资源空间模型中包含有轴,轴上有表示资源分类的概念,在每个所述轴上,所述概念间存在层次关系;步骤2)、对资源空间模型中的所述轴和概念进行比特串编码, 得到相应的多维比特串空间,所述比特串编码保留所述概念间的层次关系;步骤3)、保存所述轴或概念与其比特串编码之间的映射关系;步骤4)、根据所述的输入的资源空间模型,初始化所述多维比特串空间对应的索引树,得到一棵底层索引树。

【技术特征摘要】

【专利技术属性】
技术研发人员:诸葛海何超
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1