【技术实现步骤摘要】
一种动态RDF数据转存与属性选择方法
本专利技术提供一种动态RDF(ResourceDescriptionFramework,资源描述框架)数据转存及属性选择方法,涉及语义网数据存储
本专利技术所提供的技术可以用于RDF数据管理,能够适应不同应用的需求,达到灵活定制转存策略、提高查询效率的效果。
技术介绍
已有技术为RDF(数据资源描述框架数据)存储提供了基础和参考,但由于语义网的应用场景多样化,不同应用对RDF数据的访问模式会有很大的差别,各种存储方法在不同的访问模式下的性能各有优劣,所以要实现高效的存储往往需要根据数据集和访问模式设计不同的存储策略。三元组表存储和水平表存储都采取了固定的存储策略,很难根据不同情况进行调整,属性表存储更为灵活,但其中的属性选择方法是技术难点。本专利技术提供了一种动态属性选择方法,利用RDF数据查询中的连接操作及相关信息和用户定义的亲和度,生成有利于RDF数据管理的表结构,可以很大程度上优化RDF数据查询系统的性能。中国专利CN201410244507.1申请文件描述了一种结合语义网与地理信息特征的信息集成方法,这个方法在 ...
【技术保护点】
一种动态RDF数据转存的属性选择方法,其特征是根据用户所提交的查询,动态选择属性、确定表结构,并根据查询中与连接操作相关的信息,优化表结构;所述方法包括:(1)输入RDF数据查询集合,生成相应的属性连接情况矩阵;(2)基于属性连接情况矩阵生成属性关联度矩阵;(3)对属性关联度矩阵进行聚簇;(4)根据用户指定的亲和度阈值分析聚簇后的属性关联度矩阵执行属性选择,,生成最终的(一个或多个)属性表。输入查询集合,生成属性连接情况矩阵。
【技术特征摘要】
1.一种动态RDF数据转存的属性选择方法,其特征是根据用户所提交的查询,动态选择属性、确定表结构,并根据查询中与连接操作相关的信息,优化表结构;所述方法包括:(1)输入RDF数据查询集合,生成相应的属性连接情况矩阵;(2)基于属性连接情况矩阵生成属性关联度矩阵;(3)对属性关联度矩阵进行聚簇;(4)根据用户指定的亲和度阈值分析聚簇后的属性关联度矩阵执行属性选择,,生成最终的(一个或多个)属性表。输入查询集合,生成属性连接情况矩阵。2.根据权利要求1所述的方法,其中步骤1),生成与查询集合相关的属性连接情况矩阵:每行代表一次查询,每列代表一个属性,这样的行列组成矩阵,某单元格中填入1,表示该次查询访问了该属性。将所有查询对应访问的属性单元格中填入1,其余填入0,生成属性连接情况矩阵。3.根据权利要求1所述的方法,其中步骤2):属性关联度矩阵是正方形的对称矩阵,每行对应一个属性,每列也对应一个属性。每个单元格中填入的值代表该单元格相关的两个属性在所有查询中被共同访问的总频率。4.根据权利要求1所述的方法,其中步骤3):对属性关联度矩阵进行聚簇,调整正方形矩阵行和列的排列顺序,其目标函数使得矩阵中大值附近都是大值,小值附近都是小值。5.根据权利要求1所述的方法,其中步骤4):使用聚簇后的属性关联度矩阵和用户指定的亲和度阈值,将亲和度高于阈值的属性放到同一个属性表。6.根据权利要求5所述的方法,其中亲和度的计算:利用步骤1)得到的属性连接情况矩阵,统计若干个属性被访问的次数,按照这些属性同时被访问次数与最大被访问次数之比确定属性之间的亲和度。7.根据权利要求5所述的方法,其特征是生成与查询集合相关的属性连接情况矩阵:1)每行代表一次查询,每列代表一个属性,这样的行列组成矩阵,某单元格中填入1,表示该次查询访问了该属性。将所有查询对应访问的属性单元格中填入1,其余填入0,生成属性连接情况矩阵。其中步骤2):属性关联度矩阵是正方形的对称矩阵,每行对应一个属性,每列也对应一个属性。每个单元格中填入的值代表该单元格相关的两个属性在所有查询中被共同访问的总频率。步骤3):对属性关联度矩阵进行聚簇,调整正方形...
【专利技术属性】
技术研发人员:何硙卓,陶承恺,刘奇志,
申请(专利权)人:南京大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。