【技术实现步骤摘要】
基于VF2算法的SPARQL查询子图模式匹配方法
[0001]本专利技术涉及RDF数据查询
,具体涉及一种基于VF2算法的SPARQL查询子图模式匹配方法。
技术介绍
[0002]随着语义网的快速发展与应用,越来越多的应用领域利用RDF(ResourceDescription Framework)模型来描述大规模领域数据,如搜索引擎、道路交通、社交网络、生物信息学等领域。RDF模型主要采用<s,p,o>三元组形式描述一个数据的元数据,其中,s表示主词subject,p表示谓词predicate,o表示宾词object。例如:<John,interest,UIDesign>表示John喜欢UIDesign这门课程。一个三元组中的谓词p也可作为一条有向边,主词s与宾词o可作为节点,所以一个三元组也可以表示为因此,三元组之间通过共享的主词与宾词形成有向图,海量的RDF数据即可形成一个大规模有向图。目前这些应用领域的RDF数据集已达到数十亿级的规模,因此,面向大规模RDF ...
【技术保护点】
【技术特征摘要】
1.基于VF2算法的SPARQL查询子图模式匹配方法,其特征在于,包括以下步骤:S1:将SPARQL查询语句以SPARQL查询图的形式呈现,根据链型识别规则以及星型识别规则将SPARQL查询图分为链型查询图以及星型查询图;S2:建立VF2算法的基本匹配规则,并根据链型查询图的结构信息与语义信息建立链型匹配规则,根据星型查询图的结构信息与语义信息建立星型匹配规则;S3:根据链型识别规则以及星型识别规则将RDF数据库中的RDF数据图分为链型数据图以及星型数据图;使用VF2算法根据步骤S2中的基本匹配规则、链型匹配规则以及星型匹配规则分别将链型查询图与链型数据图以及星型查询图与星型数据图进行匹配,过滤得到匹配集合并输出结果。2.根据权利要求1所述的SPARQL查询子图模式匹配方法,其特征在于,所述链型识别规则为:当SPARQL查询图中仅具有链路的起点的节点、链路的终点的节点以及链路中的节点时,属于链型查询图;所述星型识别规则为:当SPARQL查询图中具有核心点以及分支节点时,属于星型查询图。3.根据权利要求1所述的SPARQL查询子图模式匹配方法,其特征在于,所述步骤S2中的基本匹配规则包括前驱规则、后继规则、前驱1
‑
hop规则、后继1
‑
hop规则以及2
‑
hop规则。4.根据权利要求1所述的SPARQL查询子图模式匹配方法,其特征在于,所述链型匹配规则的表达式如下:则的表达式如下:星型匹配规则的表达式为:星型匹配规则的表达式为:其中,REdge
‑
attr表示链型查询图中的谓词属性一致性验证规则,RLinear
‑
s表示链型查询图中的节点与边的语义一致性验证规则,Rstar表示星型查询图的特殊节点的结构关系的验证规则,Rstar
‑
s表示星型查询图的语义一致性验证规则,s表示当前匹配状态,qtp表示当前SPARQL查询图中已匹配的对象,gtp表示当前RDF数据图中已匹配的对象,edg1表示SPARQL查询图中存在关系类型或属性类型的边,edg1
′
表示RDF数据图中存在关系类型或属性类型的边,Q1表示SPARQL查询图中的已匹配对象之间存在兄弟拓扑关系,Q1
′
表示SPARQL查询图中的待匹配对象之间存在兄弟拓扑关系,Q2表示RDF数据图中的已匹配对象之间存在兄弟拓扑关系,Q2
′
表示RDF数据图中的待匹配对象之间存在兄弟拓扑关系,Q3表示SPARQL星型查询图中存在某种语义信息,Q3
′
表示RDF数据图中存在与Q3相对应的语义信息,RO1表示RDF数据图中的语义信息,RG1表示SPARQL查询图中的语义信息。5.根据权利要求1所述的SPARQL查询子图模式匹配方法,其特征在于,所述步骤S3具体包括:S3
‑
1:根据链型识别规则以及星型识别规则将RDF数据库中的RDF数据图分为链型数据图以及星型数据图;S3
‑
2:基于VF2算法中的链型匹配算法R
‑
VF
‑
Linear,并根据基本匹配规则和链型匹配
规则将链型查询图和链型数据图进行匹配,过滤得到链型数据图匹配集合并输出结果;S3
‑
3:基于VF2算法中的星型匹配算法R
‑
VF
‑
Star,并根据基本匹配规则和星型匹配规则将星型查询图和星型数据图进行匹配,过滤得到星型数据图匹配集合并输出结果。6.根据权利要求2所述的SPARQL查询子图模式匹配方法,其特征在于,所述链路的起点的节点的表达式为:in
‑
degree=0,out
‑
degree=1;链路的终点的节点的表达式为:in
‑
degree=1,out
‑
degree=0;链路中的节点的表达式为:out
‑
degree=in
‑
degree=1;所述核心点的表达式为:in
‑
degree=0,out
‑
degree=Count(D.out
‑
degree);所述分支节点的表达式为:in
‑
degree=1,out
‑
degree=0;其中,in
‑
degree表示出度,out
‑
degree表示入度,Count(D.out
‑
degree)表示星型查询图所有节点的总出度数...
【专利技术属性】
技术研发人员:王永恒,杨柳,李友梅,龙军,金雄男,陈庭轩,王子冬,
申请(专利权)人:中南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。