基于关键实例及其查询重写的RDF制造技术

技术编号:37506527 阅读:14 留言:0更新日期:2023-05-07 09:43
本发明专利技术涉及一种基于关键实例及查询重写的RDFS

【技术实现步骤摘要】
基于关键实例及其查询重写的RDF
(C)
模式冲突的检测方法


[0001]本专利技术属于机器语义理解领域,尤其是一种基于关键实例及查询重写的RDFS
(c)
模式冲突的检测方法。

技术介绍

[0002]作为W3C(World Wide Web Consortium,万维网联盟)提出的对Web环境中的信息资源进行统一描述的语义模型,RDFS(Resource Description Framework Schema,资源描述框架模式)使得通过一系列有确定语义的词汇来描述概念之间的层次结构及概念和属性的语义成为可能,因而成为构建语义Web本体的重要基础。确保RDFS本体的正确性是基于本体的建模过程中避免错误传播的关键,因此RDFS模式冲突的自动检测获得了大量的研究关注。
[0003]由于RDFS描述约束能力的欠缺,近年来在RDFS模式中引入非图形化的约束机制已成为一个重要的发展方向。引入了非图形约束的RDFS本体统称为约束增强的RDFS本体,即RDFS
(c)
本体。由于现实世界中约束条件的多样性及复杂性,非图形约束的引入使得RDFS
(c)
模式的冲突检测问题变得更加复杂,特别是在推理规则存在的情况下,因此尽管围绕前述研究已有一些检测工具被提出,如RDFShape,FHIR,RDDCHECKER等,但是,如何自动、高效地检测模式冲突仍未得到很好的解决,目前已成为RDFS
(c)
本体建模领域的研究热点之一。
[0004]检测模式不是检测静态对象,它们可以随着时间的推移而演化以反映它们建模的数据集的变化。推理规则的应用是RDF图数据集变化的重要来源,而规则的设计过程会耗费大量的人力代价并且容易引入冲突,因为推理规则的施加可能会生成新的事实,而不是由原始模式定义所捕获。

技术实现思路

[0005]本专利技术的目的在于克服现有技术的不足,提供一种基于关键实例及查询重写的RDFS
(c)
模式冲突的检测方法,其给定一个RDFS
(c)
模式和一组推理规则,如果一个RDF图最初对该模式有效,在使用推理规则计算其闭包后是否仍然有效,如果存在冲突,通过分析对模式产生影响的特定规则的应用效果,因此,可以无需考察模式的所有实例并高效地推断出哪些约束和类型限定可能被违背,从而为冲突的消解和模式的修复提供支持。
[0006]本专利技术解决现有的技术问题是采取以下技术方案实现的:
[0007]一种基于关键实例及查询重写的RDFS
(c)
模式冲突的检测方法,包括以下步骤:
[0008]步骤1、将RDFS
(c)
模式转换为内模式;
[0009]步骤2、建立关键实例映射集,计算生成内模式的关键实例;
[0010]步骤3、过滤关键实例映射集并生成类型框架;
[0011]步骤4、采用查询重写方法推断被违背的类型限定和约束。
[0012]进一步,所述内模式S=<S
P
,S
NL
,S
ED
>是一个三元组,其中,S
P
为样式集,是三元组样式的集合,集合中每个变元名至多出现一次;为非字面集;
S
ED
是嵌入性依赖的集合。
[0013]进一步,所述步骤1包括内模式三元组S
P
、S
NL
和S
ED
的计算方法:
[0014]所述S
NL
的计算方法为:把在S
P
中的主语位置和谓语位置出现的所有变元添加进S
NL
,然后逐一扫描非图形约束,对于将变元的取值限定为实例化IRI的约束,将其约束变元添加进S
NL
,并从约束集中移除该约束;
[0015]所述S
ED
的计算方法为:将S
P
中与每个类对应的三元组样式转化为一个一元谓词,将每个对象属性和每个数据属性对应的三元组样式分别转化为一个二元谓词,将原始模式中的类层次和完整性转化为否定约束,对于每个非图形约束,将所有的否定文字从否定约束的左边移至其右边并去掉否定符号,将每个否定约束等价转换为一个嵌入性依赖。
[0016]进一步,所述步骤2的具体实现方法为:
[0017]定义:给定内模式S和推理规则集R,称BS

是S关于推理规则r的框架基元,记为r(S),r∈R,当且仅当称是S关于R的类型框架,记为fra(S,R),当且仅当
[0018]在计算fra(S,R)的过程中,利用内模式S的所有实例I对推理规则r的规则前提A进行赋值,计算A在S的所有实例上的SPARQL取值,进行映射集的计算,使用关键实例来代替由S建模的所有实例,基于在S的关键实例上对A进行赋值,计算得到关键实例映射集;
[0019]定义:给定内模式S及推理规则r:A

C,S相对于r的关键实例是三元组t的集合:
[0020][0021]其中t
S
∈S
P
,i∈{1,2,3},μ1∈const(S
ED
)∪const(A),)∪const(A),
[0022]使用S
ED
和A中的常量,以所有可能的方式来置换内模式中的变元,包括用const(S
ED
)∪const(A)中的所有IRI和字面量逐一替换μ1,用const(S
P
)∪const(A)中的所有IRI逐一替换μ2,从而创建关键实例。
[0023]进一步,所述步骤3过滤关键实例映射集的方法为:对于关键实例映射集每个映射m,执行如下操作:
[0024]首先,创建一个临时的非字面集S
mNL
,逐一考察推理规则r中的每个变元,如果用S的实例对规则前提A进行赋值以及在实例化规则的结果C时,该变元不能被绑定到字面量,则该变元将被置入S
mNL

[0025]然后,考虑在A的三元组t
A
的宾语位置出现的元素:需要将t
A
在中的所有变体t
q
纳入考虑范围,由于映射m是在关键实例上被计算获得的,因此至少存在一个t
q
使得对于每个这样的t
q
,需要获取对m(t
q
)进行建模的三元组t
S
∈S的集合,通过三元组t
S
使t
A
或其变体之一将关键实例与映射m相匹配。
[0026]进一步,所述步骤3类型框架的生成基于下式:
[0027]其中S0=S,S
i+1
=∪
r∈R
{r(S
i
},S
n
=S
n
‑1;
[0028]首先将初始本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于关键实例及查询重写的RDFS
(c)
模式冲突的检测方法,其特征在于:包括以下步骤:步骤1、将RDFS
(c)
模式转换为内模式;步骤2、建立关键实例映射集,计算生成内模式的关键实例;步骤3、过滤关键实例映射集并生成类型框架;步骤4、采用查询重写方法推断被违背的类型限定和约束。2.根据权利要求1所述的基于关键实例及查询重写的RDFS
(c)
模式冲突的检测方法,其特征在于:所述内模式S=<S
P
,S
NL
,S
ED
>是一个三元组,其中,S
P
为样式集,是三元组样式的集合,集合中每个变元名至多出现一次;为非字面集;S
ED
是嵌入性依赖的集合。3.根据权利要求2所述的基于关键实例及查询重写的RDFS
(c)
模式冲突的检测方法,其特征在于:所述步骤1包括内模式三元组S
P
、S
NL
和S
ED
的计算方法:所述S
P
的计算方法为:定义出现在RDF图中的三元组的三种类型:单个实例的类属,单个实例的数据属性取值,2个实例之间的对象属性关系;对于RDFS
(c)
模式中的每个类CL,向S
P
中添加三元组样式<?v rdf:type CL>;对于模式中的每个数据属性DP,向S
P
中添加<?v DP Datatype>;对于模式中的每个对象属性OP,向S
P
中添加<?v1 OP ?v2>;所述S
NL
的计算方法为:把在S
P
中的主语位置和谓语位置出现的所有变元添加进S
NL
,然后逐一扫描非图形约束,对于将变元的取值限定为实例化IRI的约束,将其约束变元添加进S
NL
,并从约束集中移除该约束;所述S
ED
的计算方法为:将S
P
中与每个类对应的三元组样式转化为一个一元谓词,将每个对象属性和每个数据属性对应的三元组样式分别转化为一个二元谓词,将原始模式中的类层次和完整性转化为否定约束,对于每个非图形约束,将所有的否定文字从否定约束的左边移至其右边并去掉否定符号,将每个否定约束等价转换为一个嵌入性依赖。4.根据权利要求2所述的基于关键实例及查询重写的RDFS
(c)
模式冲突的检测方法,其特征在于:所述步骤2的具体实现方法为:定义:给定内模式S和推理规则集R,称BS

是S关于推理规则r的框架基元,记为r(S),r∈R,当且仅当称是S关于R的类型框架,记为fra(S,R),当且仅当在计算fra(S,R)的过程中,利用内模式S的所有实例I对推理规则r的规则前提A进行赋值,计算A在S的所有实例上的SPARQL取值,进行映射集的计算,使用关键实例来代替由S建模的所有实例,基于在S的关键实例上对A进行赋值,计算得到关键实例映射集;定义:给定内模式S及推理规则r:A

C,S相对于r的关键实例是三元组t的集合:其中t
S
∈S
P
,i∈{1,2,3},μ1∈const(S
ED
)∪const(A),
使用S
ED
和A中的常量,以所有可能的方式来置换内模式中的变元,包括用const(S
ED
)∪const(A)中的所有IRI和字面量逐一替换μ1...

【专利技术属性】
技术研发人员:赵晓非柴争义袁超张振
申请(专利权)人:天津工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1