融合数据元标准的叙词本体构建方法技术

技术编号:20546794 阅读:30 留言:0更新日期:2019-03-09 19:41
本发明专利技术涉及的是融合数据元标准的叙词本体构建方法,具体为:一、依据数据元标准,将原有叙词表中的叙词划分为对象类叙词、特性类叙词、数据元概念类叙词;二、将对象类叙词标注为Object,将特性类叙词标注为Property;数据元概念类叙词标注为DEC;三、将标注过的对象类叙词、特性类叙词及数据元概念类叙词注册到MDR中;四、将叙词表中叙词间存在的词间关系注册到MDR中;五、MDR概念元模型到本体模型的映射;六、MDR数据描述元模型到本体模型的映射;七、依据MDR概念元模型到本体模型的映射方法、MDR数据描述元模型到本体模型的映射方法构建叙词本体。本发明专利技术能为叙词本体的构建提供通用的标准化方法和流程。

【技术实现步骤摘要】
融合数据元标准的叙词本体构建方法一、
:本专利技术涉及的是大数据技术中的知识组织领域,涉及本体构建技术,具体涉及的是融合数据元标准的叙词本体构建方法。二、
技术介绍
:本体作为一种重要的知识组织系统,在知识管理、语义web和人工智能等方面发挥着重要作用。本体最初来源于哲学领域,意为对现实世界真实存在所做出的客观性描述。后被引入图书情报、知识工程、人工智能等领域并成为这些领域的热门研究课题之一。本体构建技术一直是本体相关研究中的一个重点,同时,目前常用的本体构建方法有本:骨架法、Tove法、五步循环法、Kactus工程法、斯坦福大学开发的七步法等,其中,比较通用的是七步法。但是,这些传统的本体构建方法代价较高,需要耗费大量的人力物力,特别是在在抽取概念和关系时各领域专家的参与增加了构建领域本体的成本,限制了以领域本体为基础的语义网的发展和普及。本体构建问题成为制约语义网成功与普及的瓶颈。如果利用现有的知识源来构建本体,将会大大降低构建本体的代价,因此,国内外许多学术团体开始利用现有的叙词表、分类表与分类主题一体化词表来构建本体。基于叙词表的本体构建主要有手动构建和自动/半自动构建两种。手动构建是指领域专家在分析叙词表的叙词及语义关系的基础上,手工建立概念模型,并将叙词转为本体的概念,将词间关系及注释转为本体的语义关系,最后通过添加领域知识等语义丰富机制来构建完善本体。而半自动/自动转换方法则是先通过各领域专家分析词表,制定一个精确调整语义关系的规则,在此基础上设计程序实现叙词表到本体的自动转换。但是因为叙词表中并没有将对象类术语与特性类术语做出区分,不论是手工转换还是自动/半自动转换,大多数都只是从领域出发,单纯的依据叙词表本身来进行叙词本体构建,将叙词转换为本体中的概念,将叙词间的“用、代、属、分、参”映射为本体中概念间的关系,对属性、约束等的构建多依靠人力,主观性较强,缺乏一个标准化的方法论。这样构建出来的本体在语义上完整性较差且权威性不强。因此,现存的基于叙词表的本体构建方法主要存在以下四个问题:1、没有对对象类叙词与特性类叙词做出区分,构建的本体普遍缺乏完备的语义;2、缺乏标准化的保障机制,在将叙词表转换为本体的过程中,并没有一个通用的标准,每个构建者都是按照自己的理解来构建本体,在对概念间关系的定义过程中受人的影响较大,主观性过强;3、缺乏对于数据属性值域标准支撑的考虑;4、没有将公理与约束考虑进去。在语义本体的实际使用过程中,如果使用采用现有方法构建出来的本体,将会产生如下不利影响:1、对领域内知识描述不完整;2、如果利用该叙词本体进行语义检索,容易错检或漏检,检索效果较差;3、不利于语义推理。由此可见,原有的本体构建方法在语义表达方面不够清晰全面、受人的主观影响较大,因此,必须在原有的基于叙词表构建本体方法的基础上进行改进,从而提高所构建本体在知识表达上的全面性与完整性。三、
技术实现思路
:本专利技术的目的是提供融合数据元标准的叙词本体构建方法,这种融合数据元标准的叙词本体构建方法用于解决目前叙词本体构建中,缺乏统一标准、语义完整性较差和受人的主观性影响较大的问题。本专利技术解决其技术问题所采用的技术方案是:这种融合数据元标准的叙词本体构建方法如下:步骤一、依据数据元标准,对原有叙词表中的叙词进行分类,依次划分为对象类叙词、特性类叙词、数据元概念类叙词三种;划分方法为:对象类叙词是指描述现实世界中某个对象的叙词;特性叙词是指描述现实世界中某个对象特性的叙词,特性是对象类中所有成员所具有的共同的特征;数据元概念类叙词是表示数据元概念的叙词;步骤二、对叙词表中的对象类叙词、特性类叙词以及数据元概念类叙词进行标记,将对象类叙词标注为Object,将特性类叙词标注为Property;数据元概念类叙词标注为DEC;步骤三、将叙词表中步骤二标注过的对象类叙词、特性类叙词以及数据元概念类叙词注册到MDR中;按照国际标准,实现元数据注册系统(MDR)内容一致性的规程(ISO/IECTR20943:2003,IDT),将叙词表中标注过对象类叙词、特性叙词、数据元概念叙词注册到MDR中;步骤四、将叙词表中的叙词之间存在的词间关系注册到MDR中;将叙词款目中代、分、属、参、族关系对应的叙词和关系注册到MDR中;叙词的词间关系注册至MDR时,先选择相应的关系类型,然后,填写叙词对应的关系角色;“代”关系在MDR中为同一关系,“分”、“属”、“族”均为MDR中的属种关系,“参”对应为相关关系;步骤五、MDR概念元模型到本体模型的映射;MDR概念元模型:MDRcs=(CS,C,R,RR,LE,LI,),其中CS表示概念系统的集合;C表示概念的集合;R表示关系的集合;RR表示关系角色的集合;LE表示链端的集合,其中每个元素都是一对概念和关系角色,形如<c,rr>,其中c∈C,r∈RR;LI表示链环的集合,其中li∈LI,每个链环都是由一个关系链接两个链端所形成;本体模型:O=(Cl,P,Rel,DT,prop,relation),其中Cl表示类的集合;P表示属性的集合;Rel表示关系的集合;DT表示数据类型的集合;prop是一个三元组<cl,p,dt>,表示的一个类的某一项属性,其中cl∈Cl,p∈P,dt∈DT。Relation是一个三元组<cl1,rel,cl2>,表示两个类之间的关系,其中{cl1,cl2}∈Cl,rel∈Rel;MDR概念元模型到本体模型的映射方法:规则1:C→Cl;RR→Rel;规则2:li→relation;lir(<c1,rr1>,<c2,rr2>)→relationrel(cl2,cl1)或relationrel(cl1,cl2);c1→cl1,c2→cl2;其中r∈R,rel∈Rel,{c1,c2}∈C,{cl1,cl2}∈Cl,{rr1,rr2}∈RR;步骤六、MDR数据描述元模型到本体模型的映射;MDR数据描述元模型:MDRD=(CD,VM,VD,OC,Pr,DEC,DE,Dim),其中CD表示概念域的集合;VM表示值含义的集合;VD表示值域的集合;OC表示对象类的集合,Pr表示特性的集合;DEC表示数据元概念的集合;DE表示数据元的集合,de∈DE;Dim表示维度的集合;MDR数据描述元模型到本体的映射方法:规则1:CD→Cl;OC→Cl;Pr→P;VD→DT;DEC→Cl×P;Dim→Cl;规则2:de→prop;(<oc,pr>,vd)→propp(cl,dt);oc→cl,pr→p,vd→dt;其中oc∈OC,pr∈Pr,vd∈VD,p∈P,cl∈Cl,dt∈DT;步骤七、依据MDR概念元模型到本体模型的映射方法、MDR数据描述元模型到本体模型的映射方法构建叙词本体,根据MDR概念元模型到本体模型的映射,从MDR中选择构建本体所需的概念C、链环LI,将所选择的概念C定义为本体中的类Cl,将候选链环LI定义为本体中的Rel;根据MDR数据描述元模型到本体的映射,从MDR中选择完善本体所需的属性Pr和数据元概念DEC,将DEC定义为本体中对应类Cl的属性P。有益效果:1、本专利技术能够为领域本体的构建提供标准化本文档来自技高网
...

【技术保护点】
1.一种融合数据元标准的叙词本体构建方法,其特征在于包括如下步骤:步骤一、依据数据元标准,对原有叙词表中的叙词进行分类,依次划分为对象类叙词、特性类叙词、数据元概念类叙词三种;划分方法为:对象类叙词是指描述现实世界中某个对象的叙词;特性叙词是指描述现实世界中某个对象特性的叙词,特性是对象类中所有成员所具有的共同的特征;数据元概念类叙词是表示数据元概念的叙词;步骤二、对叙词表中的对象类叙词、特性类叙词以及数据元概念类叙词进行标记,将对象类叙词标注为Object,将特性类叙词标注为Property;数据元概念类叙词标注为DEC;步骤三、将叙词表中步骤二标注过的对象类叙词、特性类叙词以及数据元概念类叙词注册到MDR中;按照国际标准,实现元数据注册系统(MDR)内容一致性的规程(ISO/IEC TR 20943:2003,IDT),将叙词表中标注过对象类叙词、特性叙词、数据元概念叙词注册到MDR中;步骤四、将叙词表中的叙词之间存在的词间关系注册到MDR中;将叙词款目中代、分、属、参、族关系对应的叙词和关系注册到MDR中;叙词的词间关系注册至MDR时,先选择相应的关系类型,然后,填写叙词对应的关系角色;“代”关系在MDR中为同一关系,“分”、“属”、“族”均为MDR中的属种关系,“参”对应为相关关系;步骤五、MDR概念元模型到本体模型的映射;MDR概念元模型:MDRcs=(CS,C,R,RR,LE,LI,),其中CS表示概念系统的集合;C表示概念的集合;R表示关系的集合;RR表示关系角色的集合;LE表示链端的集合,其中每个元素都是一对概念和关系角色,形如<c,rr>,其中c∈C,r∈RR;LI表示链环的集合,其中...

【技术特征摘要】
1.一种融合数据元标准的叙词本体构建方法,其特征在于包括如下步骤:步骤一、依据数据元标准,对原有叙词表中的叙词进行分类,依次划分为对象类叙词、特性类叙词、数据元概念类叙词三种;划分方法为:对象类叙词是指描述现实世界中某个对象的叙词;特性叙词是指描述现实世界中某个对象特性的叙词,特性是对象类中所有成员所具有的共同的特征;数据元概念类叙词是表示数据元概念的叙词;步骤二、对叙词表中的对象类叙词、特性类叙词以及数据元概念类叙词进行标记,将对象类叙词标注为Object,将特性类叙词标注为Property;数据元概念类叙词标注为DEC;步骤三、将叙词表中步骤二标注过的对象类叙词、特性类叙词以及数据元概念类叙词注册到MDR中;按照国际标准,实现元数据注册系统(MDR)内容一致性的规程(ISO/IECTR20943:2003,IDT),将叙词表中标注过对象类叙词、特性叙词、数据元概念叙词注册到MDR中;步骤四、将叙词表中的叙词之间存在的词间关系注册到MDR中;将叙词款目中代、分、属、参、族关系对应的叙词和关系注册到MDR中;叙词的词间关系注册至MDR时,先选择相应的关系类型,然后,填写叙词对应的关系角色;“代”关系在MDR中为同一关系,“分”、“属”、“族”均为MDR中的属种关系,“参”对应为相关关系;步骤五、MDR概念元模型到本体模型的映射;MDR概念元模型:MDRcs=(CS,C,R,RR,LE,LI,),其中CS表示概念系统的集合;C表示概念的集合;R表示关系的集合;RR表示关系角色的集合;LE表示链端的集合,其中每个元素都是一对概念和关系角色,形如<c,rr>,其中c∈C,r∈RR;LI表示链环的集合,其中li∈LI,每个链环都是由一个关系链接两个链端所形成;本体模型:O=(Cl,P,Rel,DT,prop,relation),其中Cl表示类的集合;P表示属性的集合;Rel表示关系的集合;DT表示数据类型的集合;prop是一个三...

【专利技术属性】
技术研发人员:袁满张丽伟刘馗胡超陈萍吕洪艳
申请(专利权)人:东北石油大学
类型:发明
国别省市:黑龙江,23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1