一种领域本体自动构建的方法技术

技术编号:35410491 阅读:26 留言:0更新日期:2022-11-03 11:06
本发明专利技术公开了一种领域本体自动构建的方法,具体包括如下构建步骤:将公共知识库的原始数据加载到本地数据库;确定本体指定的专业领域和范畴;使指定领域的数据被抽取出来单独建立数据表;列出本体涉及领域中的重要术语;概念的规范化处理;确定领域的概念及概念间的关系构建本体,本发明专利技术通过确定领域本体的专业领域和范畴能够在十分庞大的知识领域中明确本体建立的专业领域、范围和应用目标,有助于对本体模型的范围作一个限定,有利于复杂系统的实现,使得本体在创建后,能够在其对应的方面发挥处充分的作用,通过将公共知识库的原始数据加载到本地数据库,实现了从维基百科抽取领域知识来实现本体的自动构建。领域知识来实现本体的自动构建。领域知识来实现本体的自动构建。

【技术实现步骤摘要】
一种领域本体自动构建的方法


[0001]本专利技术涉及本体构建
,具体为一种领域本体自动构建的方法。

技术介绍

[0002]领域本体是描述指定领域知识的一种专门本体,它给出了领域实体概念及相互关系领域活动以及该领域所具有的特性和规律的一种形式化描述,近年来,本体的概念被越来越多的应用于计算机知识工程领域,用于对客观世界的存在进行系统化描述,方便知识的重用和交互,人们已经从不同的角度和方面为本体论概念进行了定义,虽然不同研究者对本体有不同的描述,但是从内涵上来看,他们都是把本体当作某个领域内不同主体之间进行交流的一种语义基础,即由本体提供明确定义的词汇表,描述概念和概念之间的关系,作为使用者之间达成的共识,因此,本体的用途包括交流、共享、互操作、重用等,总而言之,本体的目标是获取、描述和表示相关领域的知识,提供对该领域知识的共同理解,确定领域内共同认可的词汇,并从不同层次的形式化模式上给出了这些词汇和词汇间相互关系的明确定义,从而能够描述领域内部甚至更广范围内的一些概念和概念之间的联系,使得这些概念和联系在共享的范围内有着明确唯一的解释,这样人、系统之间就可以进行交流;但是,目前在创建领域本体的过程中,一般选择复用已有的本体,且通过选择复用已有的本体,方便获得领域知识以及概念关系,但是目前很少有现存的不经修改就能被复用的本体,并且在许多领域没有可供利用的本体资源,从而导致无已有本体来进行使用,以及在本体复用过程中,也会出现不同本体之间格式匹配的问题。

技术实现思路

[0003]本专利技术提供一种领域本体自动构建的方法,可以有效解决上述
技术介绍
中提出目前很少有现存的不经修改就能被复用的本体,并且在许多领域没有可供利用的本体资源,从而导致无已有本体来进行使用,以及在本体复用过程中,也会出现不同本体之间格式匹配的问题。
[0004]为实现上述目的,本专利技术提供如下技术方案:一种领域本体自动构建的方法,具体包括如下构建步骤:S1、将公共知识库的原始数据加载到本地数据库;S2、确定本体指定的专业领域和范畴;S3、使指定领域的数据被抽取出来单独建立数据表;S4、列出本体涉及领域中的重要术语;S5、概念的规范化处理;S6、确定领域的概念及概念间的关系构建本体。
[0005]根据上述技术方案,所述S1中,将公共知识库的原始数据加载到本地数据库主要是指将公共知识库网站下载的数据加载到本地的数据库,而该公共知识库网站主要为维基百科网站。
[0006]根据上述技术方案,在S1中,通过将原始数据加载到本地数据库方便获得领域知识以及概念关系,使得本体构建有一个很好的起点。
[0007]根据上述技术方案,所述S2中,确定本体指定的专业领域和范畴具体指在建立本体前必须先确定本体将覆盖的专业领域、范围和应用目标;领域知识往往十分庞大的,本体不可能包括所有的概念,不同的应用领域,领域概念肯定是不同的,即使是同一个领域,由于应用的不同,本体表示的概念的侧重点肯定也会有所不同,因此,需要在建立本体之前明确本体建立的领域和应用目标。
[0008]根据上述技术方案,在S2中,在确定本体的专业领域和范畴时,因本体是一个复杂的知识体系,因此,通过确定每个阶段的范围和目标有助于对本体模型的范围作一个限定,有利于复杂系统的实现。
[0009]根据上述技术方案,所述S3中,使指定领域的数据被抽取出来单独建立数据表主要是指根据指定的领域名称,从各个数据表中抽取与此专业领域相关的数据,并加载到新的数据表,同时使新的数据表结构与原始数据表的结构基本一致。
[0010]根据上述技术方案,所述S4中,列出本体涉及领域中的重要术语具体指要列举出该领域中的所有概念以及对该概念的详细解释,特定领域,这些概念就是与领域相关的专业术语,把领域中一些重要术语列举出来,有利于更好地理解本体建立的目标,明确方向;领域本体是描述概念以及概念与概念之间的关系,除此之外,针对每个概念,要列出它所有可能的属性,每个属性都有对应的属性值。
[0011]根据上述技术方案,所述S5中,概念的规范化处理主要是指定义分类概念和概念分类层次,在具体处理时,主要通过概念分类层次来将领域概念进行分类组织,用于描述领域概念间的类属关系,并将本体中的概念模块化,建立一个分类概念的层次结构;建立领域概念的分类关系后,将分类概念的属性值添加到分类概念中,这样就把领域概念通过树形结构形象地描述出来,并且通过树结构清晰地体现了领域概念间的类属关系,每一个子树都对应着领域中独立的、模块化的知识模型。
[0012]根据上述技术方案,在S5中,一般领域概念分类层次对应着一棵树,树中的节点体现了领域概念间的层次结构关系;领域分类概念主要包括:概念名称,语义描述,该概念可能的同义词、缩略语,定义分类概念,就是对这些信息进行描述,同时,要对所建立的概念分类层次进行检验,保证没有重复的概念,防止冗余定义。
[0013]根据上述技术方案,所述S6中,确定领域的概念及概念间的关系构建本体主要是指概念的分类层次结构体现了分类概念之间的继承关系,除了继承关系,在构建的领域本体中还可以根据需要来定义其他的关系,但是在领域本体中,概念和概念之间主要通过关系来交互,因此,通过抽取概念与概念之间的关系来构建本体。
[0014]与现有技术相比,本专利技术的有益效果:本专利技术结构科学合理,使用安全方便:1、通过确定领域本体的专业领域和范畴能够在十分庞大的知识领域中明确本体建立的专业领域、范围和应用目标,有助于对本体模型的范围作一个限定,有利于复杂系统的实现,使得本体在创建后,能够在其对应的方面发挥处充分的作用。
[0015]2、通过将公共知识库的原始数据加载到本地数据库,实现了从维基百科抽取领域知识来实现本体的自动构建,并且,通过抽取原始数据,在处理海量数据方面提出了新的思
路,解决了数据量庞大影响主体创建的问题。
[0016]3、通过列出本体涉及领域中的重要术语方便列举出该领域中的所有概念以及对该概念的详细解释,从而便于在特定领域,寻找出与领域相关的专业术语,并且通过把领域中一些重要术语列举出来,更有利于更好地理解本体建立的目标,以及明确本体创建的方向。
[0017]4、通过定义分类概念和概念分类层次,方便描述领域概念之间的类属关系,并将本体中的概念模块化,以此便于快速的建立一个分类概念的层次结构,方便把领域概念通过树形结构形象地描述出来,进一步通过树结构便于更为清晰地体现领域概念间的类属关系,方便后续通过抽取概率间的关系来构建本体;并且,在定义分类概念时,通过对建立的概念分类层次进行检验,以此来保证没有重复的概念,从而防止冗余定义。
附图说明
[0018]附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。
[0019]在附图中:图1是本专利技术本体构建方法的步骤流程图。
具体实施方式
[0020]以下结合附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的优选实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种领域本体自动构建的方法,其特征在于:具体包括如下构建步骤:S1、将公共知识库的原始数据加载到本地数据库;S2、确定本体指定的专业领域和范畴;S3、使指定领域的数据被抽取出来单独建立数据表;S4、列出本体涉及领域中的重要术语;S5、概念的规范化处理;S6、确定领域的概念及概念间的关系构建本体。2.根据权利要求1所述的一种领域本体自动构建的方法,其特征在于:所述S1中,将公共知识库的原始数据加载到本地数据库主要是指将公共知识库网站下载的数据加载到本地的数据库,而该公共知识库网站主要为维基百科网站。3.根据权利要求2所述的一种领域本体自动构建的方法,其特征在于:在S1中,通过将原始数据加载到本地数据库方便获得领域知识以及概念关系,使得本体构建有一个很好的起点。4.根据权利要求1所述的一种领域本体自动构建的方法,其特征在于:所述S2中,确定本体指定的专业领域和范畴具体指在建立本体前必须先确定本体将覆盖的专业领域、范围和应用目标;领域知识往往十分庞大的,本体不可能包括所有的概念,不同的应用领域,领域概念肯定是不同的,即使是同一个领域,由于应用的不同,本体表示的概念的侧重点肯定也会有所不同,因此,需要在建立本体之前明确本体建立的领域和应用目标。5.根据权利要求4所述的一种领域本体自动构建的方法,其特征在于:在S2中,在确定本体的专业领域和范畴时,因本体是一个复杂的知识体系,因此,通过确定每个阶段的范围和目标有助于对本体模型的范围作一个限定,有利于复杂系统的实现。6.根据权利要求1所述的一种领域本体自动构建的方法,其特征在于:所述S3中,使指定领域的数据被抽取出来单独建立数据表主要是指根据指定的领域名称,从各个数据表中抽取与此专业领域相关的数据,并加载到新的数据表,同时使新的数据表结构与原始数据表的结构基本一致。7.根据权利要...

【专利技术属性】
技术研发人员:徐鑫刘文海李疏
申请(专利权)人:南京莱科智能工程研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1