一种面向智能应用的领域本体构建方法技术

技术编号:20566659 阅读:27 留言:0更新日期:2019-03-14 09:27
本发明专利技术公开了一种面向智能应用的领域本体构建方法,首先获取智能应用相关的多领域数据;明确并细化智能应用需求,构建面向本体的智能应用需求分析模型;定义本体中概念及其属性、各类型关系,创建实例,进行形式化编码;然后利用Jena实现基于领域本体的推理以补全缺失信息;接着运用多维量化指标评估本体的体系结构,判断是否返回以修正本体;最后评估本体对智能应用需求的支持程度,动态更新体系结构以响应应用需求的变化,直到所构建的本体能够满足应用需求。本发明专利技术采用循环式的开发结构,强调本体全生命周期内智能应用需求与跨领域本体构建的相互作用,适用于表示面向智能应用的跨领域知识关联,解决现有本体构建方法不足以支撑智能应用的问题。

A Domain Ontology Construction Method for Intelligent Applications

The invention discloses a domain ontology construction method for intelligent application, which firstly obtains multi-domain data related to intelligent application; clarifies and refines the requirements of intelligent application, builds an ontology-oriented demand analysis model for intelligent application; defines the concepts and attributes of ontology, various types of relationships, creates examples, and carries out formal coding; and then realizes domain ontology-based coding by Jena. Reasoning is used to complete the missing information; then multi-dimensional quantitative indicators are used to evaluate the ontology architecture and determine whether to return to correct the ontology; finally, the support degree of ontology for intelligent application needs is evaluated, and the architecture is updated dynamically to respond to the change of application needs until the ontology can meet the application needs. The invention adopts a circular development structure, emphasizes the interaction between intelligent application requirements and cross-domain ontology construction in the whole life cycle of ontology, is suitable for representing cross-domain Knowledge Association for intelligent application, and solves the problem that the existing ontology construction method is insufficient to support intelligent application.

【技术实现步骤摘要】
一种面向智能应用的领域本体构建方法
本专利技术属于计算机应用
,具体涉及一种面向智能应用的领域本体构建方法。
技术介绍
随着人工智能热潮的复兴,各种领域应用的智能化进程加快。智能应用的实现基础是对领域知识全面而准确的表示,以便于机器处理和理解领域知识。因而,如何增强知识表示对智能应用的支撑能力,是智能领域的重要研究课题。本体是对共享概念模型明确的形式化的规范说明,是表示能力强、机器可理解且支持推理的知识共享工具,能够为智能应用的实现提供良好的概念基础,因而在语义网、知识工程、人工智能等热门领域得到广泛研究。现有的本体构建方法分为手动构建、半自动构建、自动构建三类,主要区别是领域专家人工介入的程度、机器从文本中自动抽取的程度,仅依赖专家归纳领域知识的方法成本高且本体规模受限,仅依赖机器抽取概念及其关系的方法缺乏成熟的技术体系且本体质量难以保证,因而,能够兼顾人工的准确性与机器的大规模化的半自动构建方法最为实用。半自动的本体构建工程思想主要包括七步法和循环获取法:七步法细化构建本体的具体步骤并附有可行的操作说明,包括:确定本体的专业领域和范畴、考查复用现有本体的可能性、列出本体中重要术语、定义类及其等级体系、定义类的属性、定义属性的分面、创建实例,但缺少本体评估以及基于此的本体优化;循环获取法采用循环式开发结构,分为选择数据源、概念学习、领域聚焦、关系学习、本体评估五部分,其中评估可指导概念与关系的学习,有利于不断改进和扩展本体,但各环节没有详尽的操作方法。分析可知,现有的本体构建方法忽略了智能应用对本体构建的驱动作用,以及本体对智能应用的支撑能力,无法保证所构建的本体能落地并满足最终的应用需求。首先,构建过程中需求分析过于简化,范畴确定或资源选择均不能全面表示出智能应用的丰富内涵,更不能量化应用需求以便机器理解与实现。相应地,评估环节难以准确衡量本体与智能应用需求的契合度,无法根据评估结果优化本体的应用功能,更不能动态更新体系结构以响应应用需求的变化。此外,现有方法均侧重于概念的选取及其体系结构的建立,且多以概念的层次结构为主线来组织领域知识,非分类关系数量少且在本体架构中的作用弱,所构建的本体能较好地反映静态的知识体系但难以描述复杂的知识关联,而智能应用的实现更需要从关联知识中发现规律、把握态势,仅依靠层次关系是难以实现的。具体到反诈骗领域,传统方法基于黑名单或业务规则进行简单的过滤与拦截,难以应对复杂多变的诈骗手法。如何实现反诈智能化,即从诈骗通话内容中挖掘诈骗流程、发现诈骗团伙,从而语义识别诈骗电话、把握诈骗全局态势,是该领域的研究热点与应用需求。然而,反诈骗领域以电话通信为核心但其知识边界随着诈骗所利用的背景信息不断变化,并且交叉领域的知识关联复杂,要求建模中对通话内容及其他多源数据进行关联,提高诈骗电话识别的准确率和可信度,同时对诈骗全局态势进行分析与知识推理以支持反诈骗智能决策。因此,本专利技术将面向智能应用的领域本体构建方法引入反诈骗领域,进一步验证本专利技术对智能应用领域知识表示的适用性。
技术实现思路
为了解决上述技术问题,本专利技术提出了一种面向智能应用的领域本体构建方法,强调本体全生命周期内智能应用需求与跨领域本体构建的相互作用,解决上述本体构建方法不足以支持智能应用的问题。本专利技术所采用的技术方案是:一种面向智能应用的领域本体构建方法,其特征在于,包括以下步骤:步骤1:获取并融合智能应用相关的多领域原始数据;步骤2:明确并细化智能应用需求,分析具体应用在本体层的实现路径,构建面向本体的领域需求分析模型,并将应用需求向量化,获得应用需求词向量;步骤3:基于智能应用对领域本体的多维要求,从数据中抽取并定义概念及其属性、各种关系,创建实例,并进行形式化编码;步骤4:实现基于领域本体的推理,发现并补充本体中隐含信息;步骤5:评估本体的体系结构,综合运用多维量化指标,若在指定阈值内则继续下述步骤6,否则退回到上述步骤3;步骤6:评估本体对智能应用需求的支持程度,首先判断智能应用需求是否发生变化;有变化则回转执行上述步骤2,重新分析需求内涵并创建新的领域需求分析模型;无变化则转化领域本体为词向量,计算其与应用需求词向量的相似度,若在指定阈值内则输出最优的领域本体,否则循环进行步骤3到6,直到所构建的本体能够满足应用需求。作为优选,步骤1中,分析智能应用实现所涉及的所有交叉领域,获取相关的多源异构数据,分别针对结构化、半结构化、非结构化数据进行处理与融合,并统一为便于交换的JSON格式。作为优选,步骤2中,依据实际的领域数据,明确智能应用需求的具体内涵,建立面向本体的领域需求分析模型,包括在应用功能、体系结构、推理性能上对本体的具体要求,通过word2vec将非结构化的需求表述转化需求向量V1。作为优选,步骤3中,基于应用需求模型抽取并定义本体中概念及其层次关系,定义概念的属性及其限制,定义概念间关系及其限制,最后创建实例,使本体对应于智能应用的实现路径,利用本体编辑工具Protégé实现基于OWL的编码。作为优选,步骤4中,结合智能应用的逻辑需求自定义推理规则,利用Jena进行本体推理以补全领域本体中缺失的属性、关系信息,完善本体的逻辑结构与推理性能。作为优选,步骤5中,综合评估领域本体的体系结构、与应用需求的契合度,且评估结果将进一步引导本体进行优化迭代以满足智能应用需求,同时动态更新体系结构以响应应用需求的变化,形成领域本体构建的完整循环。作为优选,步骤5中,衡量本体结构的量化指标、智能应用需求是否发生变化、领域本体词向量V2与应用需求词向量V1的Cosine相似度即为三个是否需要循环的依据:若在指定阈值内则继续下一步或输出最终的本体,若应用需求发生变化则返回需求分析环节,重新明确需求内涵并创建新的领域需求分析模型,否则返回本体构建环节,修正概念及其属性、关系直到所构建的本体能够满足应用需求。本专利技术具有以下两个特点:1、采用循环式的开发结构,智能应用需求贯穿于本体构建的全生命周期,前期建立面向本体的领域需求分析模型,指导本体中概念及其关系的定义,后期评估本体对智能应用需求的支持程度,并能响应应用需求的变化,驱动本体不断迭代优化,最终所构建的本体更容易满足应用需求;2、适用于跨领域本体的构建,为智能应用的实现提供充分的知识关联,多源异构数据的梳理与融合、突出概念间各类关系的构建、基于应用逻辑的自定义推理规则等均打破领域的限制,以智能应用需求为核心而非以概念的层次结构为主线来组织领域知识。附图说明图1是本专利技术实施例的流程图,为“需求+构建+评估”循环式结构,本体构建的全生命周期内智能应用需求起到不同作用。具体实施方式为了便于本领域普通技术人员理解和实施本专利技术,下面结合附图及实施例对本专利技术作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本专利技术,并不用于限定本专利技术。本专利技术采用“需求+构建+评估”循环式结构,先分析智能应用对本体构建的要求,再依据五个步骤进行具体建模并突出各类关系的定义,最后从体系结构与应用功能两方面进行评估,尤其衡量领域本体对智能应用的支持程度,若评估结果不在阈值内则启动循环,或分析应用需求的动态变化,或修正本体概念及其关系。如图1的流程图所示,本专利技术提供的一种面本文档来自技高网
...

【技术保护点】
1.一种面向智能应用的领域本体构建方法,其特征在于,包括以下步骤:步骤1:获取并融合智能应用相关的多领域原始数据;步骤2:明确并细化智能应用需求,分析具体应用在本体层的实现路径,构建面向本体的领域需求分析模型,并将应用需求向量化,获得应用需求词向量;步骤3:基于智能应用对领域本体的多维要求,从数据中抽取并定义概念及其属性、各种关系,创建实例,并进行形式化编码;步骤4:实现基于领域本体的推理,发现并补充本体中隐含信息;步骤5:评估本体的体系结构,综合运用多维量化指标,若在指定阈值内则继续下述步骤6,否则退回到上述步骤3;步骤6:评估本体对智能应用需求的支持程度,首先判断智能应用需求是否发生变化;有变化则回转执行上述步骤2,重新分析需求内涵并创建新的领域需求分析模型;无变化则转化领域本体为词向量,计算其与应用需求词向量的相似度,若在指定阈值内则输出最优的领域本体,否则循环进行步骤3到步骤6,直到所构建的本体能够满足应用需求。

【技术特征摘要】
1.一种面向智能应用的领域本体构建方法,其特征在于,包括以下步骤:步骤1:获取并融合智能应用相关的多领域原始数据;步骤2:明确并细化智能应用需求,分析具体应用在本体层的实现路径,构建面向本体的领域需求分析模型,并将应用需求向量化,获得应用需求词向量;步骤3:基于智能应用对领域本体的多维要求,从数据中抽取并定义概念及其属性、各种关系,创建实例,并进行形式化编码;步骤4:实现基于领域本体的推理,发现并补充本体中隐含信息;步骤5:评估本体的体系结构,综合运用多维量化指标,若在指定阈值内则继续下述步骤6,否则退回到上述步骤3;步骤6:评估本体对智能应用需求的支持程度,首先判断智能应用需求是否发生变化;有变化则回转执行上述步骤2,重新分析需求内涵并创建新的领域需求分析模型;无变化则转化领域本体为词向量,计算其与应用需求词向量的相似度,若在指定阈值内则输出最优的领域本体,否则循环进行步骤3到步骤6,直到所构建的本体能够满足应用需求。2.根据权利要求1所述的面向智能应用的领域本体构建方法,其特征在于:步骤1中,分析智能应用实现所涉及的所有交叉领域,获取相关的多源异构数据,分别针对结构化、半结构化、非结构化数据进行处理与融合,并统一为便于交换的JSON格式。3.根据权利要求1所述的面向智能应用的领域本体构建方法,其特征在于:步骤2中,依据实际的领域数据,明确智能应用需求的具体内涵,建立面向本体的领域需求分析模型,包括在应用功能、体系结构、推理性能...

【专利技术属性】
技术研发人员:张震缪亚男马欢陆伟洪亮邓诗琦
申请(专利权)人:国家计算机网络与信息安全管理中心武汉大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1