一种基于语义网的安全数据语义分析方法及系统技术方案

技术编号:15289797 阅读:51 留言:0更新日期:2017-05-10 16:51
本发明专利技术公开了一种基于语义网的安全数据语义分析方法及系统,方法包括:对设定的目标系统进行监控和数据采集,获取系统分析所需的安全数据;对采集获得的安全数据进行预处理,得到预处理数据;根据预处理数据,对其进行语义化处理,并生成得到数据语义图;根据数据语义图,对其进行数据分析操作,得出数据分析结果;根据数据分析结果,对其进行可视化展示。系统包括采集模块、预处理模块、语义化模块、数据分析模块和展示模块。本发明专利技术将本体模型建模过程进行形式化定义与说明,使得语义网应用构建本体模型的过程更为直观,为语义网应用的构建提供参考。本发明专利技术可广泛应用于语义网技术中。

Method and system for semantic analysis of security data based on Semantic Web

The invention discloses a safety data semantic based on semantic web analysis method and system. The method includes: monitoring and data acquisition system of target setting, safety data acquisition system for analysis of security; data acquisition for pretreatment, get data pretreatment; according to the processed data, the the semantic processing, and generate data according to the data semantic graph; semantic map, data analysis of its operation, the results of data analysis; according to the results of data analysis, the visual display. The system comprises a collection module, a preprocessing module, a semantic module, a data analysis module and a display module. The invention defines and explains the modeling process of the ontology model, which makes the process of constructing the ontology model of the semantic web more intuitive, and provides reference for the construction of the semantic web application. The invention can be widely used in semantic web technology.

【技术实现步骤摘要】

本专利技术涉及计算机
,尤其涉及一种基于语义网的安全数据语义分析方法及系统
技术介绍
智能设备的普及,让更多的用户通过设备中的浏览器或者应用程序接入移动互联网使得传统互联网的数据与信息呈现爆发性增长的趋势,海量的数据一方面为用户查阅、检索。利用信息更为便捷,结果更为准确。却也给机器对信息的直接处理提供了很大的压力。对于人们可读易理解的现实中的很多信息,机器却难以进行直接处理。为了将现实中的大量异构信息转化为机器易理解的信息,以提高机器的数据分析及信息处理效率。我们基于信息的特征属性以及语义属性将属于同一领域或不同领域的数据进行关联,通过数据个体以及信息间的关联关系能使机器更好理解数据的语义以及内在关联,让系统可以更好地全局层面对信息进行分析。语义网技术正是为网络数据语义化及知识关联提供解决方案。T.Beerners-Lee在1998初次提出的一个概念,相较于数据分离的传统互联网,语义网是一种不仅能够理解数据词语和概念,还能获取数据间内在联系逻辑关系的智能网络,通过给万维网的文档添加可被及其识别理解的数据描述性语言“元数据”,是整个互联网构成一个基于关系网络的更有效率以及价值的信息交换中心。语义网技术最大的价值在于用户或计算机能利用语义网构建的智能软件接口,在海量的Web信息资源中获取更多的更有关联关系的检索结果,使得网络中的一个个信息孤岛进行关联成为更为整体的数据库。然而,现在的语义网技术具有以下问题:缺乏形式化本体建模的流程,对本体模型建模过程描述模糊,难以建立基础的领域本体模型从而构建语义网应用;语义网应用缺少整合内置模型搜索子系统(关键词搜索与特定检索语言搜索),难以对已建立本体模型进行信息检索;语义网应用缺少对Jena推理机子系统的应用,难以对知识进行再挖掘与发现;大多数安全环境评估软件收集信息来源单一,数据之间彼此独立,不能讲安全信息有效整合从而在总体上对环境进行评估;现有很多应用内置搜索引擎停留在关键词搜索阶段,难以发现系统内部数据语义含义及联系,搜索结果准确度欠佳;大多数语义网应用构建的本体模型采用RDF/XML进行描述,虽然此种描述形式对机器友好,可是用户难以读懂,无法总体把握应用数据处理结果。
技术实现思路
为了解决上述技术问题,本专利技术的目的是提供一种方便对知识二次发现,且构建过程直观的一种基于语义网的安全数据语义分析方法及系统。本专利技术所采取的技术方案是:一种基于语义网的安全数据语义分析方法,包括以下步骤:对设定的目标系统进行监控和数据采集,获取系统分析所需的安全数据;对采集获得的安全数据进行预处理,得到预处理数据;根据预处理数据,对其进行语义化处理,并生成得到数据语义图;根据数据语义图,对其进行数据分析操作,得出数据分析结果;根据数据分析结果,对其进行可视化展示。作为所述的一种基于语义网的安全数据语义分析方法的进一步改进,所述的安全数据包括半结构化异构源数据和非结构化异构源数据。作为所述的一种基于语义网的安全数据语义分析方法的进一步改进,所述的对采集获得的安全数据进行预处理,得到预处理数据,这一步骤具体包括:对采集获得的安全数据进行特征属性提取;构建基础的本体模型;对安全数据进行分类,得到安全概念类数据和数值属性类数据,即预处理数据。作为所述的一种基于语义网的安全数据语义分析方法的进一步改进,所述的根据预处理数据,对其进行语义化处理,并生成得到数据语义图,这一步骤包括:对预处理数据进行概念实例化处理,完成本体模型的建立;通过Notation3语言和RDF框架对安全本体原始模型进行描述,生成得到数据语义图。作为所述的一种基于语义网的安全数据语义分析方法的进一步改进,所述的概念实例化处理包括安全概念类实例化处理和数值属性类实例化处理。作为所述的一种基于语义网的安全数据语义分析方法的进一步改进,所述的安全概念类实例化处理包括:初始化本体模型的实例集为空;判断本体模型是否还有未实例化的安全概念类数据,若是,则获得待实例化的安全概念类数据并执行下一步骤;初始化每个待实例化的安全概念类数据的实例集为空;从安全数据库中获得待实例化的安全概念类数据对应的源数据集;若安全数据库中存有待实例化的安全概念类数据的集合,则对待实例化的安全概念类数据进行实例化,获取待实例化的安全概念类数据中每个实例化个体的名称Name和标识ID,然后将Name和ID作为参数调用实例化函数,创建安全概念类的一个实例化个体,并将每个实例化个体添加到安全概念类的实例集中;将每个概念类实例集添加到模型数据集以及本体模型中。作为所述的一种基于语义网的安全数据语义分析方法的进一步改进,所述的数值属性类实例化处理包括:判断安全概念类对应的实例集是否有下一个数值属性类数据中未实例化的实例个体,若是,则获取对应安全概念类关联的数值属性集,初始化实例个体待实例化的数值属性集,并执行下一步骤;当实例个体的数值属性集中还有未被实例化的数值属性,则从本体模型中获得指定名称的数值属性类,然后从数据库中的概念类数据表中,获得数值属性对应列的数据值,并以实例个体为主体,实例属性为谓词,属性值为客体创建新的数据描述语句,最后将新建语句加入本体模型以及描述语句集。本专利技术所采用的另一技术方案是:一种基于语义网的安全数据语义分析系统,包括:采集模块,用于对设定的目标系统进行监控和数据采集,获取系统分析所需的安全数据;预处理模块,用于对采集获得的安全数据进行预处理,得到预处理数据;语义化模块,用于根据预处理数据,对其进行语义化处理,并生成得到数据语义图;数据分析模块,用于根据数据语义图,对其进行数据分析操作,得出数据分析结果;展示模块,用于根据数据分析结果,对其进行可视化展示。作为所述的一种基于语义网的安全数据语义分析系统的进一步改进,所述预处理模块包括:特征提取模块,用于对采集获得的安全数据进行特征属性提取;模型构建模块,用于构建基础的本体模型;数据分类模块,用于对安全数据进行分类,得到安全概念类数据和数值属性类数据,即预处理数据。作为所述的一种基于语义网的安全数据语义分析系统的进一步改进,所述语义化模块包括:实例化模块,用于对预处理数据进行概念实例化处理,完成本体模型的建立;语义图生成模块,用于通过Notation3语言和RDF框架对安全本体原始模型进行描述,生成得到数据语义图。本专利技术的有益效果是:本专利技术一种基于语义网的安全数据语义分析方法及系统将本体模型建模过程进行形式化定义与说明,使得语义网应用构建本体模型的过程更为直观,为语义网应用的构建提供参考。而且本专利技术能通过语义化的方法对数据进行关联分析,使得信息资产相同的实体相关联,可以实现边数据分析边去数据冗余。进一步,本专利技术将数据语义化获得的结果以数据图的形式呈现而不是像XML描述以树的形式呈现,数据语义图更易于数据节点的拼接,易于拓展并且更直观地揭示数据之间的关联关系。附图说明下面结合附图对本专利技术的具体实施方式作进一步说明:图1是本专利技术一种基于语义网的安全数据语义分析方法的步骤流程图;图2是本专利技术一种基于语义网的安全数据语义分析方法中预处理的步骤流程图;图3是本专利技术一种基于语义网的安全数据语义分析方法中语义化的步骤流程图;图4是本专利技术一种基于语义网的安全数据语义分析方系统的模块方框图。具体本文档来自技高网
...
一种基于语义网的安全数据语义分析方法及系统

【技术保护点】
一种基于语义网的安全数据语义分析方法,其特征在于,包括以下步骤:对设定的目标系统进行监控和数据采集,获取系统分析所需的安全数据;对采集获得的安全数据进行预处理,得到预处理数据;根据预处理数据,对其进行语义化处理,并生成得到数据语义图;根据数据语义图,对其进行数据分析操作,得出数据分析结果;根据数据分析结果,对其进行可视化展示。

【技术特征摘要】
1.一种基于语义网的安全数据语义分析方法,其特征在于,包括以下步骤:对设定的目标系统进行监控和数据采集,获取系统分析所需的安全数据;对采集获得的安全数据进行预处理,得到预处理数据;根据预处理数据,对其进行语义化处理,并生成得到数据语义图;根据数据语义图,对其进行数据分析操作,得出数据分析结果;根据数据分析结果,对其进行可视化展示。2.根据权利要求1所述的一种基于语义网的安全数据语义分析方法,其特征在于:所述的安全数据包括半结构化异构源数据和非结构化异构源数据。3.根据权利要求1所述的一种基于语义网的安全数据语义分析方法,其特征在于:所述的对采集获得的安全数据进行预处理,得到预处理数据,这一步骤具体包括:对采集获得的安全数据进行特征属性提取;构建基础的本体模型;对安全数据进行分类,得到安全概念类数据和数值属性类数据,即预处理数据。4.根据权利要求3所述的一种基于语义网的安全数据语义分析方法,其特征在于:所述的根据预处理数据,对其进行语义化处理,并生成得到数据语义图,这一步骤包括:对预处理数据进行概念实例化处理,完成本体模型的建立;通过Notation3语言和RDF框架对安全本体原始模型进行描述,生成得到数据语义图。5.根据权利要求4所述的一种基于语义网的安全数据语义分析方法,其特征在于:所述的概念实例化处理包括安全概念类实例化处理和数值属性类实例化处理。6.根据权利要求5所述的一种基于语义网的安全数据语义分析方法,其特征在于:所述的安全概念类实例化处理包括:初始化本体模型的实例集为空;判断本体模型是否还有未实例化的安全概念类数据,若是,则获得待实例化的安全概念类数据并执行下一步骤;初始化每个待实例化的安全概念类数据的实例集为空;从安全数据库中获得待实例化的安全概念类数据对应的源数据集;若安全数据库中存有待实例化的安全概念类数据的集合,则对待实例化的安全概念类数据进行实例化,获取待实例化的安全概念类数据中每个实例化个体的名称Name和标识...

【专利技术属性】
技术研发人员:赵淦森林晓健张海明任雪琦吴杰超陈梓豪王欣明聂瑞华胡波廖智锐
申请(专利权)人:华南师范大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1