一种基于知识图谱信息数据智能分析系统技术方案

技术编号:24091371 阅读:47 留言:0更新日期:2020-05-09 08:13
本发明专利技术属于数据检索分析技术领域,尤其为一种基于知识图谱信息数据智能分析系统,包括数据采集单元、数据处理单元、知识图谱单元和索引单元;所述数据采集单元与数据处理单元连接,用于采集与目标数据有关联的的大量相关数据;所述数据处理单元与知识图谱单元连接,用于对数据采集单元采集的大量数据进行清洗、提取和关键词分类等操作。本发明专利技术通过对大量数据进行清洗、提取和按照关键词进行分类后,可以得到有效数据,然后有效数据按照关键词生成知识图谱树状图,因此可以将有效数据清晰明了展示出,方便直接获取目标数据和与目标数据相关的数据,节省了数据检索时间,然后对数据之间的关联性进行分析,可以对目标数据的准确性进行判断。

An intelligent data analysis system based on Knowledge Map

【技术实现步骤摘要】
一种基于知识图谱信息数据智能分析系统
本专利技术涉及数据检索分析
,具体为一种基于知识图谱信息数据智能分析系统。
技术介绍
知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。它把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考。在目前的大数据时代,想要得到目标数据,需要筛选大量的无效信息,同时还需要对筛选后的信息进行不断的精简、检索后才能得到想要的目标数据,因此给目标数据的获取带来不便,本专利技术在借助知识图谱的情况下,提出一种基于知识图谱信息数据智能分析系统,可以高效性并准确的得到目标数据,并且可以分析得到与目标数据有关联的数据,从而可以及时获取到有效的目标数据,节约了数据检索时间。
技术实现思路
(一)解决的技术问题针对现有技术的不足,本专利技术提供了一种基于知识图谱信息数据智能分析系统,解决了上述
技术介绍
中提出的问题。(二)技术方案为实现上述目的,本专利技术提供如下技术方案:一种基于知识图谱信息数据智能分析系统,包括数据采集单元、数据处理单元、知识图谱单元和索引单元;所述数据采集单元与数据处理单元连接,用于采集与目标数据有关联的的大量相关数据;所述数据处理单元与知识图谱单元连接,用于对数据采集单元采集的大量数据进行清洗、提取和关键词分类等操作;所述知识图谱单元与数据处理单元连接,用于根据数据处理单元处理后的数据为样本,构建样本数据之间的连接关系树状图,通过数据关系之间关联性生成预置数据知识图谱,并将相应的数据信息储存在相应的数据知识图谱的数据枝节点下;所述索引单元与知识图谱单元连接,用于根据目标数据的关键词来检索数据知识图谱,可以得到相应的目标数据的数据枝节点。作为本专利技术的一种优选技术方案,所述数据处理单元包括数据清洗提取模块、数据分类模块和数据关键词模块;所述数据清洗提取模块用于将大量数据中的无关数据进行清洗并将有用数据提取出;所述数据分类模块用于根据数据关键词模块内置的关键词、关键词从属关系将数据进行分类;所述数据关键词模块用于设置所要得到目标数据的关键词,并将设置好关键词之间的从属关系。作为本专利技术的一种优选技术方案,所述数据清洗提取模块中设置清洗数据库,所述清洗数据库中存储有需要清洗的数据属性、来源和类型。作为本专利技术的一种优选技术方案,所述知识图谱单元包括知识图谱构建模块、知识图谱分析模块和知识图谱内容模块;所述知识图谱构建模块用于根据数据关键词模块设置关键词生成所有关于关键词的数据枝节点;并根据关键词之间的从属关系,将低等级关键词对应数据枝节点的设置在高等级关键词对应的数据枝节点之下;然后根据关键词之间的关联性来将相应的数据枝节点进行连接;最后生成初步知识图谱树状图;所述知识图谱分析模块用于根据每个数据枝节点对应的数据内容,将出现相同内容和关键词的数据枝节点之间连接,完善知识图谱树状图;所述知识图谱内容模块用于根据数据分类模块分好的数据内容按照不同关键词对应的数据枝节点将数据内容存储在每个数据枝节点下。作为本专利技术的一种优选技术方案,所述知识图谱单元还包括知识图谱精简模块,所述知识图谱精简单元用于一个高等级数据枝节点和与其对应的低等级数据之间的数据内容进行精简。作为本专利技术的一种优选技术方案,所述知识图谱单元还包括知识图谱设置模块,其用于手动修改指示图谱树状图内容、增添数据枝节点和修改数据枝节点之间的关系。作为本专利技术的一种优选技术方案,所述索引单元包括包括检索模块和分析模块;所述检索模块用于输入所要获取目标数据的关键词,然后得到关于目标数据相对应应的数据枝节点;所述分析模块用于对目标数据的数据枝节点进行分析,得到与该数据枝节点相对应的数据枝节点,并对与目标数据相关联的数据内与目标数据之间的关联性强度进行分析。(三)有益效果与现有技术相比,本专利技术提供了一种基于知识图谱信息数据智能分析系统,具备以下有益效果:该基于知识图谱信息数据智能分析系统,通过对大量数据进行清洗、提取和按照关键词进行分类后,可以得到有效数据,然后有效数据按照关键词生成知识图谱树状图,因此可以将有效数据清晰明了展示出,方便直接获取目标数据和与目标数据相关的数据,节省了数据检索时间,然后对数据之间的关联性进行分析,可以对目标数据的准确性进行判断,避免错误数据的干扰。附图说明图1为本专利技术系统原理框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例请参阅图1,本专利技术提供以下技术方案:一种基于知识图谱信息数据智能分析系统,包括数据采集单元、数据处理单元、知识图谱单元和索引单元。数据采集单元与数据处理单元连接,用于采集与目标数据有关联的的大量相关数据,本专利技术主要针对在大量数据的情况下筛选出有用的目标数据,因此目标数据主要为文本信息和一些EXCEL表格信息等,因此数据采集单元具有多种获取的数据的方式,可以通过PC、网页等方式获取大量数据,最后将数据导入进数据处理单元内即可。数据处理单元与知识图谱单元连接,用于对数据采集单元采集的大量数据进行清洗、提取和关键词分类等操作;数据处理单元包括数据清洗提取模块、数据分类模块和数据关键词模块;数据清洗提取模块用于将大量数据中的无关数据进行清洗并将有用数据提取出,数据清洗提取模块中设置清洗数据库,清洗数据库中存储有需要清洗的数据属性、来源和类型,其中清洗数据库内部的内容可以不断的完善,数据清洗提取模块主要将一些多余无用的数据信息清除掉,避免无关数据对目标数据的获取造成干扰;数据分类模块用于根据数据关键词模块内置的关键词、关键词从属关系将数据进行分类;数据关键词模块用于设置所要得到目标数据的关键词,并将设置好关键词之间的从属关系。知识图谱单元与数据处理单元连接,用于根据数据处理单元处理后的数据为样本,构建样本数据之间的连接关系树状图,通过数据关系之间关联性生成预置数据知识图谱,并将相应的数据信息储存在相应的数据知识图谱的数据枝节点下;知识图谱单元包括知识图谱构建模块、知识图谱分析模块和知识图谱内容模块;知识图谱构建模块用于根据数据关键词模块设置关键词生成所有关于关键词的数据枝节点;并根据关键词之间的从属关系,将低等级关键词对应数据枝节点的设置在高等级关键词对应的数据枝节点之下;然后根据关键词之间的关联性来将相应的数据枝节点进行连接;最后生成初步知识图谱树状图;知识图谱分析模块用于根本文档来自技高网...

【技术保护点】
1.一种基于知识图谱信息数据智能分析系统,其特征在于:包括数据采集单元、数据处理单元、知识图谱单元和索引单元;/n所述数据采集单元与数据处理单元连接,用于采集与目标数据有关联的的大量相关数据;/n所述数据处理单元与知识图谱单元连接,用于对数据采集单元采集的大量数据进行清洗、提取和关键词分类等操作;/n所述知识图谱单元与数据处理单元连接,用于根据数据处理单元处理后的数据为样本,构建样本数据之间的连接关系树状图,通过数据关系之间关联性生成预置数据知识图谱,并将相应的数据信息储存在相应的数据知识图谱的数据枝节点下;/n所述索引单元与知识图谱单元连接,用于根据目标数据的关键词来检索数据知识图谱,可以得到相应的目标数据的数据枝节点。/n

【技术特征摘要】
1.一种基于知识图谱信息数据智能分析系统,其特征在于:包括数据采集单元、数据处理单元、知识图谱单元和索引单元;
所述数据采集单元与数据处理单元连接,用于采集与目标数据有关联的的大量相关数据;
所述数据处理单元与知识图谱单元连接,用于对数据采集单元采集的大量数据进行清洗、提取和关键词分类等操作;
所述知识图谱单元与数据处理单元连接,用于根据数据处理单元处理后的数据为样本,构建样本数据之间的连接关系树状图,通过数据关系之间关联性生成预置数据知识图谱,并将相应的数据信息储存在相应的数据知识图谱的数据枝节点下;
所述索引单元与知识图谱单元连接,用于根据目标数据的关键词来检索数据知识图谱,可以得到相应的目标数据的数据枝节点。


2.根据权利要求1所述的一种基于知识图谱信息数据智能分析系统,其特征在于:所述数据处理单元包括数据清洗提取模块、数据分类模块和数据关键词模块;
所述数据清洗提取模块用于将大量数据中的无关数据进行清洗并将有用数据提取出;
所述数据分类模块用于根据数据关键词模块内置的关键词、关键词从属关系将数据进行分类;
所述数据关键词模块用于设置所要得到目标数据的关键词,并将设置好关键词之间的从属关系。


3.根据权利要求2所述的一种基于知识图谱信息数据智能分析系统,其特征在于:所述数据清洗提取模块中设置清洗数据库,所述清洗数据库中存储有需要清洗的数据属性、来源和类型。


4.根据权利要求2所述的一种基于知识图谱信息数据智能分析系统,其特征在于:所述知识图谱单元包括知识图谱构建模块...

【专利技术属性】
技术研发人员:袁义
申请(专利权)人:湖南工业大学
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1