System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种计量数据知识图谱构建平台制造技术_技高网

一种计量数据知识图谱构建平台制造技术

技术编号:40293170 阅读:7 留言:0更新日期:2024-02-07 20:43
本发明专利技术涉及一种计量数据知识图谱平台,该平台包括数据处理模块、数据分析模块、显示模块;数据处理模块,将多源异构计量证书作为数据源,从中抽取出计量逻辑实体和计量实体关系,得到结构化计量校准数据;数据分析模块,对结构化计量校准数据,进行知识消歧和文本对齐处理,去除冗余的逻辑实体名称、冗余的关联关系,将计量逻辑实体和计量实体关系,按照知识图谱的数据模型要素,构建计量知识图谱数据;显示模块,以用户关注的单个计量实体为核心,根据计量知识图谱数据,构建元图谱,再通过计量实体关系将不同的元图谱关联起来,扩展成计量知识图谱,从而实现知识图谱的可视化,基于图数据库路径的查询操作,对计量知识图谱数据进行查询。

【技术实现步骤摘要】

本专利技术属于测试评估,具体涉及一种计量数据知识图谱构建平台


技术介绍

1、信息技术的发展催生了大数据理论,计量领域在大数据时代发生变革,大数据时代计量数据应用到科研生产的各环节中,发现海量数据中的新联系、新规律创造出新价值。能够起到提质增效的作用,而现有的知识图谱技术能够将海量计量数据联系起来,更好的探寻和发掘计量数据之间的关系。

2、知识图谱是基于内容分析和信息可视化的一种可视化显示知识以及相互关系的一种图形,它已经成为当前科学计量学中比较热门的研究方法。它的目的是通过数据挖掘、分析、分类和绘图,对知识进行导航和显示。知识图谱可以帮助揭示计量数据的相互关联关系,便于挖掘计量数据中的隐藏价值。知识图谱也能用作一种方便的方式,来描述研究领域的扩散与传播,通过一系列连续的图表可以了解知识的发展过程等。图谱可为非专家提供一个领域的入口,一种从宏观和微观层面获得知识的方法。

3、然而,计量数据以证书的形式组织,数据存在碎片化,组织度低等问题,难以挖掘出计量大数据中之间的关联关系。


技术实现思路

1、本专利技术解决的技术问题是:克服现有技术的不足,构建一种计量数据知识图谱构建平台及构建方法,以实现对计量数据知识图谱的可视化展示、计量数据元图谱管理、知识图谱的计量数据查询能力,清晰明确的展示计量数据之间的关联关系。

2、本专利技术解决技术的方案是:一种计量数据知识图谱平台,该知识图谱平台包括数据处理模块、事务型数据存储模块、分析型数据存储模块、数据分析模块、显示模块;

3、数据处理模块,将多源异构计量证书作为数据源,从中抽取出计量实体及计量实体关系,得到结构化计量校准数据,并将结构化计量校准数据存储至事务型数据存储模块;

4、数据分析模块,对结构化计量校准数据,进行知识消歧和文本对齐处理,去除冗余的计量实体名称、重复的关联关系,将计量实体关系按照知识图谱的数据模型要素,构建计量知识图谱数据,将计量知识图谱数据存储至分析型数据存储模块;

5、显示模块,提供了图的绘制、布局、分析、交互、动画处理能力,以用户关注的单个计量实体为核心,根据计量知识图谱数据,构建元图谱,再通过计量实体关系将不同的元图谱关联起来,扩展成计量知识图谱,从而实现知识图谱的可视化,基于图数据库路径的查询操作,对计量知识图谱数据进行查询,对查询结果进行显示。

6、优选地,所述计量实体包括证书、计量器具、测量设备、制造厂商、委托方、溯源单位;所述计量实体关系包括认证、委托、制造、测量、来源。

7、优选地,在数据处理模块进行计量实体与计量实体关系抽取之前,将多源异构计量证书中的重复数据去除,计量证书中的重复数据包括证书无意义字段、重复证书。

8、优选地,所述数据处理模块先对多源异构的计量证书进行预处理,预处理包括:解析计量证书,提取文档类型、证书所属计量专业、计量证书格式,根据计量证书的模板对计量证书格式进行校验,如果校验全部通过,则预处理成功,按计量证书文档所属计量证书专业进行分类存储,否则,记录并反馈错误日志,预处理失败。

9、优选地,所述知识图谱的数据模型为rdf图或者属性图模型。

10、优选地,所述多源异构计量校准数据包括结构化的数据、半结构化的数据以及非结构化的数据,对于非结构化数据和半结构化数据,先将多源异构计量校准数据转换为结构化数据,再采用基于规则引擎和字典的实体抽取方法,抽取出计量实体和计量实体关系。

11、优选地,所述显示模块使用sql查询语言中的join操作,实现计量数据知识图谱的可视化及追踪召回快速查询功能。

12、优选地,所述结构化计量校准数据属于oltp型存储,用mysql工具进行访问。

13、优选地,所述计量知识元图谱数据属于olap型存储。

14、优选地,所述计量知识元图谱数据用图数据库nebula工具进行访问。

15、本专利技术与现有技术相比的有益效果是:

16、(1)、本专利技术实现了将校准证书数据组织成知识图谱形式,设计了计量大数据提取分层处理架构,以web服务的形式提供计量大数据知识图谱的展示能力。

17、(2)、本专利技术在完成数据处理和存储后,利用图谱查询语言nsql和基于spark的大数据图算法pagerank,实现了基于计量知识图谱的设备追踪召回快速查询,以及设备重要度衡量两类应用。

18、(3)、本专利技术采用基于知识图谱特征码的冗余标记方法,实现了计量证书中冗余数据的提取与去除。

本文档来自技高网...

【技术保护点】

1.一种计量数据知识图谱平台,其特征在于包括数据处理模块、事务型数据存储模块、分析型数据存储模块、数据分析模块、显示模块;

2.根据权利要求1所述的一种计量数据知识图谱平台,其特征在于所述计量实体包括证书、计量器具、测量设备、制造厂商、委托方、溯源单位;所述计量实体关系包括认证、委托、制造、测量、来源。

3.根据权利要求1所述的一种计量数据知识图谱平台,其特征在于在数据处理模块进行计量实体与计量实体关系抽取之前,将多源异构计量证书中的重复数据去除,计量证书中的重复数据包括证书无意义字段、重复证书。

4.根据权利要求1所述的一种计量数据知识图谱平台,其特征在于所述数据处理模块先对多源异构的计量证书进行预处理,预处理包括:解析计量证书,提取文档类型、证书所属计量专业、计量证书格式,根据计量证书的模板对计量证书格式进行校验,如果校验全部通过,则预处理成功,按计量证书文档所属计量证书专业进行分类存储,否则,记录并反馈错误日志,预处理失败。

5.根据权利要求1所述的一种计量数据知识图谱平台,其特征在于所述知识图谱的数据模型为RDF图或者属性图模型。

6.根据权利要求1所述的一种计量数据知识图谱平台,其特征在于所述多源异构计量校准数据包括结构化的数据、半结构化的数据以及非结构化的数据,对于非结构化数据和半结构化数据,先将多源异构计量校准数据转换为结构化数据,再采用基于规则引擎和字典的实体抽取方法,抽取出计量实体和计量实体关系。

7.根据权利要求1所述的一种计量数据知识图谱平台,其特征在于所述显示模块使用SQL查询语言中的join操作,实现计量数据知识图谱的可视化及追踪召回快速查询功能。

8.根据权利要求1所述的一种计量数据知识图谱平台,其特征在于所述结构化计量校准数据属于OLTP型存储,用Mysql工具进行访问。

9.根据权利要求1所述的一种计量数据知识图谱平台,其特征在于所述计量知识元图谱数据属于OLAP型存储。

10.根据权利要求1所述的一种计量数据知识图谱平台,其特征在于所述计量知识元图谱数据用图数据库Nebula工具进行访问。

...

【技术特征摘要】

1.一种计量数据知识图谱平台,其特征在于包括数据处理模块、事务型数据存储模块、分析型数据存储模块、数据分析模块、显示模块;

2.根据权利要求1所述的一种计量数据知识图谱平台,其特征在于所述计量实体包括证书、计量器具、测量设备、制造厂商、委托方、溯源单位;所述计量实体关系包括认证、委托、制造、测量、来源。

3.根据权利要求1所述的一种计量数据知识图谱平台,其特征在于在数据处理模块进行计量实体与计量实体关系抽取之前,将多源异构计量证书中的重复数据去除,计量证书中的重复数据包括证书无意义字段、重复证书。

4.根据权利要求1所述的一种计量数据知识图谱平台,其特征在于所述数据处理模块先对多源异构的计量证书进行预处理,预处理包括:解析计量证书,提取文档类型、证书所属计量专业、计量证书格式,根据计量证书的模板对计量证书格式进行校验,如果校验全部通过,则预处理成功,按计量证书文档所属计量证书专业进行分类存储,否则,记录并反馈错误日志,预处理失败。

5.根据权利要求1所述的一种计量数据知...

【专利技术属性】
技术研发人员:丁亦嘉陈皓一张修建弯天琪杨平孙静程中浩王永光刘弋菲杨帆
申请(专利权)人:北京航天计量测试技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1