【技术实现步骤摘要】
一种基于D2RQ的结构化数据知识抽取方法
[0001]本专利技术属于知识图谱
,具体涉及一种基于D2RQ的结构化数据知识抽取方法。
技术介绍
[0002]知识图谱描述知识资源及其载体,挖掘、分析和构建知识及它们之间的相互联系。在军事领域中,利用知识图谱构建分析模型,辅助支持分析决策,已经成为趋势。知识图谱的存储方式,按照现在应用比较广泛的RDF(Resource Description Framework)规范保存为三元组形式,RDF是一种资源描述语言。而执勤数据大多储存在关系数据库如Mysql中,以不同的表的形式来区分,所以需要进行转换。D2RQ是一个能够将关系数据库中的内容转换成RDF三元组的工具。
[0003]现有知识图谱构建技术在军事领域中面临着众多挑战。首先,军事知识专业性强、知识密集且数据量大,构建知识图谱存在效率低、质量难以保证等难题;其次,军事知识动态变化快,构建知识图谱需要考虑知识更新和拓展性难题;最后,D2RQ作为结构化数据自动转换为RDF数据的工具,常用于军事领域数据的知识抽取,由于无法与 ...
【技术保护点】
【技术特征摘要】
1.一种基于D2RQ的结构化数据知识抽取方法,其特征在于,包括以下步骤:步骤1,获取执勤数据知识图谱Schema信息;步骤2,连接执勤数据库;步骤3,关系表与知识图谱Schema中实体的单向映射;步骤4,关系表与实体属性、实体关系的映射;步骤5,跨表数据与实体属性的关联;步骤6,生成Mapping文件;步骤7,D2RQ自动抽取。2.根据权利要求1所述的一种基于D2RQ的结构化数据知识抽取方法,其特征在于,步骤1中执勤数据知识图谱Schema信息的获取分为引用和自定义两种方式,若选择引入的方式则直接得到知识图谱Schema,若采用自定义的方式则需要考虑具体执勤业务。3.根据权利要求1所述的一种基于D2RQ的结构化数据知识抽取方法,其特征在于,步骤3具体包括以下步骤:进行执勤数据库中的关系表与知识图谱Schema中实体的对应操作,对关系表中的列,若对应知识图谱Schema中的实体,则对该列标记为“实体”,并通过单向函数,建立该列与对应的知识图谱Schema中实体及URI标识列的映射。4.根据权利要求1所述的一种基于D2RQ的结构化数据知识抽取方法,其特征在于,步骤4具体包括以下步骤:当要生成的RDF数据来源于同一张表时,在完成步骤3后,将关系表中的列与知识图谱Schema中实体属性、实体关系进行映射;对执勤关系表中的列,若与同表中“实体”列的关系对应到知识图谱Schema中为“资源
‑
属性
‑
属性值”的关系,其中属性值是某种数据类型的值,则标记该列为“数据属性谓词”,在后续D2RQ生成的R...
【专利技术属性】
技术研发人员:李璇,王懋,叶培春,黄宏斌,刘丽华,王佳,宋伟,
申请(专利权)人:中国人民解放军国防科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。