PDF文档与知识图谱融合方法、装置、设备及存储介质制造方法及图纸

技术编号:41133139 阅读:23 留言:0更新日期:2024-04-30 18:03
本发明专利技术公开了一种PDF文档与知识图谱融合方法、装置、设备及存储介质,属于知识图谱技术领域。本发明专利技术通过获取待融合PDF文档和目标知识图谱;根据所述目标知识图谱确定目标图谱本体构建和实体节点数据;根据所述目标图谱本体构建确定所述待融合PDF文档的实体节点关系信息;根据所述实体节点关系信息、所述实体节点数据和所述待融合PDF文档生成融合知识图谱。通过这种方式,实现了基于对目标知识图谱的数据提取和分析,然后将待融合PDF文档的数据格式与目标知识图谱进行实体节点对应,从而生成新的融合知识图谱,实现知识图谱和PDF文档的多模态同步知识阅读功能,并且在保证信息不存在缺失和不完整的情况下进行完整的信息和数据融合。

【技术实现步骤摘要】

本专利技术涉及知识图谱,尤其涉及一种pdf文档与知识图谱融合方法、装置、设备及存储介质。


技术介绍

1、pdf(portable document format的简称,意为“便携式文档”),是由adobesystems用于与应用程序、操作系统、硬件无关的方式进行文件交流所发展出的文件格局。知识图谱(knowledge graph)是基于数据,形象地展示整体知识关系的一种知识系统。利用可视化的渲染技术将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。

2、随着人工智能技术的爆发、大数据技术和通用领域知识图谱技术的成熟,知识图谱开始向垂直领域渗透,开发赋能千行百业智能化升级。基于pdf文档表达的专业知识文档构建知识图谱时,现有的知识图谱系统无法将文档中的公式、表格等类型的数据转化成对应的知识图谱节点关系,存在信息缺失,知识表达不完成的问题。

3、上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。


技术实现思路>

1、本文档来自技高网...

【技术保护点】

1.一种PDF文档与知识图谱融合方法,其特征在于,所述PDF文档与知识图谱融合方法包括:

2.如权利要求1所述的PDF文档与知识图谱融合方法,其特征在于,所述根据所述目标图谱本体构建确定所述待融合PDF文档的实体节点关系信息,包括:

3.如权利要求2所述的PDF文档与知识图谱融合方法,其特征在于,所述根据所述标签关系将各定义本体构建标签进行关联,得到图本体构建文件,包括:

4.如权利要求2所述的PDF文档与知识图谱融合方法,其特征在于,所述根据所述图本体构建文件和所述待融合PDF文档的文本内容信息确定所述待融合PDF文档的实体节点关系信息,包括:...

【技术特征摘要】

1.一种pdf文档与知识图谱融合方法,其特征在于,所述pdf文档与知识图谱融合方法包括:

2.如权利要求1所述的pdf文档与知识图谱融合方法,其特征在于,所述根据所述目标图谱本体构建确定所述待融合pdf文档的实体节点关系信息,包括:

3.如权利要求2所述的pdf文档与知识图谱融合方法,其特征在于,所述根据所述标签关系将各定义本体构建标签进行关联,得到图本体构建文件,包括:

4.如权利要求2所述的pdf文档与知识图谱融合方法,其特征在于,所述根据所述图本体构建文件和所述待融合pdf文档的文本内容信息确定所述待融合pdf文档的实体节点关系信息,包括:

5.如权利要求4所述的pdf文档与知识图谱融合方法,其特征在于,所述将所述文本键值和所述图本体构建文件得到实体节点关系信息,包括:

6.如权利要求1所述的pdf文档与知识图谱融合方法,其特征在于,所述根据所述实体节点关系信息、所述...

【专利技术属性】
技术研发人员:郑洪柏华军陈瓴姚洪锡韩杰吴佳明彭利辉谢浩储诚诚严爱国蒋道君魏璇陈致淳袁小钦
申请(专利权)人:中铁第四勘察设计院集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1