【技术实现步骤摘要】
本专利技术涉及知识图谱,尤其涉及一种pdf文档与知识图谱融合方法、装置、设备及存储介质。
技术介绍
1、pdf(portable document format的简称,意为“便携式文档”),是由adobesystems用于与应用程序、操作系统、硬件无关的方式进行文件交流所发展出的文件格局。知识图谱(knowledge graph)是基于数据,形象地展示整体知识关系的一种知识系统。利用可视化的渲染技术将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。
2、随着人工智能技术的爆发、大数据技术和通用领域知识图谱技术的成熟,知识图谱开始向垂直领域渗透,开发赋能千行百业智能化升级。基于pdf文档表达的专业知识文档构建知识图谱时,现有的知识图谱系统无法将文档中的公式、表格等类型的数据转化成对应的知识图谱节点关系,存在信息缺失,知识表达不完成的问题。
3、上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路>
1、本文档来自技高网...
【技术保护点】
1.一种PDF文档与知识图谱融合方法,其特征在于,所述PDF文档与知识图谱融合方法包括:
2.如权利要求1所述的PDF文档与知识图谱融合方法,其特征在于,所述根据所述目标图谱本体构建确定所述待融合PDF文档的实体节点关系信息,包括:
3.如权利要求2所述的PDF文档与知识图谱融合方法,其特征在于,所述根据所述标签关系将各定义本体构建标签进行关联,得到图本体构建文件,包括:
4.如权利要求2所述的PDF文档与知识图谱融合方法,其特征在于,所述根据所述图本体构建文件和所述待融合PDF文档的文本内容信息确定所述待融合PDF文档的实体节点关
...【技术特征摘要】
1.一种pdf文档与知识图谱融合方法,其特征在于,所述pdf文档与知识图谱融合方法包括:
2.如权利要求1所述的pdf文档与知识图谱融合方法,其特征在于,所述根据所述目标图谱本体构建确定所述待融合pdf文档的实体节点关系信息,包括:
3.如权利要求2所述的pdf文档与知识图谱融合方法,其特征在于,所述根据所述标签关系将各定义本体构建标签进行关联,得到图本体构建文件,包括:
4.如权利要求2所述的pdf文档与知识图谱融合方法,其特征在于,所述根据所述图本体构建文件和所述待融合pdf文档的文本内容信息确定所述待融合pdf文档的实体节点关系信息,包括:
5.如权利要求4所述的pdf文档与知识图谱融合方法,其特征在于,所述将所述文本键值和所述图本体构建文件得到实体节点关系信息,包括:
6.如权利要求1所述的pdf文档与知识图谱融合方法,其特征在于,所述根据所述实体节点关系信息、所述...
【专利技术属性】
技术研发人员:郑洪,柏华军,陈瓴,姚洪锡,韩杰,吴佳明,彭利辉,谢浩,储诚诚,严爱国,蒋道君,魏璇,陈致淳,袁小钦,
申请(专利权)人:中铁第四勘察设计院集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。