一种基于标签构建文档模板知识图谱的方法技术

技术编号：38132077 阅读：9 留言：0更新日期：2023-07-08 09:40

一种基于标签构建文档模板知识图谱的方法，包括以下步骤：S1，建立标签库，所述标签库存储在基础信息数据库中；S2，设置文档表与标签表的关联中间表；S3，在关系中间表中，查询目标主键ID；S4，采用java递归查询步骤，汇总存在关系的文档数据；S5，获得查询集合中的查询结果，进行数据处理，组装数据结构；S6，组装数据，构建知识图谱。该方法给文档打上标签并整合，解决文档模板之间关系问题，提高了文档之间的关联性；简化了用户收集并整合文档模板中业务需求的过程；将多标签多属性作为关系链接，解决了查询关系结果过于单一的现象。决了查询关系结果过于单一的现象。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于标签构建文档模板知识图谱的方法

[0001]本专利技术涉及软件开发领域，尤其涉及一种基于标签构建文档模板知识图谱的方法。

技术介绍

[0002]工业过程中会经常使用并产生大量的文档模板，针对某个业务可能分布在不同的文档中。业务人员无法快速识别文档之间的关系，他们需要手动阅读和组织内容。
[0003]因此，文档中业务内容的集成和总结会变得非常复杂，还可能会出现一些偏差。

技术实现思路

[0004]本专利技术的目的是为了解决现有技术中存在的缺点，而提出的一种基于标签构建文档模板知识图谱的方法，利用文档的标签和属性构建属于文档的知识图谱，可视化文档之间的关系，方便业务人员在多个文档中快速整合和总结业务内容并提高工作效率。将标签和多个属性（所属任务、所属阶段、产品编码、作者）作为关系链，避免了关系结果过于简单、信息整合不到位的问题；为实现上述目的，本专利技术采用了如下技术方案：一种基于标签构建文档模板知识图谱的方法，包括以下步骤：S1，建立标签库，所述标签库存储在基础信息数据库中；所述基础信息数据库还存储所有相关文档；标签库内存储各种标签名称；S2，设置文档表与标签表的关联中间表；所述文档表和标签表存储在基础信息数据库中，用于记载文档的基本信息，例如名称、版本等；关联中间表存储文档表的ID和标签表的ID；ID指主键ID，每一个文档和标签都有一个唯一的主键ID；S3，在关系中间表中，查询目标主键ID；S3
‑
1，若查询的是文档ID，则显示出该文档的所有标签ID；S3
‑...

【技术保护点】

【技术特征摘要】
1.一种基于标签构建文档模板知识图谱的方法，其特征在于包括以下步骤：S1，建立标签库，所述标签库存储在基础信息数据库中；所述基础信息数据库还存储所有相关文档；标签库内存储各种标签名称；S2，设置文档表与标签表的关联中间表；所述文档表和标签表存储在基础信息数据库中，用于记载文档的基本信息，例如名称、版本等；关联中间表存储文档表的ID和标签表的ID；ID指主键ID，每一个文档和标签都有一个唯一的主键ID；S3，在关系中间表中，查询目标主键ID；S3
‑
1，若查询的是文档ID，则显示出该文档的所有标签ID；S3
‑
2，若查询的是标签ID，则显示出含有该标签的所有文档ID；即查询该标签应用在哪些文档中，文档又设置了多少的标签；S4，采用java递归查询步骤，汇总存在关系的文档数据；S5，获得查询集合中的查询结果，进行数据处理，组装数据结构；数据包括文档ID、标签ID和文档的基础信息；S5
‑
1，根据文档ID查询文档表，获取文档的基础信息；文档的基础信息包括作者，所属阶段，产品编码、标签等；S6，组装数据，构建知识图谱；获取有关联的文档ID，循环抽取共同的基本信息，给这些基本信息设置唯一的key，并将它们存入redis缓存中；S6
‑
1，若这些基本信息已存在redis缓存中，获取redis缓存中的对应ID；S6
‑
2，若这些基本信息未存在redis缓存中，则存入；缓存中基本信息的key相当于...

【专利技术属性】
技术研发人员：杨松贵，赵红艳，
申请(专利权)人：南京维拓科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人