一种基于标签构建文档模板知识图谱的方法技术

技术编号:38132077 阅读:9 留言:0更新日期:2023-07-08 09:40
一种基于标签构建文档模板知识图谱的方法,包括以下步骤:S1,建立标签库,所述标签库存储在基础信息数据库中;S2,设置文档表与标签表的关联中间表;S3,在关系中间表中,查询目标主键ID;S4,采用java递归查询步骤,汇总存在关系的文档数据;S5,获得查询集合中的查询结果,进行数据处理,组装数据结构;S6,组装数据,构建知识图谱。该方法给文档打上标签并整合,解决文档模板之间关系问题,提高了文档之间的关联性;简化了用户收集并整合文档模板中业务需求的过程;将多标签多属性作为关系链接,解决了查询关系结果过于单一的现象。决了查询关系结果过于单一的现象。

【技术实现步骤摘要】
一种基于标签构建文档模板知识图谱的方法


[0001]本专利技术涉及软件开发领域,尤其涉及一种基于标签构建文档模板知识图谱的方法。

技术介绍

[0002]工业过程中会经常使用并产生大量的文档模板,针对某个业务可能分布在不同的文档中。业务人员无法快速识别文档之间的关系,他们需要手动阅读和组织内容。
[0003]因此,文档中业务内容的集成和总结会变得非常复杂,还可能会出现一些偏差。

技术实现思路

[0004]本专利技术的目的是为了解决现有技术中存在的缺点,而提出的一种基于标签构建文档模板知识图谱的方法,利用文档的标签和属性构建属于文档的知识图谱,可视化文档之间的关系,方便业务人员在多个文档中快速整合和总结业务内容并提高工作效率。将标签和多个属性(所属任务、所属阶段、产品编码、作者)作为关系链,避免了关系结果过于简单、信息整合不到位的问题;为实现上述目的,本专利技术采用了如下技术方案:一种基于标签构建文档模板知识图谱的方法,包括以下步骤:S1,建立标签库,所述标签库存储在基础信息数据库中;所述基础信息数据库还存储所有相关文档;标签库内存储各种标签名称;S2,设置文档表与标签表的关联中间表;所述文档表和标签表存储在基础信息数据库中,用于记载文档的基本信息,例如名称、版本等;关联中间表存储文档表的ID和标签表的ID;ID指主键ID,每一个文档和标签都有一个唯一的主键ID;S3,在关系中间表中,查询目标主键ID;S3

1,若查询的是文档ID,则显示出该文档的所有标签ID;S3

2,若查询的是标签ID,则显示出含有该标签的所有文档ID;即查询该标签应用在哪些文档中,文档又设置了多少的标签;S4,采用java递归查询步骤,汇总存在关系的文档数据;S5,获得查询集合中的查询结果,进行数据处理,组装数据结构;数据包括文档ID、标签ID和文档的基础信息;S5

1,根据文档ID查询文档表,获取文档的基础信息。
[0005]文档的基础信息包括作者,所属阶段,产品编码、标签等;S6,组装数据,构建知识图谱;获取有关联的文档ID,循环抽取共同的基本信息,给这些基本信息设置唯一的
key,并将它们存入redis缓存中;S6

1,若这些基本信息已存在redis缓存中,获取redis缓存中的对应ID;S6

2,若这些基本信息未存在redis缓存中,则存入;缓存中基本信息的key相当于前端页面中节点与节点中的连接线。
[0006]优选地,步骤S4还包括以下子步骤:S4

1,定义一个计数器,限定查询的次数;S4

2,调用method(),获取页面中所有有关联的文档和标签,并返回所有文档和标签的ID。
[0007]优选地,步骤S4

2还包括以下子步骤:S4
‑2‑
1,查询所有相关联的文档ID,并汇总在查询集合中;所述查询集合里存储页面所展示的文档ID和标签ID;S4
‑2‑
2,根据集合内的所有标签ID查询基础信息数据库中含有目标标签ID的所有文档ID,并汇总在过滤集合中;S4
‑2‑
3,重复步骤S4
‑2‑
1和S4
‑2‑
2,直至查询次数为5次。
[0008]优选地,所述标签名称不受限制,由前端操作人员按需设定,例如参数、日期、姓名等。
[0009]优选地,在新建文档模板时,选择至少一个标签,在关联中间表记录该文档和标签的主键ID。
[0010]优选地,在新建文档模板时不选择标签,关联中间表不记载该文档和标签的主键ID。
[0011]与现有技术相比,本专利技术的有益效果为:1、给文档打上标签并整合,解决文档模板之间关系问题,提高了文档之间的关联性;2、简化了用户收集并整合文档模板中业务需求的过程;3. 将多标签多属性作为关系链接,解决了查询关系结果过于单一的现象。
附图说明
[0012]图1为本专利技术的一种基于标签与属性构建文档模板知识图谱的展示案例。
实施方式
[0013]为使对本专利技术的目的、构造、特征、及其功能有进一步的了解,兹配合实施例详细说明如下。
[0014]一种基于标签构建文档模板知识图谱的方法,包括以下步骤:S1,建立标签库,标签库存储在基础信息数据库中;基础信息数据库还存储所有相关文档;标签库内存储各种标签名称,例如参数、日期、姓名等;标签名称不受限制;S2,设置文档表与标签表的关联中间表;文档表和标签表存储在基础信息数据库中,用于记载文档的基本信息,例如名称、
版本等;关联中间表存储文档表的主键ID和标签表的主键ID;每一个文档和标签都有一个唯一的主键ID。
[0015]S2

1,在新建文档模板时,选择至少一个标签,在关联中间表记录该文档和标签的主键ID;S2

2,在新建文档模板时不选择标签,关联中间表不记载该文档和标签的主键ID;若不选择标签,则代表没有标签ID对应该文档ID,在查询时只会显示单独的这一文档,并其他无关联文档。
[0016]S3,在关系中间表中,查询目标主键ID;S3

1,若查询的是文档ID,则显示出该文档的所有标签ID;S3

2,若查询的是标签ID,则显示出含有该标签的所有文档ID;标签应用在哪些文档中,文档又设置了多少的标签。
[0017]S4,采用java递归查询步骤,汇总存在关系的文档数据;S4

1,定义一个计数器,限定查询的次数;在该实施例中,查询的次数限定在五次,目的在于缩限用户展示和降低计算量;S4

2,调用method(),获取页面中所有有关联的文档和标签,并返回所有文档和标签的ID;S4
‑2‑
1,查询所有相关联的文档ID,并汇总在查询集合中;查询集合里存储页面所展示的文档ID和标签ID;S4
‑2‑
2,根据集合内的所有标签ID查询基础信息数据库中含有目标标签ID的所有文档ID,并汇总在过滤集合中;采用steam流的filter函数过滤,过滤集合中存储着上一次查询步骤中已经汇总到的文档ID;steam流的filter函数过滤是现有技术,本申请未对该技术做出改进,后续不再累述;目的在于过滤出重复的文档ID,避免重复记录,降低计算量;S4
‑2‑
3,重复步骤S4
‑2‑
1和S4
‑2‑
2,直至查询次数为5次。
[0018]S5,获得查询集合中的查询结果,进行数据处理,组装数据结构;数据包括文档ID、标签ID和文档的基础信息;S5

1,根据文档ID查询文档表,获取文档的基础信息;文档的基础信息包括作者,所属阶段,产品编码、标签等。
[0019]S6,组装数据,构建知识图谱;获取有关联的文档ID,循环抽取共同的基本信息,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于标签构建文档模板知识图谱的方法,其特征在于包括以下步骤:S1,建立标签库,所述标签库存储在基础信息数据库中;所述基础信息数据库还存储所有相关文档;标签库内存储各种标签名称;S2,设置文档表与标签表的关联中间表;所述文档表和标签表存储在基础信息数据库中,用于记载文档的基本信息,例如名称、版本等;关联中间表存储文档表的ID和标签表的ID;ID指主键ID,每一个文档和标签都有一个唯一的主键ID;S3,在关系中间表中,查询目标主键ID;S3

1,若查询的是文档ID,则显示出该文档的所有标签ID;S3

2,若查询的是标签ID,则显示出含有该标签的所有文档ID;即查询该标签应用在哪些文档中,文档又设置了多少的标签;S4,采用java递归查询步骤,汇总存在关系的文档数据;S5,获得查询集合中的查询结果,进行数据处理,组装数据结构;数据包括文档ID、标签ID和文档的基础信息;S5

1,根据文档ID查询文档表,获取文档的基础信息;文档的基础信息包括作者,所属阶段,产品编码、标签等;S6,组装数据,构建知识图谱;获取有关联的文档ID,循环抽取共同的基本信息,给这些基本信息设置唯一的key,并将它们存入redis缓存中;S6

1,若这些基本信息已存在redis缓存中,获取redis缓存中的对应ID;S6

2,若这些基本信息未存在redis缓存中,则存入;缓存中基本信息的key相当于...

【专利技术属性】
技术研发人员:杨松贵赵红艳
申请(专利权)人:南京维拓科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1