基于知识图谱的档案数据处理方法和系统技术方案

技术编号:40879244 阅读:38 留言:0更新日期:2024-04-08 16:49
本公开涉及档案管理领域,具体涉及一种基于知识图谱的档案数据处理方法和系统,所述方法包括如下步骤:获取档案数据;基于实体抽取规则对所述档案数据进行实体抽取,所述实体抽取规则包括对所述档案数据中的技术进行知识层级分析、应用领域分析、问题抽取以及解决方案抽取各自所采用的策略,并将各自所采用的策略进行知识图谱关联,所述知识图谱关联基于所述档案数据中的著录信息、技术方向的关联;基于所述实体抽取的结果进行语义关系的计算和关联得到关系抽取结果;基于实体抽取的结果和关系抽取结果进行知识推理得到知识融合结果以供检索。本公开能够将档案数据中的技术进行更细粒度的抽取。

【技术实现步骤摘要】

本公开涉及档案管理领域,具体涉及一种基于知识图谱的档案数据处理方法和系统


技术介绍

1、档案数据的信息化和网络化已经成为现今社会中的主流,电子政务系统或者科研数据档案的信息化也做的比较完善;针对科研信息单位特别是图书馆均将档案数据的管理、维护和共享作为主要的研究方向。在面对各个专业领域的书籍、论文、杂志、音视频等各种档案数据,在实现收管存用特别是用的阶段,在档案数据的语义关联与利用方面,还存在颗粒度较粗、只有著录项目信息可用的尴尬局面,无法在本质上实现数据的深度细粒度的加工,例如,一篇具有多个章节的大论文,我们仅仅能从摘要部分、著录信息方面获取信息或加工信息,会将具体到多个章节的细粒度的详细描述给漏掉,进而使得用户在检索相关文献时无法关联到自己最想找到的信息。这说明,我们对于信息的加工和处理还不够细致,然而,现有的处理档案数据的方式更多的是实现代码化并实现基本的语义或者直接词语的关联,需要用户同时用到多个跟档案数据中的某些相同的词句才可能找到相关信息。

2、对此,知识图谱在档案数据的处理和分析中具有重要的作用,现有的研究中存在将领域知识图谱的本文档来自技高网...

【技术保护点】

1.基于知识图谱的档案数据处理方法,其特征在于,包括如下步骤:

2.如权利要求1所述的基于知识图谱的档案数据处理方法,其特征在于,步骤S20和S30中的实体抽取的结果和关系抽取结果还通过专家标引和/或领域知识库的验证来实现校核。

3.如权利要求1或2所述的基于知识图谱的档案数据处理方法,其特征在于,对所述档案数据中的技术进行知识层级分析、应用领域分析、问题抽取以及解决方案抽取,包括:

4.如权利要求3所述的基于知识图谱的档案数据处理方法,其特征在于,所述知识图谱关联的知识流向,包括:定义应用领域范围得到所述应用领域范围内的存在的问题类别;基于所述问题类...

【技术特征摘要】

1.基于知识图谱的档案数据处理方法,其特征在于,包括如下步骤:

2.如权利要求1所述的基于知识图谱的档案数据处理方法,其特征在于,步骤s20和s30中的实体抽取的结果和关系抽取结果还通过专家标引和/或领域知识库的验证来实现校核。

3.如权利要求1或2所述的基于知识图谱的档案数据处理方法,其特征在于,对所述档案数据中的技术进行知识层级分析、应用领域分析、问题抽取以及解决方案抽取,包括:

4.如权利要求3所述的基于知识图谱的档案数据处理方法,其特征在于,所述知识图谱关联的知识流向,包括:定义应用领域范围得到所述应用领域范围内的存在的问题类别;基于所述问题类别筛选所述档案数据中描述的问题;基于描述的问题关联档案数据中的解决方案;验证所述解决方案是否属于所述应用领域范围以及是否与所述问题类别关联。

5.如权利要求4所述的基于知识图谱的档案数据处理方法,其特征在于,验证所...

【专利技术属性】
技术研发人员:李登宇朱世伟于俊凤赵燕清李肖俊魏墨济李晨
申请(专利权)人:山东省科学院情报研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1