一种基于知识图谱技术的档案研判方法及系统技术方案

技术编号:29673574 阅读:28 留言:0更新日期:2021-08-13 21:55
本发明专利技术提供一种基于知识图谱技术的档案研判方法及系统,所述档案研判方法包括以下步骤:档案上传;档案实体抽取:抽取人名、地名、机构名、高校、著作、事件、建筑和资料实体;档案关系抽取:抽取两个实体之间的关联关系,构建档案知识图谱的边;档案知识融合:将抽取的不同来源的档案实体进行融合,产出一个唯一的属性全面的档案实体;档案知识存储:对抽取的档案实体和关系数据进行存储,可以存储在图数据库中;档案研判分析:档案智能检索。本发明专利技术在知识图谱、机器学习技术的支撑下,充分利用创建的档案知识图谱,实现各类相关档案实体的关联推荐,以及相关档案的精准推荐,帮助档案研判人员扩展阅读,并拓展档案研判的深度和广度。

【技术实现步骤摘要】
一种基于知识图谱技术的档案研判方法及系统
本专利技术属于档案管理与研判
,尤其涉及一种基于知识图谱技术的档案研判方法及系统。
技术介绍
档案馆是国家发展历史记录的珍藏地,档案是过去工作和历史情况的记录,是历史的真实凭证,随着信息化的发展,数字档案馆已经是各级档案馆的必建之物。然而,随着国民和社会经济的发展,传统的档案信息化服务已经不能满足对档案日益增长的现实需求,大力推进智慧档案建设已经成为当今社会发展的必然需求。以往对档案的研判分析,主要通过多维数据分析工具、数据挖掘工具等进行数据统计分析层面的分析,但是智慧档案建设需要我们能够挖掘档案更深层的含义,如某一人和其它人的关联关系、和相关机构的关系、和某些事件的关系,从而实现档案研判对象相关人物、城市、事件、著作等的关联分析与推荐。因此,需要一种基于知识图谱技术的档案研判方法及系统,结合深度学习技术,构建档案知识图谱,辅助用户进行档案关联分析和智能检索,为档案研判决策提供数据支撑。
技术实现思路
为了解决上述技术问题,本专利技术提供一种基于知识图谱技术的档本文档来自技高网...

【技术保护点】
1.一种基于知识图谱技术的档案研判方法及系统,其特征在于,所述档案研判方法包括以下步骤:/n步骤1:档案上传;/n步骤2:档案实体抽取:抽取人名、地名、机构名、高校、著作、事件、建筑和资料实体;/n步骤3:档案关系抽取:抽取两个实体之间的关联关系,构建档案知识图谱的边;/n步骤4:档案知识融合:将抽取的不同来源的档案实体进行融合,产出一个唯一的属性全面的档案实体;/n步骤5:档案知识存储:对抽取的档案实体和关系数据进行存储,可以存储在图数据库中;/n步骤6:档案研判分析:包括档案热词分析、档案敏感词分析、档案专有词识别、档案自动分类、档案聚类,基于利用自然语言处理技术和深度学习技术,辅助档案分...

【技术特征摘要】
1.一种基于知识图谱技术的档案研判方法及系统,其特征在于,所述档案研判方法包括以下步骤:
步骤1:档案上传;
步骤2:档案实体抽取:抽取人名、地名、机构名、高校、著作、事件、建筑和资料实体;
步骤3:档案关系抽取:抽取两个实体之间的关联关系,构建档案知识图谱的边;
步骤4:档案知识融合:将抽取的不同来源的档案实体进行融合,产出一个唯一的属性全面的档案实体;
步骤5:档案知识存储:对抽取的档案实体和关系数据进行存储,可以存储在图数据库中;
步骤6:档案研判分析:包括档案热词分析、档案敏感词分析、档案专有词识别、档案自动分类、档案聚类,基于利用自然语言处理技术和深度学习技术,辅助档案分析研判人员对档案数据进行高效研判分析;
步骤7:档案智能检索:档案智能检索包括检索语义关键词推荐、相关人物推荐、相关机构推荐、相关事件推荐、相关著作推荐、相关政策推荐,通过语义关联推荐,帮助用户扩展阅读,提升信息查找与分析的深度和广度,按照各章节权重对相似度进行加权平均,得到文档整体相似度。


2.如权利要求1所述的一种基于知识图谱技术的档案研判方法及系统,其特征在于,所述步骤2包括以下步骤:
步骤21:将语料向量化后输入到网络;
步骤22:利用双向LSTM自动提取输入的特征;
步骤23:利用CRF层对上层结果进行句子级别的序列标注。


3.如权利要求1所述的一种基于知识图谱技术的档案研判方法及系统,其特征在于,所述步骤3包括以下步骤:
步骤31:对输入的档案文本进行句子内容解析,并进行向量化,再输入到下一层网络;
步骤32:使用双向LSTM进行正向和反向学习上下文信息;
步骤33:使用Attention机制选择一组异常候选集进行分析,生成一个权重向量,通过与这个权重向量相乘,使每...

【专利技术属性】
技术研发人员:衣秀张成苏卫卫黄瑞杨文起
申请(专利权)人:天津德尔塔科技有限公司
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1