档案数据的处理方法、装置、设备及存储介质制造方法及图纸

技术编号:41061040 阅读:17 留言:0更新日期:2024-04-24 11:13
本申请涉及数据处理技术领域,公开了一种档案数据的处理方法、装置、设备及存储介质。所述方法包括:获取多个目标数据源的初始档案数据集并创建初始档案数据分类结果和初始档案数据索引信息;生成第一档案数据特征集和第二档案数据特征集;构建档案数据特征知识图谱;进行关系节点提取,得到多个图谱关系节点并进行节点聚类分析,得到目标聚类结果;进行互相关性分析,得到互相关性分析结果并进行矩阵转换,生成目标档案数据特征矩阵;将目标档案数据特征矩阵输入多任务优化模型进行数据分类优化和索引信息优化,输出目标档案数据分类结果和目标档案数据索引信息,本申请实现了档案数据处理的智能化并提高了档案数据处理的效率。

【技术实现步骤摘要】

本申请涉及数据处理,尤其涉及一种档案数据的处理方法、装置、设备及存储介质


技术介绍

1、在当今信息化时代,档案数据的管理和利用成为了组织和个人面临的重要挑战。随着数据量的急剧增加,传统的档案数据处理方法已难以满足快速、高效的数据处理需求。这些传统方法往往依赖于人工操作,不仅耗时耗力,而且容易出错,影响数据的准确性和可用性。因此,如何高效地管理和利用这些庞大的数据资源,提高档案数据的处理效率和质量,成为了迫切需要解决的问题。

2、此外,随着人工智能和大数据技术的发展,如何从海量档案数据中挖掘出有价值的信息,成为了档案数据处理领域的一个重要研究方向。现有的数据处理方法往往缺乏有效的数据特征提取和分析机制,难以充分发掘档案数据中蕴含的知识,限制了档案数据的深度利用和价值挖掘。更为关键的是,档案数据的异构性和复杂性给数据的整合、分析和应用带来了巨大的挑战。档案数据通常来自不同的数据源,具有不同的格式和结构,这使得数据的整合和统一处理变得极为困难。如何有效地对这些异构数据进行集成和预处理,以及如何构建统一的知识表示框架,对于提高档案数据处理的效率和质量本文档来自技高网...

【技术保护点】

1.一种档案数据的处理方法,其特征在于,所述档案数据的处理方法包括:

2.根据权利要求1所述的档案数据的处理方法,其特征在于,所述获取多个目标数据源的初始档案数据集,并对所述初始档案数据集进行并行化数据预处理以及元数据分类和索引创建,得到初始档案数据分类结果和初始档案数据索引信息,包括:

3.根据权利要求2所述的档案数据的处理方法,其特征在于,所述采用SPARSS算法对所述初始档案数据集进行序列模式挖掘,得到多个序列模式,并根据所述多个序列模式生成第一档案数据特征集,并通过Sentence-BERT模型对所述初始档案数据集进行档案数据特征提取,生成第二档案数据特征...

【技术特征摘要】

1.一种档案数据的处理方法,其特征在于,所述档案数据的处理方法包括:

2.根据权利要求1所述的档案数据的处理方法,其特征在于,所述获取多个目标数据源的初始档案数据集,并对所述初始档案数据集进行并行化数据预处理以及元数据分类和索引创建,得到初始档案数据分类结果和初始档案数据索引信息,包括:

3.根据权利要求2所述的档案数据的处理方法,其特征在于,所述采用sparss算法对所述初始档案数据集进行序列模式挖掘,得到多个序列模式,并根据所述多个序列模式生成第一档案数据特征集,并通过sentence-bert模型对所述初始档案数据集进行档案数据特征提取,生成第二档案数据特征集,包括:

4.根据权利要求1所述的档案数据的处理方法,其特征在于,所述根据所述第一档案数据特征集和所述第二档案数据特征集对所述初始档案数据集进行知识图谱构建,得到初始数据特征知识图谱,并通过多元自适应回归样条算法对所述初始数据特征知识图谱进行知识图谱优化,得到档案数据特征知识图谱,包括:

5.根据权利要求4所述的档案数据的处理方法,其特征在于,所述对所述档案数据特...

【专利技术属性】
技术研发人员:宋思淼
申请(专利权)人:深圳兴科华创信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1