一种档案的保存时间鉴定方法、装置及存储介质制造方法及图纸

技术编号:26762672 阅读:22 留言:0更新日期:2020-12-18 23:14
本说明书实施例提供一种档案的保存时间鉴定方法、装置及存储介质,所述方法包括:获取预设数量标注有不同保存时间的档案;对所述档案进行解析,将解析后得到的预设数量的文本作为训练样本;提取所述训练样本中文本的特征向量;基于提取的所述训练样本中每个文本的特征向量计算所述训练样本中文本的归类条件;对获取的待鉴定档案进行解析,得到所述待鉴定档案对应的待鉴定文本;提取所述待鉴定文本的特征向量;基于所述归类条件计算所述待鉴定文本的特征向量的归类值,以便于根据所述归类值确定所述待鉴定文本对应的档案的保存时间,从而提高档案的保存时间鉴定的效率。

【技术实现步骤摘要】
一种档案的保存时间鉴定方法、装置及存储介质
本说明书实施例涉及计算机
,特别涉及一种档案的保存时间鉴定方法、装置及存储介质。
技术介绍
档案是个人、组织、机关在社会活动中形成具有保存意义的音像、文字、图表以及其他各种形式的历史记录。随着现代信息技术的发展,当前计算机计算、人工智能技术、存储技术以及网络技术都为文化档案的数字化管理提供了技术保障。数字化管理相对于传统的纸质档案管理具有成本低、检索方便、保存年限长、保密性高等特点。能够有效的提高文化档案管理的效率及作用。档案价值鉴定是甄别档案文件的现实价值和历史价值,进行存毁处置的一项档案业务工作。鉴定档案的原则:要用全面的、历史的、发展的观点来判定档案的价值。通俗的来讲档案价值鉴定即应分清哪些需要保存,哪些不需要保存,也即鉴别“存”与“毁”的工作。分清应该保存的文书档案具体保存多长时间,对应存文书档案划定保管期限。当前档案的价值鉴定依赖于人工对档案进行阅览,基于人的经验和档案知识判断档案是否具有保存价值当然,也有档案单位通过设置关键字匹配及关键字的权值来自动鉴定档案保存时间。本文档来自技高网...

【技术保护点】
1.一种档案的保存时间鉴定方法,其特征在于,所述方法包括:/n获取预设数量标注有不同保存时间的档案;/n对所述档案进行解析,将解析后得到的预设数量的文本作为训练样本;/n提取所述训练样本中文本的特征向量;/n基于提取的所述训练样本中每个文本的特征向量计算所述训练样本中文本的归类条件;/n对获取的待鉴定档案进行解析,得到所述待鉴定档案对应的待鉴定文本;/n提取所述待鉴定文本的特征向量;/n基于所述归类条件计算所述待鉴定文本的特征向量的归类值,以便于根据所述归类值确定所述待鉴定文本对应的档案的保存时间。/n

【技术特征摘要】
1.一种档案的保存时间鉴定方法,其特征在于,所述方法包括:
获取预设数量标注有不同保存时间的档案;
对所述档案进行解析,将解析后得到的预设数量的文本作为训练样本;
提取所述训练样本中文本的特征向量;
基于提取的所述训练样本中每个文本的特征向量计算所述训练样本中文本的归类条件;
对获取的待鉴定档案进行解析,得到所述待鉴定档案对应的待鉴定文本;
提取所述待鉴定文本的特征向量;
基于所述归类条件计算所述待鉴定文本的特征向量的归类值,以便于根据所述归类值确定所述待鉴定文本对应的档案的保存时间。


2.根据权利要求1所述的方法,其特征在于,所述不同的保存时间包括永久保存、30年保存、15年保存、10年保存、5年保存中的至少两种。


3.根据权利要求1所述的方法,其特征在于,所述提取所述训练样本中文本的特征向量包括:
对所述文本进行分词,得到所述文本对应的多个词语;
通过词嵌入的方法将各个词语替换为等长的词向量,将所述文本中各个词语对应的词向量构成的矩阵作为所述文本的特征向量。


4.根据权利要求3所述的方法,其特征在于,所述词嵌入的方法通过word2vec算法或bert算法实现。


5.根据权利要求1所述的方法,其特征在于,所述基于提取的所述训练样本中每个文本的特征向量计算所述训练样本中文本的归类条件包括:
通过深度学习算法计算所述训练样本中文本的归类条件。


6.根据权利要求1所述的方法,其特征在于,所述基于提取的所述训练样本中每个文本的特征向量计算所述训练样本中文本的归类条件包括:
通过TextCNN算法或BiLSTM算法计算所述训练样本中文本的归类条件。


7.一种档案的保存时间鉴定装置,其特征在于,所述装置包括:
获取模块,用于获取预设数量标注有不同保存时间的档案;
第一解析模块,用于对所述档案进行解析,将解析后得到的预设数量的文本作为训练样本;
第一提取模块,用于提取所述训练样本中文本的特征向量;
计算模块,用于基于提取的所述训练样本中每个文本的特征向量计算所述训练样本中文本的归类条件;
第二解析模块,用于对获取的待鉴定档案进行解析,得到所述待鉴定档案对应的待鉴定文本;
第二提取模块,用于提取所述待鉴定文本的特征向量;
鉴定模块,用于基于所述归类条件计算所述待鉴定文本的特征向量的归类值,以便于根据所述归类值鉴定所述待鉴定文本对应的档案的保存时间。


8.一种电子设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以实现:获取预设数量标注有不同保存时间的档案;对所述档案进行解析,将解析后得到的预设数量的文本作为训练样本;提取所述训练样本中文本的特征向量;基于提取的所述训练样本中每个文本的特征向量计算所述训练样本中文本的归类条件;对获取的待鉴定档案进行解析,得到所述待鉴定档案对应的待鉴定文本;提取所述待鉴定文本的特征向量;基于所述归类条件计算所述待鉴定文本的特征向量的归类值,以便于根据所述归类值确定所述待鉴定文本对应的档案的保存时间。

<...

【专利技术属性】
技术研发人员:沈文俊丁诗璟高明余刚胡德清赵琴刘维安沈冰华李亮万聪欧阳明袁园李金灵
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1