【技术实现步骤摘要】
一种用于电子档案智能分类鉴定的方法及装置
[0001]本公开一般涉及信息处理
,具体涉及一种用于电子档案智能分类鉴定的方法及装置。
技术介绍
[0002]档案是指人们参与各项社会活动时直接形成的,具有保存价值的原始记录,这个过程中需要对原始记录进行分类归档和划定保存期限。
[0003]目前,相关技术通过人工方式来处理,然而由于档案门类繁多,且保存期限不尽一致,使得工作量巨大,严重影响了工作效率,同时准确度低。
技术实现思路
[0004]鉴于相关技术中的上述缺陷或不足,期望提供一种用于电子档案智能分类鉴定的方法及装置,能够自动对文档进行鉴定,提高处理效率和准确度。
[0005]第一方面,本公开提供一种用于电子档案智能分类鉴定的方法,所述方法包括:
[0006]获取待处理文档的元数据信息;
[0007]根据预先构建的字段特征库,计算所述元数据信息对应的至少一个鉴定权重;所述字段特征库包括至少一条归档信息、关键字段信息和特征权重的映射关系,所述关键字段信息包括字段名称、字段内容 ...
【技术保护点】
【技术特征摘要】
1.一种用于电子档案智能分类鉴定的方法,其特征在于,所述方法包括:获取待处理文档的元数据信息;根据预先构建的字段特征库,计算所述元数据信息对应的至少一个鉴定权重;所述字段特征库包括至少一条归档信息、关键字段信息和特征权重的映射关系,所述关键字段信息包括字段名称、字段内容以及所述字段名称的预设规则权重,所述鉴定权重基于所述归档信息、所述特征权重和所述预设规则权重得到;根据各所述鉴定权重与预设阈值的大小比较结果,确定所述待处理文档的归档信息。2.根据权利要求1所述的用于电子档案智能分类鉴定的方法,其特征在于,所述根据预先构建的字段特征库,计算所述元数据信息对应的至少一个鉴定权重,包括:根据各所述关键字段信息的字段名称和字段内容,依次识别所述元数据信息中是否存在与所述字段名称和字段内容相对应的目标字段,以确定所述特征权重和所述预设规则权重;根据所述归档信息、所述特征权重和所述预设规则权重,计算得到所述元数据信息的鉴定权重。3.根据权利要求2所述的用于电子档案智能分类鉴定的方法,其特征在于,所述根据各所述关键字段信息的字段名称和字段内容,依次识别所述元数据信息中是否存在与所述字段名称和字段内容相对应的目标字段,包括:按照所述字段名称,从所述元数据信息内提取目标内容;对所述目标内容进行分词,并将分词结果与所述字段内容匹配,若匹配成功,则所述分词结果作为所述目标字段。4.根据权利要求2所述的用于电子档案智能分类鉴定的方法,其特征在于,所述根据所述归档信息、所述特征权重和所述预设规则权重,计算得到所述元数据信息的鉴定权重,包括:在所述归档信息相同的条件下,计算每个所述目标字段对应的所述特征权重与所述预设规则权重的乘积,并对各所述目标字段的乘积结果进行求和,得到所述元数据信息的鉴定权重。5.根据权利要求4所述的用于电子档案智能分类鉴定的方法,其特征在于,所述对各所述目标字段的乘积结果进行求和,得到所述元数据信息的鉴定权重,还包括:归一化处理所述求和结果。6.根据权利要求1至5中任意一项所述的用于电子档案智能分类鉴定的方法,其特征在于,所述字段特征库通...
【专利技术属性】
技术研发人员:颜庆国,马生坤,陈莉,孙平,余冠霖,卫华,隋宏欣,刘文山,
申请(专利权)人:国网江苏省电力有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。