【技术实现步骤摘要】
一种用于档案的智能分拣与归档管理方法与系统
[0001]本专利技术属于档案管理
,尤其涉及一种用于档案的智能分拣与归档管理方法与系统。
技术介绍
[0002]为了实现对电子档案的分拣以及自动归档操作,在CN115455266B《一种电子档案自动采集归档方法及系统》中根据电子档案的特征数据与数据归档属性进行匹配,确定档案归档位置,根据档案归档位置对所述电子档案进行归档,但是却存在以下技术问题:1、在需要进行待存档处理的电子档案较多时,未考虑结合待存档处理的电子档案与已存档的电子档案的相似度以及待存档处理的电子档案的分档难度进行待存档处理的电子档案的处理顺序的确定,具体的,当待存档处理的电子档案与已存档的电子档案的相似度过高或者疑似相似度较高的已存档的电子档案的数量较多时,或者待存档处理的电子档案的分档难度较大时,此时若不能结合上述因素,则会导致存档处理的效率变差。
[0003]2、在进行分档处理之前,未考虑待存档处理的电子档案之间的相似情况进行分拣处理,具体的,若存在多个疑似类似的待存档处理的电子档案时,若不能进行差异化的分拣及分类,则同样会使得存档处理的效率变差。
[0004]针对上述技术问题,本专利技术提供了一种用于档案的智能分拣与归档管理方法与系统。
技术实现思路
[0005]为实现本专利技术目的,本专利技术采用如下技术方案:根据本专利技术的一个方面,提供了一种用于档案的智能分拣与归档管理方法。
[0006]一种用于档案的智能分拣与归档管理方法,其特征在于,具体包括: ...
【技术保护点】
【技术特征摘要】
1.一种用于档案的智能分拣与归档管理方法,其特征在于,具体包括:将待存档处理的电子档案作为待处理档案,并至少根据标题、页数进行待处理档案与其它的待处理档案之间的相似度以及类似档案的确定,并根据所述待处理档案的类似档案的相似度、数量以及类似档案的相似度的最大值确定相似度处理优先值,并通过所述相似度处理优先值进行筛选档案的确定,将不属于筛选档案的待处理档案的处理优先级设置为第三处理优先级;至少根据所述筛选档案的标题和页数确定与已存档档案的初始相似度以及已存档类似方案,并通过已存档类似档案的数量、初始相似度以及已存档类似档案的初始相似度的最大值确定存档处理优先值,并通过所述存档处理优先值进行二次筛选档案的确定,将不属于二次筛选档案的筛选档案的处理优先级设置为第二处理优先级;至少根据所述二次筛选档案的存档处理优先值、页数、字符数量确定存档复杂度,并通过所述存档复杂度进行优先处理档案的确定,将不属于优先处理档案的二次筛选档案的处理优先级设置为第一处理优先级;根据所述存档复杂度、存储处理优先值、相似度处理优先值确定所述优先处理档案的存档优先度以及存档处理顺序。2.如权利要求1所述的一种用于档案的智能分拣与归档管理方法,其特征在于,在进行所述待处理档案之间的相似度的评估之前,还需要对所述待处理档案的档案质量进行评估,并将所述档案质量不满足要求的待处理档案的处理优先级设置为第四处理优先级,将所述档案质量不满足要求的待处理档案排除后再进行所述待处理档案之间的相似度的评估。3.如权利要求2所述的一种用于档案的智能分拣与归档管理方法,其特征在于,所述第一处理优先级大于第二处理优先级,所述第二处理优先级大于第三处理优先级,所述第三处理优先级大于第四处理优先级。4.如权利要求2所述的一种用于档案的智能分拣与归档管理方法,其特征在于,所述待处理档案的档案质量的评估的方法为:S21根据所述待处理档案的存储空间对所述待处理档案进行筛选得到存储异常的待处理档案,并判断所述待处理档案是否属于存储异常的待处理档案,若是,则进入下一步骤,若否,则进入步骤S23;S22根据所述待处理档案的字符数量进行空白档案的识别,并判断所述待处理档案是否属于空白档案,若是,则确定所述待处理档案的档案质量不满足要求,若否,则进入下一步骤;S23根据所述待处理档案的字符数量以及页数进行异常待处理档案的识别,并判断所述待处理档案是否属于异常待处理档案,若是,则进入步骤S24,若否,则确定所述代理档案的档案质量满足要求;S24对所述异常待处理档案中的空白页进行识别得到所述异常待处理档案中的空白页的数量以及所述空白页的数量与所述异常待处理档案的页数的比例,并结合所述异常待处理档案的页面中的空白比例大于预设比例的页面数量进行所述异常待处理档案的档案质量的确定。5.如权利要求1所述的一种用于档案的智能分拣与归档管理方法,其特征在于,所述相
似度的评估的方法为:根据所述待处理档案的标题进行分词处理得到所述待处理档案的题目关键词,并根据所述题目关键词确定所述待处理档案与所述其它的待处理档案的题目相似度;根据所述待处理档案的页数与所述其它的待处理档案的页数的偏差量进行所述待处理档案与所述其它的待处理档案的页面相似度;根据所述待处理档案与所述其它的待处理档案的题目相似度和页面相似度进行所述待处理档案之间的相似度的评估。6.如权利要求1所述的一种用于档案的智能分拣与归档管理方法,其特征在于,所述相似档案的确定,具体包括:当所述其它的待处理档案与所述待处理档案的相似度大于相似度预设值时,则确定所述其它的待处理档案为相似档案。7.如权利要求1所述的一种用于档案的智能分拣与归档管理方法,其特征在于,所述相似度处理优先值的确定的方法为:获取所述待处理档案的类似档案的相似度,并根据所述类似档案的相似度确定是否存在疑似重复档案,若是,则确定所述待处理档案不属于筛选档案,并将所...
【专利技术属性】
技术研发人员:梁尔真,郑望献,吴存锋,王园,楼新园,曹军,留巍,张嘉琳,
申请(专利权)人:浙江星汉信息技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。