一种用于档案的智能分拣与归档管理方法与系统技术方案

技术编号:38748157 阅读:11 留言:0更新日期:2023-09-08 23:29
本发明专利技术提供一种用于档案的智能分拣与归档管理方法与系统,属于档案管理技术领域,具体包括:将待存档处理的电子档案作为待处理档案,根据待处理档案的类似档案的相似度、数量以及类似档案的相似度的最大值确定相似度处理优先值,通过已存档类似档案的数量、初始相似度以及已存档类似档案的初始相似度的最大值确定存档处理优先值,根据所述二次筛选档案的存档处理优先值、页数、字符数量确定存档复杂度,根据存档复杂度、存储处理优先值、相似度处理优先值确定优先处理档案的存档优先度以及存档处理顺序,从而提升了档案的自动智能分检和差异化归档管理。检和差异化归档管理。检和差异化归档管理。

【技术实现步骤摘要】
一种用于档案的智能分拣与归档管理方法与系统


[0001]本专利技术属于档案管理
,尤其涉及一种用于档案的智能分拣与归档管理方法与系统。

技术介绍

[0002]为了实现对电子档案的分拣以及自动归档操作,在CN115455266B《一种电子档案自动采集归档方法及系统》中根据电子档案的特征数据与数据归档属性进行匹配,确定档案归档位置,根据档案归档位置对所述电子档案进行归档,但是却存在以下技术问题:1、在需要进行待存档处理的电子档案较多时,未考虑结合待存档处理的电子档案与已存档的电子档案的相似度以及待存档处理的电子档案的分档难度进行待存档处理的电子档案的处理顺序的确定,具体的,当待存档处理的电子档案与已存档的电子档案的相似度过高或者疑似相似度较高的已存档的电子档案的数量较多时,或者待存档处理的电子档案的分档难度较大时,此时若不能结合上述因素,则会导致存档处理的效率变差。
[0003]2、在进行分档处理之前,未考虑待存档处理的电子档案之间的相似情况进行分拣处理,具体的,若存在多个疑似类似的待存档处理的电子档案时,若不能进行差异化的分拣及分类,则同样会使得存档处理的效率变差。
[0004]针对上述技术问题,本专利技术提供了一种用于档案的智能分拣与归档管理方法与系统。

技术实现思路

[0005]为实现本专利技术目的,本专利技术采用如下技术方案:根据本专利技术的一个方面,提供了一种用于档案的智能分拣与归档管理方法。
[0006]一种用于档案的智能分拣与归档管理方法,其特征在于,具体包括:S11将待存档处理的电子档案作为待处理档案,并至少根据标题、页数进行待处理档案与其它的待处理档案之间的相似度以及类似档案的确定,并根据所述待处理档案的类似档案的相似度、数量以及类似档案的相似度的最大值确定相似度处理优先值,并通过所述相似度处理优先值进行筛选档案的确定,将不属于筛选档案的待处理档案的处理优先级设置为第三处理优先级;S12至少根据所述筛选档案的标题和页数确定与已存档档案的初始相似度以及已存档类似方案,并通过已存档类似档案的数量、初始相似度以及已存档类似档案的初始相似度的最大值确定存档处理优先值,并通过所述存档处理优先值进行二次筛选档案的确定,将不属于二次筛选档案的筛选档案的处理优先级设置为第二处理优先级;S13至少根据所述二次筛选档案的存档处理优先值、页数、字符数量确定存档复杂度,并通过所述存档复杂度进行优先处理档案的确定,将不属于优先处理档案的二次筛选档案的处理优先级设置为第一处理优先级;S14根据所述存档复杂度、存储处理优先值、相似度处理优先值确定所述优先处理
档案的存档优先度以及存档处理顺序。
[0007]进一步的技术方案在于,在进行所述待处理档案之间的相似度的评估之前,还需要对所述待处理档案的档案质量进行评估,并将所述档案质量不满足要求的待处理档案的处理优先级设置为第四处理优先级,将所述档案质量不满足要求的待处理档案排除后再进行所述待处理档案之间的相似度的评估。
[0008]进一步的技术方案在于,所述第一处理优先级大于第二处理优先级,所述第二处理优先级大于第三处理优先级,所述第三处理优先级大于第四处理优先级。
[0009]进一步的技术方案在于,所述存档处理顺序的确定的方法为:当所述优先处理档案的存档优先度大于优先度设定值时,则通过所述优先处理档案的存档优先度进行所述优先处理档案的存档处理顺序的确定;当所述优先处理档案的存档优先度不大于优先度设定值时,则通过所述优先处理档案的存档复杂度进行所述优先处理档案的存档处理顺序的确定。
[0010]第二方面,本专利技术提供了一种计算机系统,包括:通信连接的存储器和处理器,以及存储在所述存储器上并能够在所述处理器上运行的计算机程序,其特征在于:所述处理器运行所述计算机程序时执行上述的一种用于档案的智能分拣与归档管理方法。
[0011]第三方面,本申请实施例中提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行上述的一种用于档案的智能分拣与归档管理方法。
[0012]本专利技术的有益效果在于:通过待处理档案之间的相似度的评估,实现待处理档案与其它的待处理档案之间的相似度的确定,从而保证了相似度较大的类似档案的数量较多的待处理档案的确定,考虑到类似档案过多,需要首先确定不同的类似档案之间的相似情况,其处理难度较大,因此需要将存档处理顺序延后,保证存档处理的效率。
[0013]通过已存档类似档案的数量、初始相似度以及已存档类似档案的初始相似度的最大值确定存档处理优先值,从而实现了待处理档案与已存档档案的相似情况实现了对重复可能性较高的待处理档案的确定,避免了由于与已存档档案的重复可能性较高导致的存档处理效率较低的技术问题,并且保证了存档处理的效率。
[0014]根据所述二次筛选档案的存档处理优先值、页数、字符数量确定存档复杂度,并通过所述存档复杂度进行优先处理档案的确定,实现了从二次筛选档案的存档的复杂程度实现了对档案的区分管理,进一步保证了档案的存档处理的效率。
[0015]根据所述存档复杂度、存储处理优先值、相似度处理优先值确定所述优先处理档案的存档优先度以及存档处理顺序,从而实现了从多个角度对优先处理档案的存档优先度以及处理顺序的确定,既保证了存档处理的效率,同时也实现了对不同的档案的差异化分类和处理。
[0016]其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
[0017]为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
[0018]通过参照附图详细描述其示例实施方式,本专利技术的上述和其它特征及优点将变得更加明显;图1是一种用于档案的智能分拣与归档管理方法的流程图;图2是待处理档案的档案质量的评估的方法的流程图;图3是相似度的评估的方法的流程图;图4是相似度处理优先值的确定的方法的流程图;图5是存档处理优先值的确定的方法的流程图;图6是存档复杂度的确定的方法的流程图;图7是一种计算机系统的框架图。
具体实施方式
[0019]为了使本
的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
[0020]为解决上述问题,根据本专利技术的一个方面,如图1所示,提供了根据本专利技术的一个方面,提供了一种用于档案的智能分拣与归档管理方法,其特征在于,具体包括:S11将待存档处理的电子档案作为待处理档案,并至少根据标题、页数进行待处理档案与其它的待处理档案之间的相似度以及类似档案的确定,并根据所述待处理档案的类似档本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于档案的智能分拣与归档管理方法,其特征在于,具体包括:将待存档处理的电子档案作为待处理档案,并至少根据标题、页数进行待处理档案与其它的待处理档案之间的相似度以及类似档案的确定,并根据所述待处理档案的类似档案的相似度、数量以及类似档案的相似度的最大值确定相似度处理优先值,并通过所述相似度处理优先值进行筛选档案的确定,将不属于筛选档案的待处理档案的处理优先级设置为第三处理优先级;至少根据所述筛选档案的标题和页数确定与已存档档案的初始相似度以及已存档类似方案,并通过已存档类似档案的数量、初始相似度以及已存档类似档案的初始相似度的最大值确定存档处理优先值,并通过所述存档处理优先值进行二次筛选档案的确定,将不属于二次筛选档案的筛选档案的处理优先级设置为第二处理优先级;至少根据所述二次筛选档案的存档处理优先值、页数、字符数量确定存档复杂度,并通过所述存档复杂度进行优先处理档案的确定,将不属于优先处理档案的二次筛选档案的处理优先级设置为第一处理优先级;根据所述存档复杂度、存储处理优先值、相似度处理优先值确定所述优先处理档案的存档优先度以及存档处理顺序。2.如权利要求1所述的一种用于档案的智能分拣与归档管理方法,其特征在于,在进行所述待处理档案之间的相似度的评估之前,还需要对所述待处理档案的档案质量进行评估,并将所述档案质量不满足要求的待处理档案的处理优先级设置为第四处理优先级,将所述档案质量不满足要求的待处理档案排除后再进行所述待处理档案之间的相似度的评估。3.如权利要求2所述的一种用于档案的智能分拣与归档管理方法,其特征在于,所述第一处理优先级大于第二处理优先级,所述第二处理优先级大于第三处理优先级,所述第三处理优先级大于第四处理优先级。4.如权利要求2所述的一种用于档案的智能分拣与归档管理方法,其特征在于,所述待处理档案的档案质量的评估的方法为:S21根据所述待处理档案的存储空间对所述待处理档案进行筛选得到存储异常的待处理档案,并判断所述待处理档案是否属于存储异常的待处理档案,若是,则进入下一步骤,若否,则进入步骤S23;S22根据所述待处理档案的字符数量进行空白档案的识别,并判断所述待处理档案是否属于空白档案,若是,则确定所述待处理档案的档案质量不满足要求,若否,则进入下一步骤;S23根据所述待处理档案的字符数量以及页数进行异常待处理档案的识别,并判断所述待处理档案是否属于异常待处理档案,若是,则进入步骤S24,若否,则确定所述代理档案的档案质量满足要求;S24对所述异常待处理档案中的空白页进行识别得到所述异常待处理档案中的空白页的数量以及所述空白页的数量与所述异常待处理档案的页数的比例,并结合所述异常待处理档案的页面中的空白比例大于预设比例的页面数量进行所述异常待处理档案的档案质量的确定。5.如权利要求1所述的一种用于档案的智能分拣与归档管理方法,其特征在于,所述相
似度的评估的方法为:根据所述待处理档案的标题进行分词处理得到所述待处理档案的题目关键词,并根据所述题目关键词确定所述待处理档案与所述其它的待处理档案的题目相似度;根据所述待处理档案的页数与所述其它的待处理档案的页数的偏差量进行所述待处理档案与所述其它的待处理档案的页面相似度;根据所述待处理档案与所述其它的待处理档案的题目相似度和页面相似度进行所述待处理档案之间的相似度的评估。6.如权利要求1所述的一种用于档案的智能分拣与归档管理方法,其特征在于,所述相似档案的确定,具体包括:当所述其它的待处理档案与所述待处理档案的相似度大于相似度预设值时,则确定所述其它的待处理档案为相似档案。7.如权利要求1所述的一种用于档案的智能分拣与归档管理方法,其特征在于,所述相似度处理优先值的确定的方法为:获取所述待处理档案的类似档案的相似度,并根据所述类似档案的相似度确定是否存在疑似重复档案,若是,则确定所述待处理档案不属于筛选档案,并将所...

【专利技术属性】
技术研发人员:梁尔真郑望献吴存锋王园楼新园曹军留巍张嘉琳
申请(专利权)人:浙江星汉信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1