一种基于Attention-GRU算法的档案管理方法技术

技术编号:37184114 阅读:9 留言:0更新日期:2023-04-20 22:48
本发明专利技术提供一种基于Attention

【技术实现步骤摘要】
一种基于Attention

GRU算法的档案管理方法


[0001]本专利技术属于档案管理
,尤其涉及一种基于Attention

GRU算法的档案管理方法。

技术介绍

[0002]云存储技术具有存储构架易扩展、支持非结构化数据的海量存储、高性能、稳定、易于管理、节约成本等优势,而且能够提供包括数据库服务器、文件存储器、备份服务器、备份软件等设备在内的存储服务平台,云存储已成为实现存储架构改革、实现档案文件长期可存取和备份的不二选择。
[0003]为了实现将档案在云端在进行存储,在授权专利技术专利授权公告号CN102521078B《基于第三方云的教务资源等级备份方法》通过根据教务系统中各种教育资源特有的性质分等级的进行实时、定时和手动的备份,并根据时间变动灵活调整资源的备份等级,实时为资源分配最佳方式进行备份,但是却无法根据档案的固有属性进行等级的划分,现有技术中或有根据档案的密级、页数、存档时间等,采用基于机器学习算法或者数学模型的方式,进行档案的等级的划分,并根据档案的等级进行是否采用异地备份的确定,但是却忽略了档案的密级、页数、存档时间对于档案的等级的影响程度不同,若不采用注意力机制对输入数据进行重构,则会导致档案的等级的划分的准确程度明显较低,同时也忽略了历史借阅人数的影响,特别是近一年的借阅人数的影响,同样会导致最终的等级的划分的准确程度和全面性都有所欠缺。
[0004]针对上述技术问题,本专利技术提供了一种基于Attention

>GRU算法的档案管理方法。

技术实现思路

[0005]为实现本专利技术目的,本专利技术采用如下技术方案:
[0006]根据本专利技术的一个方面,提供了一种基于Attention

GRU算法的档案管理方法。
[0007]一种基于Attention

GRU算法的档案管理方法,其特征在于,具体包括:
[0008]S11获取档案的密级,并判断所述档案的密级是否属于绝密或者机密,若是,则将所述档案进行异地备份,若否,则进入步骤S12;
[0009]S12获取档案的历史借阅人数,并确定所述历史借阅人数是否大于第一阈值,若是,则进入步骤S13,若否,则进入步骤S14;
[0010]S13获取所述档案的近一年的借阅人数,判断所述档案的近一年的借阅人数是否大于第二阈值,若是,则将所述档案进行异地备份,若否,则进入步骤S14;
[0011]S14基于所述档案的密级、页数、存档时间、历史借阅人数构建输入集,并采用基于注意力机制对所述输入集进行重构构建重构后的输入集,基于重构后的输入集,采用基于GRU算法的预测模型,得到所述档案的核心度,并基于所述档案的核心度确定所述档案的备份方式。
[0012]通过首先进行密级的筛选,从而使得高密级的档案作为重要的档案进行首先筛
选,避免了进一步的判断和预测导致的效率不高或者其他问题的出现,进一步保证了判断的效率以及备份方式确定的准确性。
[0013]通过结合历史借阅人数以及近一年的借阅人数,实现对档案进行异地备份的确定,从而将档案的历史借阅人数与异地备份的确定结合到一起,保证了需求度较高的档案能够被异地备份,保证了备份的可靠性。
[0014]通过采用基于注意力机制对所述输入集进行重构构建重构后的输入集,并采用基于GRU算法的预测模型,实现对档案的核心度的评价,从而进一步档案的核心度的评价的可靠性和准确性,这也为实现对档案的准确的分类管理奠定了基础。
[0015]进一步的技术方案在于,所述档案的密级包括绝密、机密、秘密、非涉密。
[0016]进一步的技术方案在于,所述第一阈值根据所述档案的历史借阅人数的平均值、档案的类型进行确定,具体的采用基于层次分析法和主成分分析法相结合的方式实现对所述第一阈值的确定,所述档案的类型包括国家机构档案、企业单位档案、事业单位档案。
[0017]通过采用基于层次分析法和主成分分析法实现对第一阈值的确定,从而准确的将历史借阅人数的平均值、档案的类型相结合实现对对第一阈值的确定,这也为准确且更高效率的实现对档案的分类管理奠定了基础。
[0018]进一步的技术方案在于,基于所述档案的近一年的借阅人数进行异地备份确定的具体步骤为:
[0019]S21确定所述档案的近一年的借阅人数是否大于第二阈值,若是,则进入步骤S22;
[0020]S22获取所述档案的存档时间,并确定所述档案的存档时间是否大于第一时间阈值,若否,则进入步骤S23,若是,则将所述档案进行异地备份;
[0021]S23获取所述档案的页数,判断所述档案的页数是否大于第一页数阈值且所述档案的存储时间大于第二时间阈值,若是,将所述档案进行异地备份,若否,则基于所述档案的近一年的借阅人数、存档时间、页数,构建所述档案的基础核心度,并当所述档案的基础核心度大于设定阈值后,将所述档案进行异地备份。
[0022]通过将借阅人数、存档时间、页数结合到一起,从而实现了多角度对档案是否需要进行异地备份的判断,同时也实现了对于档案的更加准确的辨别,进一步减少了进行最终的进行档案的核心度处理的档案的数量,提升了总体的处理效率。
[0023]进一步的技术方案在于,所述第二时间阈值小于第一时间阈值,所述第一时间阈值、第二时间均通过所述档案的类型、档案的存档的平均时间,采用基于层次分析法与熵值法相结合的方式进行确定。
[0024]进一步的技术方案在于,所述基础核心度的计算公式为:
[0025][0026]其中N、T、P分别为借阅人数、存档时间、页数,单位分别为个、年、页,K1、K2、K3均为常数,取值范围均在0到1之间。
[0027]进一步的技术方案在于,所述档案的核心度的构建的具体步骤为:
[0028]S31基于所述档案的密级分数、页数、存档时间、历史借阅人数进行输入集的构建,其中所述档案的密级分数取值范围在0到1之间,具体的根据所述档案的密级,采用专家打分的方式确定;
[0029]S32对所述档案的输入集进行归一化处理,得到归一化后的输入集,并基于所述归一化后的输入集,采用注意力向量进行重构,得到重构后的输入集;其中所述注意力向量采用主成分分析法以及熵值法的方式进行确定。
[0030]S33基于重构后的输入集,采用基于ACO

GRU算法的预测模型之中,得到所述档案的核心度。
[0031]通过对输入集的重构,从而使得对于不同的特征能够更加准确反应档案的核心度,从而进一步保证了最终的核心度的构建的准确性和可靠性均较高,并且通过ACO算法实现对GRU算法的寻优,使得整体的可靠性进一步提升。
[0032]进一步的技术方案在于,当所述档案的核心度大于第一核心度阈值时,将所述档案进行异地存储,其中所述第一核心度阈值根据所述档案的类型、档案的核心度的分布情况进行确定。
[0033]另一方面,本专利技术提供了本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于Attention

GRU算法的档案管理方法,其特征在于,具体包括:S11获取档案的密级,并判断所述档案的密级是否属于绝密或者机密,若是,则将所述档案进行异地备份,若否,则进入步骤S12;S12获取档案的历史借阅人数,并确定所述历史借阅人数是否大于第一阈值,若是,则进入步骤S13,若否,则进入步骤S14;S13获取所述档案的近一年的借阅人数,判断所述档案的近一年的借阅人数是否大于第二阈值,若是,则将所述档案进行异地备份,若否,则进入步骤S14;S14基于所述档案的密级、页数、存档时间、历史借阅人数构建输入集,并采用基于注意力机制对所述输入集进行重构构建重构后的输入集,基于重构后的输入集,采用基于GRU算法的预测模型,得到所述档案的核心度,并基于所述档案的核心度确定所述档案的备份方式。2.如权利要求1所述的档案管理方法,其特征在于,所述档案的密级包括绝密、机密、秘密、非涉密。3.如权利要求1所述的档案管理方法,其特征在于,所述第一阈值根据所述档案的历史借阅人数的平均值、档案的类型进行确定,具体的采用基于层次分析法和主成分分析法相结合的方式实现对所述第一阈值的确定,所述档案的类型包括国家机构档案、企业单位档案、事业单位档案。4.如权利要求1所述的档案管理方法,其特征在于,基于所述档案的近一年的借阅人数进行异地备份确定的具体步骤为:S21确定所述档案的近一年的借阅人数是否大于第二阈值,若是,则进入步骤S22;S22获取所述档案的存档时间,并确定所述档案的存档时间是否大于第一时间阈值,若否,则进入步骤S23,若是,则将所述档案进行异地备份;S23获取所述档案的页数,判断所述档案的页数是否大于第一页数阈值且所述档案的存储时间大于第二时间阈值,若是,将所述档案进行异地备份,若否,则基于所述档案的近一年的借阅人数、存档时间、页数,构建所述档案的基础核心度,并当所述档案的基础核心度大于设定阈值后,将所述档案进行...

【专利技术属性】
技术研发人员:孟慧平李东张洋党芳芳谢波巩锐刘越吴阳阳
申请(专利权)人:国家电网有限公司国家电投集团河南电力有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1