【技术实现步骤摘要】
一种档案在线管理方法及系统
[0001]本专利技术涉及档案管理系统
,尤其是涉及一种档案在线管理方法及系统
。
技术介绍
[0002]档案管理的对象是档案
,
服务对象是档案利用者,所要解决的基本矛盾即是档案的分散
、
零乱
、
质杂
、
量大
、
孤本等状况与社会利用档案要求集中
、
系统
、
优质
、
专指
、
广泛之间的矛盾
。
社会对档案需求的满足程度取决于档案管理水平的不断提高,档案管理水平则要适应不断增长的社会需求
。
二者处在从不适应到适应的不断矛盾过程中,从而推动档案管理工作向前发展
。
从几千年档案管理的历史来看,档案管理是由非独立系统到独立系统
、
由简单管理到复杂管理
、
由经验管理到科学管理
、
由手工管理到计算机管理
、
由封闭系统到
【技术保护点】
【技术特征摘要】
1.
一种档案在线管理方法,其特征在于,包括:获取待存储档案的档案文本信息;对所述档案文本信息进行处理,得到待存储档案的候选关键词集;确定所述候选关键词集中候选关键词的权重,并根据所述候选关键词的权重确定关键词集;基于预设的档案类别库,根据所述关键词集确定待存储档案的档案类别,并对待存储档案进行档案类别标记;根据档案类别标记将待存储档案存储于对应的档案库内
。2.
根据权利要求1所述的一种档案在线管理方法,其特征在于,获取待存储档案的档案文本信息,包括:对待存储档案进行扫描识别,得到待存储档案的全部文本信息;对所述全部文本信息进行文本降噪处理,得到待存储档案的档案文本信息
。3.
根据权利要求1所述的一种档案在线管理方法,其特征在于,对所述档案文本信息进行处理,得到待存储档案的候选关键词集,包括:预设停用词表,基于所述停用词表,对所述档案文本信息进行分词,得到分词集;去除所述分词集中重复出现的分词,得到待存储档案的候选关键词集
。4.
根据权利要求1所述的一种档案在线管理方法,其特征在于,确定所述候选关键词集中候选关键词的权重,包括:获取候选关键词在所述档案文本信息中出现的候选关键词频率;获取候选关键词的逆文本频率;根据所述候选关键词频率与所述逆文本频率确定候选关键词的权重
。5.
根据权利要求4所述的一种档案在线管理方法,其特征在于,所述候选关键词的权重根据下式计算:;其中,表示档案文本信息
j
中候选关键词
i
的个数,表示档案文本信息
j
中全部候选关键词的个数,表示档案库中档案的个数,表示包含候选关键词
i
的档案的个数
。6.
根据权利要求1所述的一种档案在线管理方法,其特征在于,根据所述候选关键词的权重确定关键词集,包括:根据所述候选关键词的权重确定候选关键词与档案类别的关联度;将所述候选关键词与档案类别的关联度与目标关联度进行对比;若所述候选关键词与档案类别的关联度大于所述目标关联度,则将所述候选关键词确定为关键词;将所述关键词进行整合,得到关键词集
。7.
根据权利要求6所述的一种档案在线管理方法,其特征在于,
预设权重对应组
W[W1、W2、W3、
…
、Wm]
,其中,
m=1、2、3、4、
…
、m
,
W1
为第一预设权重,
W2
为第二预设权重,
W3
为第三预设权重,
Wm
为第
m
预设权重,且
W1
<
W2
<
W3
<
…
<
Wm
;预设关联度确定组
R[R1、R2、R3、
…
...
【专利技术属性】
技术研发人员:李冬泉,刘煜,刘晓雨,王龙韬,李勇,陈树文,张露潆,周聪,安琪,周桐,
申请(专利权)人:华能信息技术有限公司华能山东发电有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。