一种档案智能化辅助编研方法、系统及相关设备技术方案

技术编号:36757287 阅读:16 留言:0更新日期:2023-03-04 10:49
本发明专利技术公开了一种档案智能化辅助编研方法、系统及相关设备,该方法包括:接收用户录入的档案基本信息,存储至档案信息库中;将档案附件存入所述档案附件库中并提取附件内容信息;根据所述附件内容信息给所述档案附上标签;分析查调阅、检索热点信息生成推荐编研主题;向用户返回所述推荐编研主题;获取用户录入的编研主题和编研条件,根据所述编研主题和所述编研条件筛选对应的档案,获得档案筛选结果;将所述档案筛选结果汇总生成编研结果。本发明专利技术通过以图搜图技术有效地对图片类档案附件进行了处理和筛选,还基于对用户数据的聚类分析,实现了智能化辅助编研选题。实现了智能化辅助编研选题。实现了智能化辅助编研选题。

【技术实现步骤摘要】
一种档案智能化辅助编研方法、系统及相关设备


[0001]本专利技术涉及电子档案管理领域,具体涉及一种档案智能化辅助编研方法、系统及相关设备。

技术介绍

[0002]编研是档案利用工作的重要组成部分,一般由企事业单位的档案部门根据馆(室)藏档案和需求,确定研究专题,在研究档案内容的基础上,编写参考资料、汇编档案文件、参与编史修志、撰写论文专著。传统档案编研的过程中,面对大量纸质或文件级别的对象,编研人员需要手动筛查汇编,耗费大量人力物力,导致传统编研难度高、效率低。
[0003]随着计算机技术的发展,大多数档案馆都建立了信息化的档案管理系统,档案管理工作和档案内容逐步实现了数字化。在对电子档案进行管理和编研时,一般由编研人员在管理系统上创建编研主题,使用系统的查询检索功能筛选出主题相关的档案进行撰写编排后输出编研结果。相较于传统的人工编研,电子档案的编研降低了筛查难度、提高了编研效率,但也同样存在着许多问题。
[0004]1.编研主题的选择是编研工作开展的第一步,但现有电子档案编研系统都需要人工自主选题,可能存在一定的局限性。
[0005]2.在对档案文件的处理上,现有技术中有采用OCR技术对纸质版档案的文字内容进行识别,但还无法对图片类的档案附件进行处理和识别。
[0006]综上所述,现有电子档案编研技术主要面临着选题难、图片检索难、筛查汇编麻烦的问题。

技术实现思路

[0007]针对上述现有技术,本专利技术提供一种档案智能化辅助编研方法、系统及相关设备,主要采用了以图搜图和OCR技术,通过图像比对、数字指纹、数据分析等方式,实现电子档案智能化汇编。
[0008]为实现上述目的,本专利技术通过以下技术方案得以实现:
[0009]第一方面,提供一种档案智能化辅助编研方法,包括以下步骤:
[0010]接收用户录入的档案基本信息,存储至档案信息库中;
[0011]将档案附件存入所述档案附件库中并提取附件内容信息;
[0012]根据所述附件内容信息给所述档案附上标签;
[0013]分析查调阅、检索热点信息生成推荐编研主题;
[0014]向用户返回所述推荐编研主题;
[0015]获取用户录入的编研主题和编研条件,根据所述编研主题和所述编研条件筛选对应的档案,获得档案筛选结果;
[0016]将所述档案筛选结果汇总生成编研结果。
[0017]具体地,档案基本信息包括档案名称、档案类型、归档时间等档案管理相关的信
息,用于后续档案管理和筛选。
[0018]进一步地,档案基本信息由用户在用户终端以人工输入、文件导入、数据采集等方式中的一种或多种方式录入系统。
[0019]在第一方面的可选实施例中,附件内容信息包括所述文字信息和所述图片指纹。
[0020]具体地,提取附件内容信息包括以下步骤:
[0021]识别附件类型;
[0022]若所述档案附件为word类型,则直接提取所述附件中的所述文字信息存储至文字信息库;
[0023]若所述档案附件为pdf类型,则通过OCR识别字符获取所述文字信息存储至文字信息库;
[0024]若所述档案附件为图片类型,则通过pHash算法提取档案附件的图片指纹存储至图片指纹库。
[0025]在第一方面的可选实施例中,根据所述附件内容信息给所述档案附上标签包括以下步骤:
[0026]若所述附件内容信息包括文字信息,则识别所述文字信息中包含的关键词;
[0027]给所述档案附上所述关键词对应的标签;
[0028]若所述附件内容信息包括图片指纹,将所述图片指纹与源图片的图片指纹进行比对,获取与档案附件相似的源图片;
[0029]给所述档案附上所述源图片对应的标签。
[0030]具体地,源图片存储在源图片库中,在档案上传之前,用户可将实际业务中已有的图片作为模板录入系统,并由用户为源图片人工打标签。
[0031]进一步地,当系统给所述档案附上标签后,用户可在系统中人工给档案附上标签或调整档案已附上标签。
[0032]在第一方面的可选实施例中,所述分析查调阅信息生成推荐编研主题包括以下步骤:
[0033]分析一段时间内调阅频率最高的档案,将其关联的标签作为推荐编研主题;
[0034]分析一段时间内搜索频率最高的搜索词,将其作为推荐编研主题。
[0035]在第一方面的可选实施例中,所述编研主题包括用户选择的推荐编研主题和用户录入的自选编研主题;
[0036]所述编研条件包括用户录入的基本信息、调阅频率、标签、文字信息、图片。
[0037]具体地,用户在制定编研主题时,可选择由系统提供的推荐编研主题,也可录入自选编研主题。
[0038]所述编研条件是用户根据编研的实际需求制定的档案筛选条件,用于更精准的筛选出合适的、符合编研要求的档案,用户可针对档案的基本信息、调阅频率和标签设置编研条件,系统将筛选出基本信息、调阅频率和标签符合编研条件的档案,用户也可输入文字信息或上传图片作为编研条件,系统将根据附件的内容信息筛选出包含输入文字信息或相似图片的档案。
[0039]进一步地,根据所述编研主题和所述编研条件筛选对应的档案包括以下步骤:
[0040]若编研主题为推荐编研主题,则根据所述推荐编研主题对应的标签查询出附有该
标签的档案;
[0041]若所述编研条件为档案基本信息,则在档案信息库中查询出符合编研条件的档案;
[0042]若所述编研条件为调阅频率,则查询出符合调阅频率的档案;
[0043]若所述编研条件为标签,则在标签库中查询出附有该标签的档案;
[0044]若所述编研条件为文字信息,则在文字信息库中查询出附件内容信息包含所述文字信息的档案;
[0045]若所述编研条件为图片,则提取所述图片的图片指纹,在图片指纹库中匹配与所述图片相似的档案附件图片,并查询出对应的档案。
[0046]在第一方面的可选实施例中,根据所述生成编研结果还包括以下步骤:
[0047]将所述编研结果显示在用户终端的系统页面上;
[0048]以Word文档、Excel表格或PDF文档等形式导出所述编研结果;
[0049]将所述编研结果打印成纸质文档保存。
[0050]第二方面,提供一种档案智能化辅助编研系统,包括:
[0051]档案录入模块,接收并存储档案的基本信息和附件,提取档案附件的内容信息并给档案附上标签;
[0052]数据分析模块,采集并分析用户的档案查调阅信息生成推荐编研主题;
[0053]档案编研模块,根据编研主题和编研条件筛选对应的档案生成编研结果。
[0054]第三方面,提供一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,处理器执行计算机程序时实现如前述第一方面所述档案智能化辅助编研方法。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种档案智能化辅助编研方法,其特征在于,包括以下步骤:接收用户录入的档案基本信息,存储至档案信息库中;将档案附件存入所述档案附件库中并提取附件内容信息;根据所述附件内容信息给所述档案附上标签;分析查调阅、检索热点信息生成推荐编研主题;向用户返回所述推荐编研主题;获取用户录入的编研主题和编研条件,根据所述编研主题和所述编研条件筛选对应的档案,获得档案筛选结果;将所述档案筛选结果汇总生成编研结果。2.根据权利要求1所述的方法,其特征在于,所述提取附件内容信息包括以下步骤:识别附件类型;若所述档案附件为word或者双层PDF类型,则直接提取所述附件中的文字信息存储至文字信息库;若所述档案附件为单层pdf类型,则通过OCR识别字符获取文字信息存储至文字信息库;若所述档案附件为图片类型,则通过pHash算法提取档案附件的图片指纹存储至图片指纹库;其中,所述内容信息包括所述文字信息和所述图片指纹。3.根据权利要求1所述的方法,其特征在于,所述根据所述附件内容信息给所述档案附上标签包括以下步骤:若所述附件内容信息包括文字信息,则识别所述文字信息中包含的关键词;给所述档案附上所述关键词对应的标签;若所述附件内容信息包括图片指纹,将所述图片指纹与源图片的图片指纹进行比对,获取与档案附件相似的源图片;给所述档案附上所述源图片对应的标签;用户人工附上或调整所述档案的标签。4.根据权利要求1所述的方法,其特征在于,所述分析查调阅信息生成推荐编研主题包括以下步骤:分析一段时间内调阅频率最高的档案,将其关联的标签作为推荐编研主题;分析一段时间内搜索频率最高的搜索词,将其作为推荐编研主题。5.根据权利要求1所述的方法,其特征在于,所述编研主题包括用户选择的推荐编研主题和用户录入的自选编研主题;...

【专利技术属性】
技术研发人员:吴茂昌陈玉婷张军徐江华肖经海
申请(专利权)人:深圳市雁联计算系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1