一种基于人工智能档案管理系统技术方案

技术编号:35581016 阅读:11 留言:0更新日期:2022-11-12 16:10
本发明专利技术提供了基于人工智能档案管理系统,其对用户终端上传的文件进行分割处理,得到若干文本文件块和若干图片文件块,并对每个文本文件块和每个图片文件块进行检查处理,得到相应的文本内容和图片内容以及对文本文件块和图片文件块进行修复处理;再将所有文本文件块和所有图片文件块重新组合,还原得到相应的文件,以及根据上述文本内容和图片内容,对还原得到的文件进行多维分类和存储;上述方法能够对每一个上传的文件本身进行文本和图片两个方面的识别分析,以此实现对文件的重新分类,保证分类后的文件与档案存储空间自身的分类体系相互兼容,提高后续从档案存储空间查找所需文件的效率和准确性。需文件的效率和准确性。需文件的效率和准确性。

【技术实现步骤摘要】
一种基于人工智能档案管理系统


[0001]本专利技术涉及档案文件管理的
,特别涉及基于人工智能档案管理系统。

技术介绍

[0002]现有的档案管理系统都是直接根据上传的文件自带的文件分类信息,将文件保存在相应的存储空间,其不会对文件重新进行分类处理。而文件自带的文件分类信息通常都是对文件粗略分析得到的,其并不能准确地文件本身包含的数据内容;此外,文件自带的文件分类信息并不一定与存储空间自身的分类体系相互兼容,从而导致文件无法准确保存到相应的存储空间中,降低后续对文件的查找准确性和可靠性。

技术实现思路

[0003]针对现有技术存在的缺陷,本专利技术提供一种基于人工智能档案管理系统,其对用户终端上传的文件进行分割处理,得到若干文本文件块和若干图片文件块,并对每个文本文件块和每个图片文件块进行检查处理,得到相应的文本内容和图片内容以及对文本文件块和图片文件块进行修复处理;再将所有文本文件块和所有图片文件块重新组合,还原得到相应的文件,以及根据上述文本内容和图片内容,对还原得到的文件进行多维分类和存储;上述方法能够对每一个上传的文件本身进行文本和图片两个方面的识别分析,以此实现对文件的重新分类,保证分类后的文件与档案存储空间自身的分类体系相互兼容,提高后续从档案存储空间查找所需文件的效率和准确性。
[0004]本专利技术提供一种基于人工智能档案管理系统,其包括:
[0005]文件发送源终端识别模块,其用于对来自用户终端的文件上传请求进行分析处理,判断用户终端是否具备文件上传权限;/>[0006]文件接收模块,其用于根据上述文件上传权限的判断结果,与所述用户终端以预定文件上传模式进行连接,从而接收所述用户终端上传的文件;
[0007]文件分割模块,其用于根据接收到的文件的数据内容,将所述文件分割为若干文本文件块和若干图片文件块,并确定每个文本文件块和每个图片文件块在所述文件中的原始数据位置;
[0008]第一文件块处理模块,其用于对每个文本文件块进行文本内容检查处理,并根据文本内容检查处理的结果,对相应的文本文件块进行文本修复处理和文本内容标记处理;
[0009]第二文件块处理模块,其用于对每个图片文件块进行图片检查处理,并根据图片检查处理的结果,对相应的图片文件块进行图片修复处理和图片内容标记处理;
[0010]文件块整合模块,其用于根据所述原始数据位置,将完成修复处理的所有文本文件块和图片文件块进行重新组合,从而还原得到相应的文件;
[0011]文件分类与存储模块,其用于根据所述文本内容标记处理和所述图片内容标记处理的结果,对还原得到的文件进行多维分类以及保存到相应的档案存储空间。
[0012]进一步,文件发送源终端识别模块用于对来自用户终端的文件上传请求进行分析
处理,判断用户终端是否具备文件上传权限具体包括:
[0013]所述文件发送源终端识别模块从来自用户终端的文件上传请求中提取得到用户终端的终端身份信息;将所述终端身份信息与预设终端身份信息库进行比对,若所述终端身份信息存在于预设终端身份信息库中,则判断用户终端具备文件上传权限;否则,判断用户终端不具备文件上传权限。
[0014]进一步,文件接收模块根据上述文件上传权限的判断结果,与所述用户终端以预定文件上传模式进行连接,从而接收所述用户终端上传的文件具体包括:
[0015]当所述用户终端不具备文件上传权限时,所述文件接收模块不与所述用户终端进行连接;
[0016]当所述用户终端具备文件上传权限时,所述文件接收模块根据所述用户终端的历史文件上传日志信息,确定所述用户终端在历史文件上传过程的平均文件上传持续时间;并以所述平均文件上传持续时间作为所述用户终端与所述文件接收模块之间的连接生命周期,从而使所述用户终端接入到所述文件接收模块;再将所述用户终端的最大文件上传速率和所述文件接收模块的最大文件接收速率中的最小者的一半,确定为所述用户终端的平均文件上传速率。
[0017]进一步,文件分割模块根据接收到的文件的数据内容,将所述文件分割为若干文本文件块和若干图片文件块,并确定每个文本文件块和每个图片文件块在所述文件中的原始数据位置具体包括:
[0018]当所述文件分割模块确认所述用户终端完成向所述文件接收模块上传一个完整文件后,所述文件分割模块对所述文件进行数据内容识别,确定所述文件中每一个文本文件块的开始文本代码所处位置和结束文本代码所处位置,以及每一个图片文件块的首位像素所处位置和末尾像素所处位置;
[0019]根据所述开始文本代码所处位置和所述结束文本代码所处位置,从所述文件提取得到其包含的所有文本文件块,以及确定每个文本文件块在所述文件中的原始数据位置;
[0020]根据所述首位像素所处位置和所述末尾像素所处位置,从所述文件中提取得到其包含的所有图片文件块,以及确定每个图片文件块在所述文件中的原始数据位置。
[0021]进一步,文件分割模块根据接收到的文件的数据内容,将所述文件分割为若干文本文件块和若干图片文件块,并确定每个文本文件块和每个图片文件块在所述文件中的原始数据位置还包括:
[0022]所述文件分割模块在分割出若干文本文件块和若干图片文件块后,首先根据每个文本文件块的开始文本代码所处位置和结束文本代码所处位置,以及每个图片文件块的首位像素所处位置和末尾像素所处位置,判断每个文件块是否存在分割到文字以及分割到完整的图片的情况,将所述情况记做分割异常情况,若存在所述分割异常情况则定位分割异常情况的分割边缘首尾端的位置点,然后根据所述分割异常情况的分割边缘首尾端的位置点找到与当前分割异常情况的文件块异常边缘相拼合的其余文件块进行重新拼合并对重新拼合的文件块进行分割后再次进行上述步骤的检测,直至分割出的若干文本文件块和若干图片文件块需确保不会分割到文字以及不会将完整的图片进行分割,其过程为:
[0023]步骤S1,利用下面公式(1),根据每个文本文件块的开始文本代码所处位置和结束文本代码所处位置,以及每个图片文件块的首位像素所处位置和末尾像素所处位置,判断
每个文件块是否存在分割到文字以及分割到完整的图片的情况,
[0024][0025]在上述公式(1)中,W(a)表示第a个文件块是否存在分割到文字以及分割到完整的图片的情况的判定值;∨{}表示若括号内存在一个或多个算式成立,则整体结果数值为1,反之整体结果数值为0;[X0(a),Y0(a)]表示第a个文件块的开始文本代码所处位置点或首位像素所处位置点;[X(a),Y(a)]表示第a个文件块的结束文本代码所处位置点或末尾像素所处位置点;G{

}表示从括号内箭头左边位置点到箭头右边的位置点之间若存在像素点不为0的情况则整体结果数值为1,反之整体结果数值为0;
[0026]若W(a)=0,表示第a个文件块不存在分割到文字以及分割到完整的图片的情况;
[0027]若W(a)=1,表示第a个文件块存在分割到文字以及分割到完整的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能档案管理系统,其特征在于,其包括:文件发送源终端识别模块,其用于对来自用户终端的文件上传请求进行分析处理,判断用户终端是否具备文件上传权限;文件接收模块,其用于根据上述文件上传权限的判断结果,与所述用户终端以预定文件上传模式进行连接,从而接收所述用户终端上传的文件;文件分割模块,其用于根据接收到的文件的数据内容,将所述文件分割为若干文本文件块和若干图片文件块,并确定每个文本文件块和每个图片文件块在所述文件中的原始数据位置;第一文件块处理模块,其用于对每个文本文件块进行文本内容检查处理,并根据文本内容检查处理的结果,对相应的文本文件块进行文本修复处理和文本内容标记处理;第二文件块处理模块,其用于对每个图片文件块进行图片检查处理,并根据图片检查处理的结果,对相应的图片文件块进行图片修复处理和图片内容标记处理;文件块整合模块,其用于根据所述原始数据位置,将完成修复处理的所有文本文件块和图片文件块进行重新组合,从而还原得到相应的文件;文件分类与存储模块,其用于根据所述文本内容标记处理和所述图片内容标记处理的结果,对还原得到的文件进行多维分类以及保存到相应的档案存储空间。2.如权利要求1所述的基于人工智能档案管理系统,其特征在于:文件发送源终端识别模块用于对来自用户终端的文件上传请求进行分析处理,判断用户终端是否具备文件上传权限具体包括:所述文件发送源终端识别模块从来自用户终端的文件上传请求中提取得到用户终端的终端身份信息;将所述终端身份信息与预设终端身份信息库进行比对,若所述终端身份信息存在于预设终端身份信息库中,则判断用户终端具备文件上传权限;否则,判断用户终端不具备文件上传权限。3.如权利要求2所述的基于人工智能档案管理系统,其特征在于:文件接收模块根据上述文件上传权限的判断结果,与所述用户终端以预定文件上传模式进行连接,从而接收所述用户终端上传的文件具体包括:当所述用户终端不具备文件上传权限时,所述文件接收模块不与所述用户终端进行连接;当所述用户终端具备文件上传权限时,所述文件接收模块根据所述用户终端的历史文件上传日志信息,确定所述用户终端在历史文件上传过程的平均文件上传持续时间;并以所述平均文件上传持续时间作为所述用户终端与所述文件接收模块之间的连接生命周期,从而使所述用户终端接入到所述文件接收模块;再将所述用户终端的最大文件上传速率和所述文件接收模块的最大文件接收速率中的最小者的一半,确定为所述用户终端的平均文件上传速率。4.如权利要求3所述的基于人工智能档案管理系统,其特征在于:文件分割模块根据接收到的文件的数据内容,将所述文件分割为若干文本文件块和若干图片文件块,并确定每个文本文件块和每个图片文件块在所述文件中的原始数据位置具体包括:当所述文件分割模块确认所述用户终端完成向所述文件接收模块上传一个完整文件后,所述文件分割模块对所述文件进行数据内容识别,确定所述文件中每一个文本文件块的开始文本代码所处位置和结束文本代码所处位置,以及每一个图片文件块的首位像素所
处位置和末尾像素所处位置;根据所述开始文本代码所处位置和所述结束文本代码所处位置,从所述文件提取得到其包含的所有文本文件块,以及确定每个文本文件块在所述文件中的原始数据位置;根据所述首位像素所处位置和所述末尾像素所处位置,从所述文件中提取得到其包含的所有图片文件块,以及确定每个图片文件块在所述文件中的原始数据位置。5.如权利要求4所述的基于人工智能档案管理系统,其特征在于:文件分割模块根据接收到的文件的数据内容,将所述文件分割为若干文本文件块和若干图片文件块,并确定每个文本文件块和每个图片文件块在所述文件中的原始数据位置还包括:所述文件分割模块在分割出若干文本文件块和若干图片文件块后,首先根据每个文本文件块的开始文本代码所处位置和结束文本代码所处位置,以及每个图片文件块的首位像素所处位置和末尾像素所处位置,判断每个文件块是否存在分割到文字以及分割到完整的图片的情况,将所述情况记做分割异常情况,若存在所述分割异常情况则定位分割异常情况的分割边缘首尾端的位置点,然后根据所述分割异常情况的分割边缘首尾端的位置点找到与当前分割异常情况的文件块异常边缘相拼合的其余文件块进行重新拼合并对重新拼合的文件块进行分割后再次进行上述步骤的检测,直至分割出的若干文本文件块和若干图片文件块需确保不会分割到文字以及不会将完整的图片进行分割,其过程为:步骤S1,利用下面公式(1),根据每个文本文件块的开始文本代码所处位置和结束文本代码所处位置,以及每个图片文件块的首位像素所处位置和末尾像素所处位置,判断每个文件块是否存在分割到文字以及分割到完整的图片的情况,在上述公式(1)中,W(a)表示第a个文件块是否存在分割到文字以及分割到完整的图片的情况的判定值;∨{}表示若括号内存在一个或多个算式成立,则整体结果数值为1,反之整体结果数值为0;[X0(a),Y0(a)]表示第a个文件块的开始文本代码所处位置点或首位像素所处位置点;[X(a),Y(a)]表示第a个文件块的结束文本代码所处位置点或末尾...

【专利技术属性】
技术研发人员:黄林
申请(专利权)人:上海新影捷信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1