一种基于大数据的文档智能分派方法及系统技术方案

技术编号:38271776 阅读:10 留言:0更新日期:2023-07-27 10:25
本发明专利技术涉及大数据技术领域,且公开了一种基于大数据的文档智能分派系统,包括以下步骤,数据收集模块、数据分析模块、数据储存模块、服务器终端、数据发送模块及数据查询模块;数据收集模块:分为文字数据收集模块和图形收集模块;文字数据收集模块:通过对互联网中的文字数据进行收集,利用文字收集模块对其进行文字数据进行收集处理。本发明专利技术通过采用多组数据分析,在针对分析后的数据进行总结,针对总结后的数据进行二次分析梳理,在进行储存,该种设计方案,能够有效的减少其储存的空间,提高其储存量,且同时能够保障其储存的精准度,提高文本选派的精准性,保障用户能够第一时间选取到需要类型相似度超过50%以上的数据。选取到需要类型相似度超过50%以上的数据。选取到需要类型相似度超过50%以上的数据。

【技术实现步骤摘要】
一种基于大数据的文档智能分派方法及系统


[0001]本专利技术涉及大数据
,具体为一种基于大数据的文档智能分派方法及系统。

技术介绍

[0002]目前,随着计算机网络的普及应用和大数据技术对于各行各业的技术延申,越来越多的视频、图片、文本、音频和可执行程序文件被数据化,全球信息存储量每年急剧增长。这些增长的变化突出地表现在文件信息的存储、传递、发布以及获取方式所发生的革命性变革。
[0003]根据专利号为CN 109299040 B公开的一种基于大数据的文件存储空间智能分配方法,其主要解决的是但是当前,文件在存储的时候,在数据量很大的时候,如何将文件智能的进行分类存储以便于快速检索成为了一个关键问题,但是当前检索都是依托于常规技术检索,没有结合存储的情况和文件具体的热度来进行存储;这样就导致了在检索文件时造成了大量的浪费。
[0004]但其在使用过程中依然存在以下问题,其占用的储存空间较大,导致其储存系统需要定期扩存或进行数据删除,同时其数据的检索时间较长,其在使用过程中往往采用单次数据分析,其搜索的数据达不到所需的要求,且查找数据的时间花费较长,为此本专利技术推出一种于大数据的文档智能分派方法及系统。

技术实现思路

[0005]针对现有技术的不足,本专利技术提供了一种基于大数据的文档智能分派方法及系统,具备筛分数据快,能够减少其占用的储存空间,搜索的精度高的优点,解决了其占用的储存空间较大,导致其储存系统需要定期扩存或进行数据删除,同时其数据的检索时间较长,其在使用过程中往往采用单次数据分析,其搜索的数据达不到所需的要求,且查找数据的时间花费较长的问题。
[0006]本专利技术提供如下技术方案:一种基于大数据的文档智能分派系统,包括以下步骤,数据收集模块、数据分析模块、数据储存模块、服务器终端、数据发送模块及数据查询模块;
[0007]数据收集模块:分为文字数据收集模块和图形收集模块;
[0008]文字数据收集模块:通过对互联网中的文字数据进行收集,通过对有用数据进行筛分,利用文字收集模块对其进行文字数据进行收集处理;
[0009]图形数据收集模块;通过对互联网中的图形数据进行收集,通过对有用数据进行筛分,利用图形收集模块对其进行图形数据进行收集处理;
[0010]数据分析模块:对收集后的文字和图形数据进行分析,利用内部的数据系统对其数据进行可用性分析,针对可用的文字数据和图形数据进行筛分,对其数据进行保存,对无用的文字数据和图形数据进行筛分,对其进行退回,不进行保存,减少其储存量;
[0011]数据储存模块;对筛分后的有用文字数据和图形数据进行储存,对其数据进行入
库处理;
[0012]服务器终端;包括有数据库和数据检索模块,利用数据库对其数据进行储存,在通过图形分析模块和文字分析模块对数据进行分析处理,再利用图形储存模块和文字储存模块对数据进行储存,利用数据检索模块针对图形相似对或文字数据相似对进行检索,
[0013]数据发送模块,对筛分检索后的数据进行分派,利用该系统对其检索后的数据进行相对应的处理,利用数据检索后的文件进行人工分析可行性,对其数据进行选择可用性;
[0014]数据查询模块;针对检索后的数据进行人员查询,查询文件是否能够进行使用。
[0015]一种基于大数据的文档智能分派方法,其特征在于:包括以下步骤;
[0016]第一步:对数据进行收集,对其跟需要的文件进行数据对比,达到30%以上的文件进行储存,在对第一次收集的数据进行储存;
[0017]第二步:对数据进行收集,对其跟需要的文件进行数据对比,达到30%以上的文件进行储存,在对第二次收集的数据进行储存
[0018]第三步:将第一次数据与第二次数据进行对比,利用基准数对其数据进行调控,选择内部数据达到50%以上相似度的数据进行储存;
[0019]第四步:对审核后的数据进行入库,再利用数据库中的文字数据和图形数据进行对比,进行多次筛分,在进行压缩
[0020]第五步:对压缩后的数据进行保存,再利用人员对其数据分析,分析其文本使用的可行性。
[0021]与现有技术对比,本专利技术具备以下有益效果:
[0022]1、该基于大数据的文档智能分派方法及系统,通过采用多组数据分析,在针对分析后的数据进行总结,针对总结后的数据进行二次分析梳理,在进行储存,该种设计方案,能够有效的减少其储存的空间,提高其储存量,且同时能够保障其储存的精准度,提高文本选派的精准性,保障用户能够第一时间选取到需要类型相似度超过50%以上的数据。
[0023]2、该基于大数据的文档智能分派方法及系统,通过在该系统中设置数据库,根据使用人员的使用习惯,对数据进行储存,储存其经常性选择的数据进行储存,同时对数据进行分析,通过服务器进行数据发送,在查询时能够快速对其所述的数据进行快速查找,提高查找的效率。
附图说明
[0024]图1为本专利技术操作系统示意图;
[0025]图2为本专利技术操作方法流程示意图。
具体实施方式
[0026]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0027]请参阅图1

2,一种基于大数据的文档智能分派方法,包括以下步骤,其特征在于:数据收集模块、数据分析模块、数据储存模块、服务器终端、数据发送模块及数据查询模块;
[0028]数据收集模块:分为文字数据收集模块和图形收集模块;
[0029]文字数据收集模块:通过对互联网中的文字数据进行收集,通过对有用数据进行筛分,利用文字收集模块对其进行文字数据进行收集处理;该种能够对数据进行一次分析,进而筛选出所需的数据内容,对数据进行临时储存;且其存储空间为虚拟空间,能够对数据进行暂时保留,待其数据分析结束后对记录进行删除,减少数据储存的信息,进而保障其储存空间的容量,
[0030]图形数据收集模块;通过对互联网中的图形数据进行收集,通过对有用数据进行筛分,利用图形收集模块对其进行图形数据进行收集处理;该种能够对数据进行一次分析,进而筛选出所需的数据内容,对数据进行临时储存;
[0031]数据分析模块:对收集后的文字和图形数据进行分析,利用内部的数据系统对其数据进行可用性分析,针对可用的文字数据和图形数据进行筛分,对其数据进行保存,对无用的文字数据和图形数据进行筛分,对其进行退回,不进行保存,减少其储存量;且其存储空间为虚拟空间,能够对数据进行暂时保留,待其数据分析结束后对记录进行删除,减少数据储存的信息,进而保障其储存空间的容量
[0032]数据储存模块;对筛分后的有用文字数据和图形数据进行储存,对其数据进行入库处理;
[0033]服务器终端;包括有数据库和数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的文档智能分派系统,包括以下步骤,其特征在于:数据收集模块、数据分析模块、数据储存模块、服务器终端、数据发送模块及数据查询模块;数据收集模块:分为文字数据收集模块和图形收集模块;文字数据收集模块:通过对互联网中的文字数据进行收集,通过对有用数据进行筛分,利用文字收集模块对其进行文字数据进行收集处理;图形数据收集模块;通过对互联网中的图形数据进行收集,通过对有用数据进行筛分,利用图形收集模块对其进行图形数据进行收集处理;数据分析模块:对收集后的文字和图形数据进行分析,利用内部的数据系统对其数据进行可用性分析,针对可用的文字数据和图形数据进行筛分,对其数据进行保存,对无用的文字数据和图形数据进行筛分,对其进行退回,不进行保存,减少其储存量;数据储存模块;对筛分后的有用文字数据和图形数据进行储存,对其数据进行入库处理;服务器终端;包括有数据库和数据检索模块,利用数据库对其数据进行储存,在通过图形分析模块和文字分析模块对数据进行分析处理,再利用图形储存模块和文字储存模块对数据进行储...

【专利技术属性】
技术研发人员:张煇李龙
申请(专利权)人:山西长河科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1