【技术实现步骤摘要】
用于压缩上传均衡的数据分析系统及方法
[0001]本专利技术涉及数据分析领域,尤其涉及一种用于压缩上传均衡的数据分析系统及方法。
技术介绍
[0002]离线数据分析用于较复杂和耗时的数据分析和处理,一般通常构建在云计算平台之上,如开源的HDFS文件系统和MapReduce运算框架。Hadoop机群包含数百台乃至数千台服务器,存储了数PB乃至数十PB的数据,每天运行着成千上万的离线数据分析作业,每个作业处理几百MB到几百TB甚至更多的数据,运行时间为几分钟、几小时、几天甚至更长。
[0003]在线数据分析也称为联机分析处理,用来处理用户的在线请求,它对响应时间的要求比较高(通常不超过若干秒)。与离线数据分析相比,在线数据分析能够实时处理用户的请求,允许用户随时更改分析的约束和限制条件。与离线数据分析相比,在线数据分析能够处理的数据量要小得多,但随着技术的发展,当前的在线分析系统已经能够实时地处理数千万条甚至数亿条记录。传统的在线数据分析系统构建在以关系数据库为核心的数据仓库之上,而在线大数据分析系统构建在云计算平台的NoSQL系统上。如果没有大数据的在线分析和处理,则无法存储和索引数量庞大的互联网网页,就不会有当今的高效搜索引擎,也不会有构建在大数据处理基础上的微博、博客、社交网络等的蓬勃发展。
[0004]当前,对于待压缩上传到数据运营商服务器的数据文件,其压缩模式直接决定了压缩时长和上传时长,然而,压缩时长的降低,代表压缩比的降低,导致上传的数据的上升,进而引起上传时长的上升,由此可见,压缩时长和上 ...
【技术保护点】
【技术特征摘要】
1.一种用于压缩上传均衡的数据分析系统,其特征在于,所述系统包括:测试准备机构,用于针对每一测试用文件,获取其文件数据量以及设定压缩上传时长,所述文件数据量除以单位时长最低压缩上传数据量阈值以获得所述设定压缩上传时长的取值;类型提取机构,与所述测试准备机构连接,用于针对每一测试用文件,采用不同类型数据压缩模式对其压缩并上传压缩后的已压缩文件,并统计采用每一类型压缩模式完成压缩操作以及上传操作所耗用的总时长以作为所述类型压缩模式对应的参考总时长,并将小于设定压缩上传时长的参考总时长对应类型的压缩模式作为有效压缩模式并输出有效压缩模式对应的编号;模型重构机构,与所述类型提取机构连接,用于采用每一测试用文件对执行压缩模式解析的智能解析模型执行一次学习动作以完成对所述智能解析模型的一次重构;编号转换器件,与所述模型重构机构连接,用于将当前待压缩上传文件的文件数据量、执行压缩操作的压缩处理器件的处理器芯片的单位时间运算量以及执行上传操作的上传处理器件的当前上传速率作为经过多次重构的智能解析模型的输入,运行经过多次重构的智能解析模型以获得当前待压缩上传文件对应的有效压缩模式对应的编号;压缩处理器件,与所述编号转换器件连接,用于采用所述编号转换器件输出编号对应的有效压缩模式对当前待压缩上传文件执行压缩处理,以获得当前待压缩上传文件对应的已压缩文件;其中,所述文件数据量除以单位时长最低压缩上传数据量阈值以获得所述设定压缩上传时长的取值包括:所述单位时长最低压缩上传数据量阈值为数据运营商允许的每单位时长所压缩上传的最少数据量。2.如权利要求1所述的用于压缩上传均衡的数据分析系统,其特征在于,还包括:上传处理器件,与所述压缩处理器件连接,用于将当前待压缩上传文件对应的已压缩文件上传到数据运营商占用的网络存储节点;其中,将当前待压缩上传文件的文件数据量、执行压缩操作的压缩处理器件的处理器芯片的单位时间运算量以及执行上传操作的上传处理器件的当前上传速率作为经过多次重构的智能解析模型的输入,运行经过多次重构的智能解析模型以获得当前待压缩上传文件对应的有效压缩模式对应的编号包括:重构的次数与单位时长最低压缩上传数据量阈值的取值反向关联。3.如权利要求1
‑
2任一所述的用于压缩上传均衡的数据分析系统,其特征在于:采用每一测试用文件对执行压缩模式解析的智能解析模型执行一次学习动作以完成对所述智能解析模型的一次重构包括:将所述测试用文件的文件数据量、执行压缩操作的压缩处理器件的处理器芯片的单位时间运算量以及执行上传操作的上传处理器件的当前上传速率作为所述智能解析模型的输入,将所述测试用文件对应的有效压缩模式对应的编号作为所述智能解析模型的输出,对所述智能解析模型执行一次学习动作以完成对所述智能解析模型的一次重构;其中,将小于设定压缩上传时长的参考总时长对应类型的压缩模式作为有效压缩模式并输出有效压缩模式对应的编号包括:当小于设定压缩上传时长的参考总时长存在两个以上时,将数值最小的参考总时长对应类型的压缩模式作为有效压缩模式并输出有效压缩模
式对应的编号。4.如权利要求1
‑
2任一所述的用于压缩上传均衡的数据分析系统,其特征在于:测试准备机构、类型提取机构、模型重构机构、编号转换器件、压缩处理器件以及上传处理器件设置在同一数据处理终端内;其中,测试准备机构、类型提取机构、模型重构机构、编号转换器件、压缩处理器件以及上传处理器件共同所述数据处理终端内的同一供电电源。5.如权利要求1
‑
2任一所述的用于压缩上传均衡的数据分析系统,其特征在于:将当前待压缩上传文件的文件数据量、执行压缩操作的压缩处理器件的处理器芯片的单位时间运算量以及执行上传操作的上传处理器件的当前上传速率作为经过多次重构的智能解析模型的输入包括:在当前待压缩上传文件的文件数据量超过最大设置阈值时,停止执行将当前待压缩上传文件的文件数据量、执行压缩操作的压缩处理器件的处理器芯片的单位时间运算量以及执行上传操作的上传处理器件的当前上传速率作为经过多次重构的智能解析模型的输入。6.一种用于压缩上传...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。