一种基于Spark技术的物流分拣数据统计方法技术

技术编号：18767012 阅读：51 留言：0更新日期：2018-08-25 12:44

本发明专利技术属于物流运输技术领域，涉及一种基于Spark技术的物流分拣数据统计方法，首先服务器端远程获取客户端的物流分拣日志文件，然后利用Spark技术，分析物流分拣日志文件中的分拣数据，并进行统计；本发明专利技术的物流分拣数据统计方法可以实现对快递包裹分拣数据信息的统计，且提高了统计效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于Spark技术的物流分拣数据统计方法
本专利技术涉及一种数据统计方法，尤其是一种基于Spark技术的物流分拣数据统计方法，属于物流运输

技术介绍
对于传统的物流自动分拣数据统计方法，由于分拣数据存储在数据表中，所以通常是通过编写SQL语句来进行数据的统计，但是物流自动分拣包含着大量的数据信息，然而数据库查询不能满足海量的数据查询，而且对于海量数据统计来说，通过数据库查询的效率非常低，甚至还会出现查询卡顿的现象。随着数据的膨胀，大数据技术应运而生，传统的大数据统计技术Hadoop的MapReduce技术成本很高，同时编程模型不是很灵活，实现一个并行或者多次迭代的场景的数据统计确实比较麻烦，而且具有高延迟和不可迭代计算的缺点，所以通过综合分析专利技术出一种全新的物流自动分拣数据统计方法至关重要。
技术实现思路
本专利技术的目的是针对现有技术遇到的问题，提供一种基于Spark技术的物流分拣数据统计方法，可以实现对快递包裹分拣数据信息的统计，且提高了统计效率，从不同维度查看分拣包裹数，从而来评估每条分拣线的分拣效率。为实现以上技术目的，本专利技术的技术方案是：一种基于Spark技术的物流分拣数据统计方法，其特征在于，包括如下步骤：步骤一.服务器端远程获取客户端的物流分拣日志文件；步骤二.利用Spark技术，分析物流分拣日志文件中的分拣数据，并进行统计。进一步地，所述步骤一中获取客户端的物流分拣日志文件的方法如下：第一步.在每条物流自动分拣线中，客户端需预先配置分拣线号、上传日志到服务器的时间及需要分析的日志条件；第二步.将客户端当前时间和预先配置上传...

【技术保护点】
1.一种基于Spark技术的物流分拣数据统计方法，其特征在于，包括如下步骤：步骤一. 服务器端远程获取客户端的物流分拣日志文件；步骤二. 利用Spark技术，分析物流分拣日志文件中的分拣数据，并进行统计。

【技术特征摘要】
1.一种基于Spark技术的物流分拣数据统计方法，其特征在于，包括如下步骤：步骤一.服务器端远程获取客户端的物流分拣日志文件；步骤二.利用Spark技术，分析物流分拣日志文件中的分拣数据，并进行统计。2.根据权利要求1所述的一种基于Spark技术的物流分拣数据统计方法，其特征在于，所述步骤一中获取客户端的物流分拣日志文件的方法如下：第一步.在每条物流自动分拣线中，客户端需预先配置分拣线号、上传日志到服务器的时间及需要分析的日志条件；第二步.将客户端当前时间和预先配置上传日志到服务器的时间进行比较，若相等，则执行第三步，否则继续执行第二步；第三步.检索物流分拣日志文件中符合配置条件的日志文件，然后将检索出的日志文件上传到一个新建文件夹中，并对该文件夹进行压缩操作；第四步.客户端将分拣线号、上传日志时间和压缩文件夹上传到服务器端。3.根据权利要求2所述的一种基于Spark技术的物流分拣数据统计方法，其特征在于，所述客户端通过Internet网络与服务器端信号连接，所述服务器端需要提供一个服务接口给客户端访问，所述客户端调用服务器端的WebService，执行上传日志文件的操作。4.根据权利要求2所述的一种基于Spark技术的物流分拣...

【专利技术属性】
技术研发人员：李倩玉，李功燕，
申请(专利权)人：中科微至智能制造科技江苏有限公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人