基于开源大数据组件的车辆行驶里程批量处理方法及系统技术方案

技术编号:44186170 阅读:24 留言:0更新日期:2025-02-06 18:27
本发明专利技术公开了基于开源大数据组件的车辆行驶里程批量处理方法及系统,涉及大数据技术领域,其技术方案要点是:将数据库中的GPS定位数据批量同步到Hive中;使用Hive中内置的多行转一列的函数,将GPS定位数据压缩成一行的gps_list字段;将UDF函数编译成jar包并部署到Hive中;利用UDF函数,通过Hive SQL批量计算第一临时表中所有车辆在前一时间周期的车辆行驶里程,并将计算结果存储到第二临时表。本发明专利技术采用了Hive的行转列和自定义UDF功能,可以利用分布式集群在较短时间内计算出海量车辆的行驶里程,百万级的车辆前一天的行驶里程可以在分钟级时间内得到计算结果。

【技术实现步骤摘要】

本专利技术涉及大数据,更具体地说,它涉及基于开源大数据组件的车辆行驶里程批量处理方法及系统


技术介绍

1、在金融行业的经营性汽车贷款的贷后管理等场景中,往往需要采集车辆的gps定位数据(或其他卫星定位数据),并基于这些gps数据对车辆的位置、轨迹、里程等信息进行定期的监测,以便及时发现可能存在的车贷风险和异常情况。其中,对车辆的行驶里程数进行定期统计和监测是非常重要的一种风控手段。但由于金融机构的车贷业务的车辆数量往往非常庞大(可达到百万级),而且出于精确监测的需要,gps数据通常是每隔数秒钟就要采集一次(按每隔10秒钟采集一次计算,一辆车每天的gps数据可达8640条),这导致要定期统计(比如每天统计一次)所有车辆一天的行驶里程所涉及的明细数据量非常大(可达到百亿级),计算非常耗时间耗资源。

2、现有技术中关于车辆行驶里程计算相关的技术,几乎都是聚焦在如何提升单车行驶里程计算的精确度,而不是解决如何在海量数据的场景下高效快速地批量计算车辆的行驶里程。比较容易想到的一种方法是,将这些车辆的每一条定位数据存储在mysql、postgresql等本文档来自技高网...

【技术保护点】

1.基于开源大数据组件的车辆行驶里程批量处理方法,其特征是,包括以下步骤:

2.根据权利要求1所述的基于开源大数据组件的车辆行驶里程批量处理方法,其特征是,所述gps表中的字段包括车辆ID、当前车辆位置的经度、当前车辆位置的纬度和当前时间戳。

3.根据权利要求1所述的基于开源大数据组件的车辆行驶里程批量处理方法,其特征是,所述多行转一列的函数为collect_set函数或collect_list函数。

4.根据权利要求1所述的基于开源大数据组件的车辆行驶里程批量处理方法,其特征是,所述UDF函数的输入参数为gps_list字段、返回值为车辆行驶里程,计...

【技术特征摘要】

1.基于开源大数据组件的车辆行驶里程批量处理方法,其特征是,包括以下步骤:

2.根据权利要求1所述的基于开源大数据组件的车辆行驶里程批量处理方法,其特征是,所述gps表中的字段包括车辆id、当前车辆位置的经度、当前车辆位置的纬度和当前时间戳。

3.根据权利要求1所述的基于开源大数据组件的车辆行驶里程批量处理方法,其特征是,所述多行转一列的函数为collect_set函数或collect_list函数。

4.根据权利要求1所述的基于开源大数据组件的车辆行驶里程批量处理方法,其特征是,所述udf函数的输入参数为gps_list字段、返回值为车辆行驶里程,计算逻辑包括:

5.根据权利要求4所述的基于开源大数据组件的车辆行驶里程批量处理方法,其特征是,所述对压缩存储的单条gps_list字段进行拆分和排序的过程具体为:

6.根据权利要求4所述的基于...

【专利技术属性】
技术研发人员:李烨陈卫王碧林王守明毛晶
申请(专利权)人:四川新网银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1