基于大数据的网联车用户出游分析方法技术

技术编号：26597336 阅读：12 留言：0更新日期：2020-12-04 21:19

本发明专利技术公开了一种基于大数据的网联车用户出游分析方法，包括：对车辆用户行驶轨迹信号进行采集、传输、分析和存储，根据分析需求，利用spark离线大数据分析引擎对这段时间的用户轨迹数据进行分析，得出每个车辆用户出游景区情况并写入Hive大数据仓库，以用户、景区为基本维度进行统计分析，将结果以报表或者图表的形式展示出来。本发明专利技术通过应用大数据计算平台和分布式数据分析方法对海量的车辆用户行驶轨迹进行分析，能够对车辆用户节假日出行情况有个整体和真实的了解。

全部详细技术资料下载

【技术实现步骤摘要】
基于大数据的网联车用户出游分析方法
本专利技术属于大数据离线分析
，具体涉及一种基于大数据的网联车用户出游分析方法。
技术介绍
随着物联网的兴起和通信技术的发展成熟，万物互联成为了时代发展的必然需要。对于汽车领域而言，搭载了车联网服务功能的网联汽车越来越普及，汽车厂商能够通过车身上的传感器收集表征车辆信息的各种信号，然后对车辆进行大数据分析。对于节假日车辆用户出游而言，通过对海量的车辆行驶轨迹进行分析，能够从宏观上了解汽车用户在节假日的具体出行情况，进而针对具体车辆用户进行旅游景区推荐，景区针对出行用户设定优惠措施具有重要意义。目前各大整车厂商对于车辆用户节假日出行情况分析大多停留在小样本分析阶段(通过对用户轨迹数据进行样本采样)，无法从宏观的层面掌握大量用户的节假日出行情况，得出来的分析结果往往是片面的，不能够真实地反映出用户整体的出行情况。因此，有必要开发一种新的基于大数据的网联车用户出游分析方法。
技术实现思路
本专利技术提供一种基于大数据的网联车用户出游分析方法，能较真实反映出用户整体的出行情况。本专利技术所述的基于大数据的网联车用户出游分析方法，包括：车辆数据采集：车辆在行驶过程中，将包含有车辆行驶轨迹数据的车况信号由TBOX按照一定的频率采集后通过网关上传到KAFKA消息队列，不同的数据类别对应KAFKA不同的主题；云端数据存储：采用Flink实时数据处理引擎对接包含有车辆行驶轨迹数据的车况信号的KAFKA消息队列，并对KAFKA消息队列里...

【技术保护点】
1.一种基于大数据的网联车用户出游分析方法，其特征在于，包括：/n车辆数据采集：车辆在行驶过程中，将包含有车辆行驶轨迹数据的车况信号由TBOX按照一定的频率采集后通过网关上传到KAFKA消息队列，不同的数据类别对应KAFKA不同的主题；/n云端数据存储：采用Flink实时数据处理引擎对接包含有车辆行驶轨迹数据的车况信号的KAFKA消息队列，并对KAFKA消息队列里面的车况信号数据实时解析，筛选出车辆行驶轨迹数据，并按照当前时间信息，将该条车辆行驶轨迹数据写入按照时间目录分区的HDFS文件系统；通过对车辆行驶轨迹数据的实时解析，并将车辆行驶轨迹数据存入对应日期分区文件；/n车辆行驶轨迹数据预处理：将每个车辆用户每一次出行轨迹信息作为一条轨迹数据存放在HDFS文件系统，对每次出行轨迹的轨迹点进行采样，采样阈值根据当前轨迹行驶时间track_time，轨迹点个数track_number，行驶里程run_total_odometer这三个指标来确定；将少于采样样本的轨迹保留当前轨迹点数量，将大于采样样本的轨迹点按相同步长进行采样；/n匹配景区数据：首先获取景区数据，将获取到的景区数据进行标准化...

【技术特征摘要】
1.一种基于大数据的网联车用户出游分析方法，其特征在于，包括：
车辆数据采集：车辆在行驶过程中，将包含有车辆行驶轨迹数据的车况信号由TBOX按照一定的频率采集后通过网关上传到KAFKA消息队列，不同的数据类别对应KAFKA不同的主题；
云端数据存储：采用Flink实时数据处理引擎对接包含有车辆行驶轨迹数据的车况信号的KAFKA消息队列，并对KAFKA消息队列里面的车况信号数据实时解析，筛选出车辆行驶轨迹数据，并按照当前时间信息，将该条车辆行驶轨迹数据写入按照时间目录分区的HDFS文件系统；通过对车辆行驶轨迹数据的实时解析，并将车辆行驶轨迹数据存入对应日期分区文件；
车辆行驶轨迹数据预处理：将每个车辆用户每一次出行轨迹信息作为一条轨迹数据存放在HDFS文件系统，对每次出行轨迹的轨迹点进行采样，采样阈值根据当前轨迹行驶时间track_time，轨迹点个数track_number，行驶里程run_total_odometer这三个指标来确定；将少于采样样本的轨迹保留当前轨迹点数量，将大于采样样本的轨迹点按相同步长进行采样；
匹配景区数据：首先获取景区数据，将获取到的景区数据进行标准化处理，然后将标准化后的景区数据存储到hive表中；在景区数据匹配过程中，将景区数据中的景区名字、省份、城市和经纬度信息作为广播变量分发到spark各个executor节点，循环遍历每个用户的每个轨迹点和景区列表中的经纬度信息做逐个比较，如果轨迹点之间的距离在预设距离范围以内，则认为用户到过景区；并将满足去过景区条件数据的时间点映射成以天为单位的日期，然后通过聚合用户ID和日期对旅...

【专利技术属性】
技术研发人员：韦鹏，蔡春茂，谢磊，周金文，
申请(专利权)人：重庆长安汽车股份有限公司，
类型：发明
国别省市：重庆;50

全部详细技术资料下载我是这个专利的主人