一种车辆特征数据处理方法及车辆风险预测模型训练方法技术

技术编号:21274323 阅读:26 留言:0更新日期:2019-06-06 08:25
本发明专利技术提供了一种车辆特征数据处理方法及车辆风险预测模型训练方法,该车辆特征数据处理方法包括获取至少一种原始数据,从该原始数据中确定需要的多种第一特征因子,然后从轨迹点中选取特征点,对特征点进行分层存储,确定不同层次对应的特征点和特征点之间的连线,将该多种第一特征因子与特征点或特征点之间的连线关联存储;该车辆风险预测模型训练方法包括利用多个样本数据训练车辆风险预测模型,其中每一个样本数据分别包括用于表示车辆是否出现事故的样本标记,以及某一轨迹层级所对应的存储在相关联的特征点或特征点之间的连线上的至少一种第一特征因子,和/或至少一种第二特征因子,解决了现有的车辆风险预测模型准确性不高的问题。

【技术实现步骤摘要】
一种车辆特征数据处理方法及车辆风险预测模型训练方法
本专利技术涉及汽车保险领域,具体涉及一种车辆特征数据处理方法及车辆风险预测模型训练方法。
技术介绍
随着互联网时代的到来和技术全球化的发展,移动互联网正在不断渗透到社会、经济各个领域,同样地,互联网下的车联网也正向着汽车保险行业渗透,因而基于车联网的汽车保险行业有巨大的发展前景,其中,车联网技术、大数据技术等是未来保险行业发展的核心驱动力。在这样的时代背景下,对车联网保险进行了研究,并提出了大数据时代下的UBI系统研究。现有技术中通过车载自采集系统OBD采集车身数据,包括车辆急刹车、急加速、急减速、急转弯、每日行驶总里程、每日超速次数、每日夜间行驶时间等少量数据特征,将动态数据存放于数据库Mysql中,特征数据分类合并存储到数据存储结构HBase中,采用Spark算法,训练出UBI(UsageBasedInsurance)模型,即基于驾驶行为的汽车保险,统计分析各种特征数据,在此基础上制定驾驶行为评分标准。但是由于数据特征不全面,以及训练模型时只采用一种算法进行计算,因此现有的UBI预测模型精度较低,对车辆的出险概率预测的准确度并不高。
技术实现思路
有鉴于此,本专利技术实施例提供了一种车辆特征数据处理方法,包括获取至少一种原始数据;从所述原始数据中确定多种第一特征因子;从轨迹点中选取特征点,对所述特征点进行分层存储,确定不同层次对应的所述特征点和特征点之间的连线;将所述多种第一特征因子与所述特征点或所述特征点之间的连线关联存储。本专利技术实施例提供了一种车辆风险预测模型训练方法,包括获取根据上述车辆特征数据处理方法得到的与所述特征点或所述特征点之间的连线关联存储的多种第一特征因子,和/或根据上述车辆特征数据处理方法得到的第二特征因子;利用多个样本数据对车辆风险预测模型中的至少一种模型进行训练,其中每一个所述样本数据分别包括用于表示车辆是否出现事故的样本标记,以及某一层级的与所述特征点或所述特征点之间的连线关联存储的至少一种所述第一特征因子,和/或所述第二特征因子。本专利技术实施例还提供了一种车辆风险预测方法,包括利用上述方法确定目标车辆在某一层级与所述特征点或所述特征点之间的连线关联存储的至少一种第一特征因子,和/或利用上述方法确定的所述第二特征因子;将所述至少一种第一特征因子和/或所述第二特征因子作为至少一种车辆风险预测模型的输入数据,由所述至少一种车辆风险预测模型输出所述目标车辆的出险概率的标记,其中所述至少一种车辆风险预测模型是利用上述方法进行训练得到的。本专利技术实施例具有如下优点:本专利技术实施例提供了一种车辆特征数据处理方法及设备,该车辆特征数据处理方法包括获取至少一种原始数据,从该原始数据中确定需要的多种第一特征因子,然后从轨迹点中选取特征点,对特征点进行分层存储,确定不同层次对应的特征点和特征点之间的连线;将该多种第一特征因子与特征点或特征点之间的连线关联存储。根据该车辆特征数据处理方法,结构化地将各类车辆特征数据进行存储,形成层次聚类,在提取数据时只需按照不同层级来提取相应的特征因子,解决了现有的车辆特征数据的存储模式对存储空间要求高,且不便于进一步读取计算的问题,该车辆特征数据存储处理方法,可以应用在基于车联网大数据的UBI汽车保险领域,同时也可以作为数据读取依据,应用在辅助驾驶领域,为其提供数据参考;本专利技术实施例还提供了一种车辆风险预测模型训练方法及设备,该车辆风险预测模型训练方法包括利用多个样本数据训练车辆风险预测模型,其中每一个样本数据分别包括用于表示车辆是否出现事故的样本标记,以及根据上述车辆数据特征处理方法得到的,与所述特征点或所述特征点之间的连线关联存储的多种第一特征因子,和/或至少一种第二特征因子。相对于现有的车辆出现概率预测模型只考虑车身数据特征,本专利技术实施例的车辆风险预测模型训练方法,全面地考虑了影响车辆行驶的各种特征因子,模型的准确性高,解决了现有的车辆风险预测模型准确性不高的问题。本专利技术实施例还提供了一种车辆风险预测方法及设备,该方法包括利用上述车辆特征数据处理方法确定目标车辆在某一层级与所述特征点或所述特征点之间的连线关联存储的至少一种第一特征因子和/或第二特征因子,将该至少一种第一特征因子和/或第二特征因子作为车辆风险预测模型中的至少一种模型的输入数据,由该车辆风险预测模型输出目标车辆的出险概率的标记,其中至少一种车辆风险预测模型是利用上述车辆风险预测模型训练方法进行训练得到的。通过本专利技术实施例的车辆风险预测方法及设备,解决了现有的车辆风险预测方法预测车辆出险准确性不高的问题。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据本专利技术实施例的车辆特征数据处理方法的流程图;图2是根据本专利技术实施例的UBIIS数据存储结构的整体架构图;图3是根据本专利技术实施例的车辆特征数据处理方法的层次聚类过程的树状图;图4是根据本专利技术实施例的车辆特征数据处理方法的低层级轨迹网络示意图;图5是根据本专利技术实施例的车辆特征数据处理方法的计算机设备的硬件结构示意图;图6是根据本专利技术实施例的车辆风险预测模型训练方法的流程图;图7是根据本专利技术优选实施例的车辆风险预测模型的算法结合示意图;图8是根据本专利技术实施例的输入不同数据特征对预测模型的影响比较图;图9是根据本专利技术实施例的同一车辆同一缩放比例不同层次下的轨迹网络示意图;图10是根据本专利技术实施例的同一车辆同一层次不同缩放比例下的轨迹网络示意图;图11是根据本专利技术实施例的不同车辆同一层次下的轨迹网络示意图;图12是根据本专利技术实施例的车辆风险预测模型训练方法的计算机设备的硬件结构示意图;图13是根据本专利技术实施例的车辆风险预测方法的流程图;图14是根据本专利技术实施例的车辆风险预测方法的计算机设备的硬件结构示意图。具体实施方式下面将结合附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。此外,下面所描述的本专利技术不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。实施例1在本实施例中提供了一种车辆特征数据处理方法,图1是根据本专利技术实施例的车辆特征数据处理方法的流程图,如图1所示,该方法包括如下步骤:S101:获取至少一种原始数据;其中该原始数据可以包括车身数据、驾驶行为数据、驾驶环境数据等。具体地,利用已有车联网平台,获取GPS轨迹点数据、大量车身数据以及丰富的驾驶行为数据及部分驾驶环境数据;利用地图数据可获取地理信息数据、周围车辆数据例如路况信息数据;利用中国气象数据网等平台可以获取天气数据。S102:从该原始数据中确定多种第一特征因子,具体地,从获取的原始数据中提取特征参数,例如获取车身数据特征(如:车辆上下坡车速、发动机转数、绝对增压压力等)、驾驶行为特征(如:急加速、急减速、急转弯、夜间驾驶时长、本文档来自技高网...

【技术保护点】
1.一种车辆特征数据处理方法,包括:获取至少一种原始数据;从所述原始数据中确定多种第一特征因子;从轨迹点中选取特征点,对所述特征点进行分层存储,确定不同层次对应的所述特征点和特征点之间的连线;将所述多种第一特征因子与所述特征点或所述特征点之间的连线关联存储。

【技术特征摘要】
1.一种车辆特征数据处理方法,包括:获取至少一种原始数据;从所述原始数据中确定多种第一特征因子;从轨迹点中选取特征点,对所述特征点进行分层存储,确定不同层次对应的所述特征点和特征点之间的连线;将所述多种第一特征因子与所述特征点或所述特征点之间的连线关联存储。2.根据权利要求1所述的车辆特征数据处理方法,其特征在于,所述从所述原始数据中确定多种第一特征因子的步骤,包括:从所述原始数据中提取与各个轨迹点对应的车身数据特征参数、驾驶行为特征参数和驾驶环境数据特征参数;对各个轨迹点对应的所述车身数据特征参数、驾驶行为特征参数和驾驶环境数据特征参数进行相关性分析以筛选出所述多种第一特征因子。3.根据权利要求1所述的车辆特征数据处理方法,其特征在于,所述从轨迹点中选取特征点,对所述特征点进行分层存储,确定不同层次对应的所述特征点和特征点之间的连线的步骤,包括:将道路等级的变化点确定为特征点;对所述特征点按照道路等级进行分层存储,确定不同层次对应的所述特征点和特征点之间的连线。4.根据权利要求1所述的车辆特征数据处理方法,其特征在于,所述从轨迹点中选取特征点,对所述特征点进行分层存储,确定不同层次对应的所述特征点和特征点之间的连线的步骤,包括:根据所述轨迹点确定各个轨迹点间的点对距离;利用层次聚类方法根据所述各个轨迹点间的点对距离确定特征点和特征点之间的连线。5.根据权利要求4所述的车辆特征数据处理方法,其特征在于,所述根据所述轨迹点确定各个轨迹点间的点对距离的步骤,包括:将所述多种第一特征因子作为各个轨迹点P1、P2……Pn的特征向量,每个轨迹点的表达式为:Pi=(lati,lgni,PRi,isCrossi),式中,lati为Pi的纬度,lgni为Pi的经度,PRi为道路优先级,isCrossi表示点Pi是否为道路交叉口;计算两个轨迹点Pi和Pj之间的点对距离:式中,GeoDis(Pi,Pj)为两点Pi和Pj的实际地理距离,|PRi-PRj|为对应点Pi和Pj的道路等级的差值,isCross为二值变量,标志两点中是否有道路交叉口,即对isCrossi和isCrossj进行或运算。6.根据权利要求4所述的车辆特征数据处理方法,其特征在于,所述利用层次聚类方法根据所述各个轨迹点间的点对距离确定特征点和特征点之间的连线的步骤,包括:将所述点对距离小于预定阈值的两个点合并为一点,确定为所述特征点,并将所述特征点按驾驶方向连线;利用层次聚类方法对所述特征点和所述特征点之间的连线进行分层存储。7.根据权利要求1所述的车辆特征数据处理方法,其特征在于,所述将所述多种第一特征因子与所述特征点或所述特征点之间的连线关联存储的步骤之后,还包括:根据所述特征点、所述特征点之间的连线以及所述多种第一特征因子,确定第二特征因子;所述第二特征因子包括以下至少...

【专利技术属性】
技术研发人员:董丽王心宇许伟张文平赵谦益方绍伟么昌龙章正林
申请(专利权)人:北京四维图新科技股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1