一种根据汽车行驶规律建立风控模型的方法技术

技术编号:20682962 阅读:48 留言:0更新日期:2019-03-27 19:33
本发明专利技术公开了一种根据汽车行驶规律建立风控模型的方法,所述建立风控模型的方法包括数据采集、数据清洗、数据分析、因子识别、模型构建、风险识别、风险预警和风险确认八个步骤。本发明专利技术对于设备要求和依赖不高:任何能采集到位置数据的设备都可以,不但包括GPS、北斗等能精确定位的设备,还包括基站、WIFI等非精确定位的设备,并且适用场景比较广,只要能提取到位置数据就能建立起模型,而且这种模型可以很容易推广到其它场景,不仅可以事先防范,也可以一边跑数据一边构建模型,评价的维度根据数据属性和质量、设备形态和工作模式的不同可以自适应,最终给出标准一致的评价方法。

【技术实现步骤摘要】
一种根据汽车行驶规律建立风控模型的方法
本专利技术涉及汽车金融
,尤其涉及一种根据汽车行驶规律建立风控模型的方法。
技术介绍
在汽车金融领域,目前风控的主要手段是通过贷前征信,即通过调查借贷人的身份信息,根据以往的交易记录和信用状态来评估借贷人的偿还能力,一旦放款完成,偿还期间风控手段也是不多,大多数都是在逾期后才进行催收。保险也是一样,也都是根据往期的理赔情况来决定下一年的保费,近年来,虽然UBI也在国内慢慢兴起,但是大多数也是需要在车辆上安装了专有设备以后行驶一段时间才能评估,也是属于“事后”。随着车联网的兴起,各种智能设备从车上采集了丰富的数据,使我们开始慢慢关注对于车的画像,通过违约前“人”的异常表现传导到“车”的行为的变化,有可能提早识别出风险并进行防范。现有评价模型对于设备要求和依赖高,成本比较高,并且评价模型的适用场景比较窄,为此,本专利技术提出一种根据汽车行驶规律建立风控模型的方法。
技术实现思路
本专利技术的目的是为了解决现有技术中的问题,而提出的一种根据汽车行驶规律建立风控模型的方法。为了实现上述目的,本专利技术采用了如下技术方案:一种根据汽车行驶规律建立风控模型的方法,所述建立风控模型的方法包括数据采集、数据清洗、数据分析、因子识别、模型构建、风险识别、风险预警和风险确认八个步骤;所述数据采集:通过车辆上的设备提取尽可能多的数据,数据的属性必须包括经度、纬度和时间三个最基本的参量,也可以是能解算出这三个参量的其它数据如基站信息等;所述数据清洗:去除干扰和无价值的数据,并把这些数据进行合理的存储;所述数据分析:对数据进行加工处理,分析数据之间的逻辑关系,加工产生新的维度的数据;所述因子识别:根据已有数据判定车辆可能的评价维度;所述模型构建:根据识别出的模型因子构建评价模型;所述风险识别:根据评价模型去识别场景和风险;所述风险预警:针对识别出的风险进行预警;所述风险确认:针对已经确认的风险进行标记。优选的,所述数据采集的数据来源一般有两种途径,对于不联网的设备,可以通过读卡器直接从设备的存储设备上提取数据;而对于联网的设备,可以在云端的存储文件如数据库中直接提取,提取的数据包括:位置相关数据(时间、经度、纬度、速度、方向、基站参数、WIFI参数)和车辆状态数据(启动/熄火、驾驶行为等)。优选的,所述数据清洗中需要清洗掉的数据主要包括:漂移的位置点:a)速度超过180km/h;b)两点之间距离大于25公里;c)车辆处于熄火状态但位置有变化;非法时间:不在提取时间区间的位置点;无法定位的基站或者WIFI参数。优选的,所述数据分析中需要处理和解算以下数据:包括经度和纬度、速度、方位角、启动/熄火状态计算、家庭和工作单位地址分析、惯走线路分析、消费场所分析、设备人为异常分析;(1)、所述经度、纬度:针对基站和WIFI来说,需要通过相关的参数解算出经纬度数据,一般都是通过第三方接口实现;(2)、所述速度:针对没有提取到速度的场景,需要通过经纬度和时间解算出速度,即先根据经纬度计算出球面距离,再通过距离计算出速度;球面距离(D)通过Haversine公式计算:其中haversin(θ)=sin2(θ/2)=(1-cos(θ))/2θ=d/RR为地球半径,可取平均值6371km;φ1,φ2表示两点的纬度;Δλ表示两点经度的差值。所以:V=D/ΔT,ΔT为两个定位点之间的时间差;(3)、所述方位角:即车辆前进的方向,正北为0,顺时针旋转,计算方法如下:A,B,C:表示球面上的三个点及球面上“弧线”在该点处所夹的角a,b,c:表示A,B,C三点的对“弧”两端点与地心连线所夹的角。(5)、所述启动/熄火状态计算:对于没有采集到启动/熄火状态的情况,还需要计算出其状态,计算出的状态不需要非常精确,要求与实际情况有前后10分钟左右的不一致,也就是车辆在启动或者熄火动作发生成,算法可以在10分钟以内监测到,由于一些特殊情况,提供的数据并不到计算出该状态,所以该状态的计算是非必须的,需要注意的是,由于采集数据样式可能存在缺失,所以算法在判断上需要做超时处理,超过25分钟没有连续的数据则判定为超时,强制车辆为熄火状态;驾驶行为:驾驶行为主要指三急一超,即急加速、急减速、急变道和超速;急加速:加速度大于13km/hs的判定为急加速;急减速:加速度小于-15km/hs的判定为急减速;急变道:a)速度大于120km/h,方向变化大于3°/s,判定为急变道;b)速度在80-120km/h,方向变化大于5°/s,判定为急变道;c)速度在60-80km/h,方向变化大于10°/s,判定为急变道;d)速度在45-60km/h,方向变化大于25°/s,判定为急变道;超速:根据所在道路等级不同,取不同的限速值;a)高速:大于120km/h,判定为超速;b)一级公路:大于80km/h,判定为超速;c)二级公路:大于60km/h,判定为超速;d)三级公路:大于40km/h,判定为超速;e)四级公路:大于30km/h,判定为超速;对于获取车辆所在位置的道路等级有困难的,一种变通方法是全部设定为80km/h判定为超速,经过工程验证,对于模型的影响在可控范围内;(5)、所述家庭和工作单位地址分析:根据经纬度和启动/熄火状态以及时间,采用DBSCAN算法,计算出家庭和工作单位具体地址,具体步骤如下:查找出所有车辆熄火的经纬度和时间;使用DBSCAN做聚类分析;取位置点最多的两个簇再进行分析;根据簇的中心点经纬度,使用第三方接口,通过工作单位簇中心经纬度获取写字楼、商用用房类型的POI点确定为工作单位地址,通过家庭地址簇中心经纬度获取住宅小区的POI点确定为家庭地址;(6)、所述惯走线路分析:分析经常的行驶线路,具体方法如下:查找出所有车辆行驶时的轨迹点(速度大于5km/h)点的经纬度;这些经纬度采用DBSCAN算法做聚类分析;取数据最多的前5个簇;调用第三方的地图接口获取这些簇所在道路信息,形成线路;另外一种方法是,先获取道路,再对道路做聚类分析,也可以取得同样效果。(7)、所述消费场所分析:与家庭和工作单位分析不同,家庭和工作单位地址是先做聚类分析出中心点,再根据时间判断后获取POI的类型。消费场所分析也是先做聚类分析出中心点,但是是根据中心点的位置再去匹配该位置POI的类型,即给定(X,Y),需要通过第三方的地图接口分析是该位置是学校、KTV、酒店、购物中心等;(8)、所述设备人为异常分析:在蓄意违约前,车主一般会提前对设备进行人为破坏,以逃避或者掩盖其后续的行为或者行踪,一般会分析以下情况:设备拆除:设备有拆除报警上报或者15天以内设备没有任何数据上报;设备分离:部分车辆上会安装多台定位设备,当设备有分离报警或者同一辆上的所有设备5分钟内的距离大于10KM;设备屏蔽:车辆在行驶过程中(速度在20km/h以上),数据突然中断5分钟以上,之后又自我恢复的情况。需要注意的是,设备屏蔽受外界影响较多,如过隧道等,在实际使用过程,需要根据地图进行辅助判断车辆所处的外界环境,排除外部的影响。优选的,所述因子识别是根据以上分析数据,综合判定以上维度的数据那些需要参与模型构建以及权重,权重即数据的可信度,可以根据数据质量和集中度进行评估,每个维度的计算本文档来自技高网...

【技术保护点】
1.一种根据汽车行驶规律建立风控模型的方法,其特征在于,所述建立风控模型的方法包括数据采集、数据清洗、数据分析、因子识别、模型构建、风险识别、风险预警和风险确认八个步骤;所述数据采集:通过车辆上的设备提取尽可能多的数据,数据的属性必须包括经度、纬度和时间三个最基本的参量,也可以是能解算出这三个参量的其它数据如基站信息等;所述数据清洗:去除干扰和无价值的数据,并把这些数据进行合理的存储;所述数据分析:对数据进行加工处理,分析数据之间的逻辑关系,加工产生新的维度的数据;所述因子识别:根据已有数据判定车辆可能的评价维度;所述模型构建:根据识别出的模型因子构建评价模型;所述风险识别:根据评价模型去识别场景和风险;所述风险预警:针对识别出的风险进行预警;所述风险确认:针对已经确认的风险进行标记。

【技术特征摘要】
1.一种根据汽车行驶规律建立风控模型的方法,其特征在于,所述建立风控模型的方法包括数据采集、数据清洗、数据分析、因子识别、模型构建、风险识别、风险预警和风险确认八个步骤;所述数据采集:通过车辆上的设备提取尽可能多的数据,数据的属性必须包括经度、纬度和时间三个最基本的参量,也可以是能解算出这三个参量的其它数据如基站信息等;所述数据清洗:去除干扰和无价值的数据,并把这些数据进行合理的存储;所述数据分析:对数据进行加工处理,分析数据之间的逻辑关系,加工产生新的维度的数据;所述因子识别:根据已有数据判定车辆可能的评价维度;所述模型构建:根据识别出的模型因子构建评价模型;所述风险识别:根据评价模型去识别场景和风险;所述风险预警:针对识别出的风险进行预警;所述风险确认:针对已经确认的风险进行标记。2.根据权利要求1所述的一种根据汽车行驶规律建立风控模型的方法,其特征在于,所述数据采集的数据来源一般有两种途径,对于不联网的设备,可以通过读卡器直接从设备的存储设备上提取数据;而对于联网的设备,可以在云端的存储文件如数据库中直接提取,提取的数据包括:位置相关数据(时间、经度、纬度、速度、方向、基站参数、WIFI参数)和车辆状态数据(启动/熄火、驾驶行为等)。3.根据权利要求1所述的一种根据汽车行驶规律建立风控模型的方法,其特征在于,所述数据清洗中需要清洗掉的数据主要包括:漂移的位置点:a)速度超过180km/h;b)两点之间距离大于25公里;c)车辆处于熄火状态但位置有变化;非法时间:不在提取时间区间的位置点;无法定位的基站或者WIFI参数。4.根据权利要求1所述的一种根据汽车行驶规律建立风控模型的方法,其特征在于,所述数据分析中需要处理和解算以下数据:包括经度和纬度、速度、方位角、启动/熄火状态计算、家庭和工作单位地址分析、惯走线路分析、消费场所分析、设备人为异常分析;(1)、所述经度、纬度:针对基站和WIFI来说,需要通过相关的参数解算出经纬度数据,一般都是通过第三方接口实现;(2)、所述速度:针对没有提取到速度的场景,需要通过经纬度和时间解算出速度,即先根据经纬度计算出球面距离,再通过距离计算出速度;球面距离(D)通过Haversine公式计算:其中haversin(θ)=sin2(θ/2)=(1-cos(θ))/2θ=d/RR为地球半径,可取平均值6371km;φ1,φ2表示两点的纬度;Δλ表示两点经度的差值。所以:V=D/ΔT,ΔT为两个定位点之间的时间差;(3)、所述方位角:即车辆前进的方向,正北为0,顺时针旋转,计算方法如下:A,B,C:表示球面上的三个点及球面上“弧线”在该点处所夹的角a,b,c:表示A,B,C三点的对“弧”两端点与地心连线所夹的角。(4)、所述启动/熄火状态计算:对于没有采集到启动/熄火状态的情况,还需要计算出其状态,计算出的状态不需要非常精确,要求与实际情况有前后10分钟左右的不一致,也就是车辆在启动或者熄火动作发生成,算法可以在10分钟以内监测到,由于一些特殊情况,提供的数据并不到计算出该状态,所以该状态的计算是非必须的,需要注意的是,由于采集数据样式可能存在缺失,所以算法在判断上需要做超时处理,超过25分钟没有连续的数据则判定为超时,强制车辆为熄火状态;驾驶行为:驾驶行为主要指三急一超,即急加速、急减速、急变道和超速;急加速:加速度大于13km/hs的判定为急加速;急减速:加速度小于-15km/hs的判定为急减速;急变道:a)速度大于120km/h,方向变化大于3°/s,判定为急变道;b)速度在80-120km/h,方向变化大于5°/s,判定为急变道;c)速度在60-80km/h,方向变化大于10°/s,判定为急变道;d)速度在45-60km/h,方向变化大于25°/s,判定为急变道;超速:根据所在道路等级不同,取不同的限速值;a)高速:大于120km/h,判定为超速;b)一级公路:大于80km/h,判定为超速;c)二级公路:大于60km/h,判定为超速;d)三级公路:大于40km/h,判定为超速;e)四级公路:大于30km/h,判定为超速;对于获取车辆所在位置的道路等级有困难的,一种变通方法是全部设定为80km/h判定为超速,经过工程验证,对于模型的影响在可控范围内;(5)、所述家庭和工作单位地址分析:根据经纬度和启动/熄火状态以及时间,采用DBSCAN算法,计算出家庭和工作单位具体地址,具体步骤如下:查找出所有...

【专利技术属性】
技术研发人员:周志文刘福长谭伟华钟喜标
申请(专利权)人:深圳市麦谷科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1