基于驾驶行为的网约车识别方法、装置及系统制造方法及图纸

技术编号:38423551 阅读:11 留言:0更新日期:2023-08-07 11:22
本发明专利技术涉及车联网保险技术领域,解决了现有技术中对于网约车识别不准确,无法为保险公司提供准确的保险定价的问题,提供一种基于驾驶行为的网约车识别方法、装置及系统。该方法包括:获取对车辆的各类驾驶行为的驾驶行为数据和所述车辆的车辆属性数据并进行数据清洗处理,生成预备数据;对预备数据进行探索性分析,筛选出满足预设条件的网约车关联数据;根据关联数据构建网约车识别数据模型;将识别车辆为网约车的关联因子输入所述网约车识别数据模型进行计算并进行模型评估和模型调优;根据所述网约车识别数据模型计算后输出的所述车辆为网约车的概率值以识别所述车辆是否为网约车。本发明专利技术可以识别和监控网约车,帮助保险公司对各类车辆进行准确的保险定价。险公司对各类车辆进行准确的保险定价。险公司对各类车辆进行准确的保险定价。

【技术实现步骤摘要】
基于驾驶行为的网约车识别方法、装置及系统


[0001]本专利技术涉及车联网保险
,尤其涉及一种基于驾驶行为的网约车识别方法、装置及系统。

技术介绍

[0002]随着交通行业发展迅速,网约车的发展也极为迅速。近年来在保险行业现状中,家用车与从事营业活动的出租租赁客车分属不同车辆使用性质进行投保,采用不同的保险费率基础。但目前有大量从事网约车活动的车辆以家用车的性质进行投保,保险公司无法做到有效识别和监控,导致承保的费率与实际使用性质不匹配,承担较大赔付风险。
[0003]机器学习是一种通过计算,利用经验数据改善系统自身性能的方法,它致力于通过经验数据的学习构建模型算法,并在新情况出现时让系统能够依据模型做出判断。其中逻辑回归是一种用于解决分类问题的机器学习方法。它是一种基于概率思想的预测分析技术。分类算法逻辑回归用于预测分类因变量的似然性,逻辑回归的目标是发现特征与特定结果的可能性之间的联系;随机森林分类模型,即在变量(列)的使用和数据(行)的使用上进行随机化,生成很多分类树,再汇总分类树的结果。随机森林在运算量没有显著提高的前提下提高了预测精度。随机森林是集成学习中的bagging算法,随机森林是由很多决策树构成的,不同决策树之间没有关联。当进行分类任务时,新的输入样本进入,就让森林中的每一棵决策树分别进行判断和分类,每个决策树会得到一个自己的分类结果,决策树的分类结果中哪一个分类最多,那么随机森林就会把这个结果当做最终的结果。
[0004]在专利文献CN110992235A中公开了一种识别网约车的方法,云端设备根据来自终端的网约车订单生成虚拟安全控件,从而使得移动终端获得操纵网约车上的特定车载设备的权限。在移动终端与网约车之间的距离减小到小于设定值之后,移动终端可以操纵网约车上的特定车载设备产生视觉和/或听觉效果,从而使得乘客能够识别到网约车。但是存在手机的信号准确率较低、误差较大的问题。
[0005]在专利文献CN110992235A中公开了一种基于机器学习算法的新能源网约车识别方法及系统,包括:预处理数据,去除空数据和异常数据;统计里程、方向角变化率,记录每日每次出行数据;清洗与处理数据,将某车某天的特征作为样本,得到某天是否从事相关活动的标签;将经过处理得到的数据集按比例分为训练集、验证集、测试集;构造人工神经网络作为识别模型;确定神经网络的初始参数,调整不同模型参数,训练模型,选出最优参数组合;将最优参数组合用测试集的数据测试其性能,达到要求训练结束。但是采集的数据种类较少,存在识别车辆某天是否从事网约车上误差较大,识别度较低的问题。

技术实现思路

[0006]本专利技术实施例提供了一种基于驾驶行为的网约车识别方法、装置及系统,用以解决现有技术中保险公司无法做到有效识别和监控,导致承保的费率与实际使用性质不匹配,需要承担较大赔付风险的问题。
[0007]第一方面,本专利技术实施例提供了一种基于驾驶行为的网约车识别方法,所述方法包括:
[0008]获取对车辆的各类驾驶行为的驾驶行为数据和所述车辆的车辆属性数据;
[0009]对各类驾驶行为数据和车辆属性数据进行数据清洗处理,生成预备数据;
[0010]对所述预备数据进行探索性分析,筛选出满足预设条件的网约车关联数据,构建网约车数据集,并根据网约车数据集构建网约车识别数据模型;
[0011]将识别车辆为网约车的关联因子输入所述网约车识别数据模型进行计算并进行模型评估和模型调优;
[0012]根据所述网约车识别数据模型计算后输出的所述车辆为网约车的概率值以识别所述车辆是否为网约车。
[0013]优选地,所述方法在根据所述网约车识别数据模型计算后输出的所述车辆为网约车的概率值以识别所述车辆是否为网约车之后,还包括:
[0014]对已构建的所述网约车识别数据模型进行效果评价。
[0015]优选地,所述方法在对已构建的所述网约车识别数据模型进行效果评价之后,还包括:
[0016]根据效果评价,优化所述网约车识别数据模型。
[0017]优选地,所述对已构建的所述网约车识别数据模型进行效果评价,包括:
[0018]构建所述网约车识别数据模型输出实际值和预测值的混淆矩阵;
[0019]通过混淆矩阵计算出所述网约车识别数据模型的真阳率、假阳率和整体准确率。
[0020]优选地,所述网约车识别数据模型包括:逻辑回归模型、随机森林分类模型、极限梯度提升树分类模型;
[0021]所述构建包括所述网约车识别数据模型输出的实际值和预测值的混淆矩阵包括:
[0022]构建逻辑回归模型输出的第一实际值和第一预测值的第一混淆矩阵;
[0023]构建随机森林树分类模型输出的第二实际值和第二预测值的第二混淆矩阵;
[0024]构建极限梯度提升树分类模型输出的第三真实值和第三预测值的第三混淆矩阵;
[0025]所述通过混淆矩阵计算出所述网约车识别数据模型的真阳率、假阳率和整体准确率,包括:
[0026]通过第一混淆矩阵、第二混淆矩阵以及第三混淆矩阵计算出所述网约车识别数据模型的真阳率、假阳率和整体准确率。
[0027]优选地,所述对各类驾驶行为数据和车辆属性数据进行数据清洗处理,生成预处理数据,包括:
[0028]空值填充,根据电池类型和动力类型填充电池容量的空值;
[0029]异常数据修正,对里程数据异常的记录进行填补;
[0030]极端值处理,对网约车识别数据中有限定的指标数据进行极大、极小值校验;
[0031]生成具有指定字段的预处理数据。
[0032]优选地,所述根据效果评价,优化所述网约车识别数据模包括:
[0033]对已构建的所述网约车识别数据模型进行入模因子和模型参数的调整。
[0034]优选地,所述对已构建的所述网约车识别数据模型进行入模因子和模型参数的调整,包括:
[0035]根据最优的模型召回率和精度选择最佳的网约车识别数据模型的概率阈值。
[0036]第二方面,本专利技术提供一种基于驾驶行为的网约车识别装置,所述装置包括:
[0037]获取模块,用于获取对车辆的各类驾驶行为的驾驶行为数据和所述车辆的车辆属性数据;
[0038]数据清洗模块,用于对各类驾驶行为数据和车辆属性数据进行数据清洗处理,生成预备数据;
[0039]分析模块,用于对所述预备数据进行探索性分析,筛选出满足预设条件的网约车关联数据,构建网约车数据集,并根据网约车数据集构建网约车识别数据模型;
[0040]模型评估与优化模块,用于将识别车辆为网约车的关联因子输入所述网约车识别数据模型进行计算并进行模型评估和模型调优;
[0041]网约车识别模块,用于根据所述网约车识别数据模型计算后输出的所述车辆为网约车的概率值以识别所述车辆是否为网约车。
[0042]第三方面,本专利技术提供一种基于驾驶行为的网约车识别系统,所述系统包括:
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于驾驶行为的网约车识别方法,其特征在于,所述方法包括:获取对车辆的各类驾驶行为的驾驶行为数据和所述车辆的车辆属性数据;对各类驾驶行为数据和车辆属性数据进行数据清洗处理,生成预备数据;对所述预备数据进行探索性分析,筛选出满足预设条件的网约车关联数据,构建网约车数据集,并根据网约车数据集构建网约车识别数据模型;将识别车辆为网约车的关联因子输入所述网约车识别数据模型进行计算并进行模型评估和模型调优;根据所述网约车识别数据模型计算后输出的所述车辆为网约车的概率值以识别所述车辆是否为网约车。2.根据权利要求1所述的方法,其特征在于,所述方法在根据所述网约车识别数据模型计算后输出的所述车辆为网约车的概率值以识别所述车辆是否为网约车之后,还包括:对已构建的所述网约车识别数据模型进行效果评价。3.根据权利要求2所述的方法,其特征在于,所述方法在对已构建的所述网约车识别数据模型进行效果评价之后,还包括:根据效果评价,优化所述网约车识别数据模型。4.根据权利要求3所述的方法,其特征在于,所述对已构建的所述网约车识别数据模型进行效果评价,包括:构建所述网约车识别数据模型输出实际值和预测值的混淆矩阵;通过混淆矩阵计算出所述网约车识别数据模型的真阳率、假阳率和整体准确率。5.根据权利要求4所述的方法,其特征在于,所述网约车识别数据模型包括:逻辑回归模型、随机森林分类模型、极限梯度提升树分类模型;所述构建包括所述网约车识别数据模型输出的实际值和预测值的混淆矩阵包括:构建逻辑回归模型输出的第一实际值和第一预测值的第一混淆矩阵;构建随机森林树分类模型输出的第二实际值和第二预测值的第二混淆矩阵;构建极限梯度提升树分类模型输出的第三真实值和第三预测值的第三混淆矩阵;所述通过混淆矩阵计算出所述网约车识别数据模型的真阳率、假阳率和整体准确率,包括:通过第一混淆矩阵、第二混淆矩阵以及第三混淆矩阵计算出所述网约车识别数据模型的真阳率、假阳率和整体准确...

【专利技术属性】
技术研发人员:邹家伟于忠华叶灵玲熊寅庚
申请(专利权)人:珠海鼎然信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1