System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于车联网的网约车识别系统及方法技术方案_技高网

一种基于车联网的网约车识别系统及方法技术方案

技术编号:40308375 阅读:5 留言:0更新日期:2024-02-07 20:52
本发明专利技术涉及车联网技术领域,具体涉及一种基于车联网的网约车识别系统及方法,采集数据,并对数据进行质量分析和样本筛选;对样本进行特征工程构建;根据样本特征进行模型构建;对构建模型进行检验分析。填补了国内网约车分类识别研究领域的空白,使用实时车联网数据,依托大量历史数据进行特征构建,相较于基于图像识别的模型可靠性更高,相较于一般数据处理,使用轨迹数据进行样本筛选,相较于一般模型样本数据标注准确性更高,进行了参数选择和模型优化工作,并使用三方数据源有力证明了模型的有效性和泛化能力,解决了现有技术网约车识别精度低,模型泛化能力低的问题。

【技术实现步骤摘要】

本专利技术涉及车联网,尤其涉及一种基于车联网的网约车识别系统及方法


技术介绍

1、目前,关于网约车方面的研究,主要集中在市场趋势及政策研究、用户需求及出行特征分析、车辆调度与路径优化等方面,而对于网约车分类识别这一细分领域,当前国内现有的研究成果较少。这就导致政府无法准确识别车辆是否是网约车以及其作为网约车的天数。

2、现有公告号cn114239680a中公开了一种基于机器学习算法的新能源网约车识别方法及系统,包括:预处理数据,去除空数据和异常数据;统计里程、方向角变化率,记录每日每次出行数据;清洗与处理数据,将某车某天的特征作为样本,得到某天是否从事相关活动的标签;将经过处理得到的数据集按比例分为训练集、验证集、测试集;构造人工神经网络作为识别模型;确定神经网络的初始参数,调整不同模型参数,训练模型,选出最优参数组合;将最优参数组合用测试集的数据测试其性能,达到要求训练结束。能够识别新能源车某天是否从事网约车相关活动,以实现预测新能源车某天是否从事网约车相关活动。

3、但是,上述基于机器学习算法的新能源网约车识别方法及系统采集的样本数据少,标注不可靠,数据质量低,存在网约车识别精度低,模型泛化能力低的问题。


技术实现思路

1、本专利技术的目的在于提供一种基于车联网的网约车识别系统及方法,解决了上述基于机器学习算法的新能源网约车识别方法及系统采集的样本数据少,标注不可靠,数据质量低,网约车识别精度低,模型泛化能力低的问题。

2、为实现上述目的,本专利技术提供了一种基于车联网的网约车识别方法,包括以下步骤:

3、采集数据,并对所述数据进行质量分析和样本筛选;

4、对样本进行特征工程构建;

5、根据样本特征进行模型构建;

6、对构建模型进行检验分析。

7、其中,采集数据,并对所述数据进行质量分析和样本筛选,所述步骤还包括:

8、所述数据包括车架号、采集时间、经纬度、里程值、车辆类型、车辆级别、品牌级别,其中,所述数据采集周期为10秒,并对车辆出行数据按次切分,形成次表数据。

9、其中,采集数据,并对所述数据进行质量分析和样本筛选,所述步骤还包括:

10、按照车辆标签筛选历史数据进行数据完整性检验,查看各个字段空值、缺失数据情况,对于缺失数据行,采用直接删除的处理方式,使用基于规则的异常检验方式进行数据准确性检验。

11、其中,使用基于规则的异常检验方式进行数据准确性检验,所述步骤还包括:

12、针对车辆经纬度数据异常情况,设置经纬度正常范围,不在正常范围内的经纬度数据采取直接删除的处理方式;针对车辆采集时间数据异常情况,设置时间戳正常范围,不在正常范围内的采集时间数据采取直接删除的处理方式;针对车辆里程值数据异常情况,若出行结束时间里程值低于出行起始时间里程值,视为里程数据异常,采取直接删除的处理方式。

13、其中,采集数据,并对所述数据进行质量分析和样本筛选,所述步骤还包括:

14、针对数据标注不准确的情况,对数据进行样本筛选,其中,网约车工作日出行每次行驶起止停留点多为不固定地点,通勤车工作日出行每次行驶起止停留点多为固定地点,绘出车辆历史时间内工作日次行停留点经纬度的简略轨迹图,据此进行错误标签样本筛选。

15、其中,对样本进行特征工程构建,所述步骤还包括:

16、对样本进行静态信息特征构建,包括车辆级别、车辆类别和品牌级别,对样本进行动态信息特征构建,包括日均里程、日均行驶时长、轨迹相似度和出行时区。

17、其中,根据样本特征进行模型构建,所述步骤还包括:

18、在进行模型训练时,使用80%的数据作为训练集,剩下20%的数据作为测试集,并且训练集的准确率采用5折交叉验证的均值进行衡量,网约车识别为二分类问题,选择常见的分类算法进行模型构建。

19、其中,对构建模型进行检验分析,所述步骤还包括:

20、采用三方数据进行额外验证,使用保险行业出险数据进行模型准确性验证。

21、一种基于车联网的网约车识别系统,包括数据处理模块、特征工程模块、模型构建模块和检验分析模块,所述数据处理模块与所述特征工程模块连接,所述模型构建模块与所述特征工程模块连接,所述检验分析模块与所述模型构建模块连接,

22、所述数据分析模块,用于采集数据,并对所述数据进行质量分析和样本筛选;

23、所述特征工程模块,用于对样本进行特征工程构建;

24、所述模型构建模块,用于根据样本特征进行模型构建;

25、所述检验分析模块,用于对构建模型进行检验分析。

26、本专利技术的一种基于车联网的网约车识别系统及方法,采集数据,并对所述数据进行质量分析和样本筛选;对样本进行特征工程构建;根据样本特征进行模型构建;对构建模型进行检验分析。填补了国内网约车分类识别研究领域的空白,使用实时车联网数据,依托大量历史数据进行特征构建,相较于基于图像识别的模型可靠性更高,相较于一般数据处理,使用轨迹数据进行样本筛选,相较于一般模型样本数据标注准确性更高,进行了参数选择和模型优化工作,并使用三方数据源有力证明了模型的有效性和泛化能力,解决了现有技术采集的样本数据少,标注不可靠,数据质量低,存在网约车识别精度低,模型泛化能力低的问题。

本文档来自技高网...

【技术保护点】

1.一种基于车联网的网约车识别方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于车联网的网约车识别方法,其特征在于,采集数据,并对所述数据进行质量分析和样本筛选,所述步骤还包括:

3.如权利要求2所述的基于车联网的网约车识别方法,其特征在于,采集数据,并对所述数据进行质量分析和样本筛选,所述步骤还包括:

4.如权利要求3所述的基于车联网的网约车识别方法,其特征在于,使用基于规则的异常检验方式进行数据准确性检验,所述步骤还包括:

5.如权利要求4所述的基于车联网的网约车识别方法,其特征在于,采集数据,并对所述数据进行质量分析和样本筛选,所述步骤还包括:

6.如权利要求5所述的基于车联网的网约车识别方法,其特征在于,对样本进行特征工程构建,所述步骤还包括:

7.如权利要求6所述的基于车联网的网约车识别方法,其特征在于,根据样本特征进行模型构建,所述步骤还包括:

8.如权利要求1所述的基于车联网的网约车识别方法,其特征在于,对构建模型进行检验分析,所述步骤还包括:

9.一种基于车联网的网约车识别系统,适用于如权利要求1所述的基于车联网的网约车识别方法,其特征在于,包括数据处理模块、特征工程模块、模型构建模块和检验分析模块,所述数据处理模块与所述特征工程模块连接,所述模型构建模块与所述特征工程模块连接,所述检验分析模块与所述模型构建模块连接,

...

【技术特征摘要】

1.一种基于车联网的网约车识别方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于车联网的网约车识别方法,其特征在于,采集数据,并对所述数据进行质量分析和样本筛选,所述步骤还包括:

3.如权利要求2所述的基于车联网的网约车识别方法,其特征在于,采集数据,并对所述数据进行质量分析和样本筛选,所述步骤还包括:

4.如权利要求3所述的基于车联网的网约车识别方法,其特征在于,使用基于规则的异常检验方式进行数据准确性检验,所述步骤还包括:

5.如权利要求4所述的基于车联网的网约车识别方法,其特征在于,采集数据,并对所述数据进行质量分析和样本筛选,所述步骤还包括:

6...

【专利技术属性】
技术研发人员:付亚同
申请(专利权)人:上海市新能源汽车公共数据采集与监测研究中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1