一种非法省际客运经营车辆违法行为智能检测方法技术

技术编号:39187151 阅读:8 留言:0更新日期:2023-10-27 08:34
本发明专利技术提供一种非法省际客运经营车辆违法行为智能检测方法,包括步骤一,数据收集与预处理;步骤二,对预处理的数据进行特征提取与处理;步骤三,构建梯度提升树模型,进行模型训练;步骤四,模型验证与优化;步骤五,非法省际客运经营车辆违法行为识别;步骤六,违法行为证据收集与处理。该方法实现对非法省际客运经营车辆违法行为的自动识别和预警。经营车辆违法行为的自动识别和预警。经营车辆违法行为的自动识别和预警。

【技术实现步骤摘要】
一种非法省际客运经营车辆违法行为智能检测方法


[0001]本专利技术属于交通管理和大数据分析领域,尤其是关于基于ETC数据和历史行政处罚案件信息的非法省际客运经营车辆违法行为智能检测方法属于公路基础设施数字化建模领域,具体涉及一种非法省际客运经营车辆违法行为智能检测方法。

技术介绍

[0002]现有的非法省际客运经营车辆(未取得道路客运经营许可,擅自从事道路客运经营)违法行为识别技术主要依赖于人工巡查和监控视频抓拍。这些方法存在一定的局限性,如人力成本高、准确率受限、实时性不足等。此外,现有技术对于大规模的车辆数据处理和分析能力有限,难以满足对非法省际客运经营车辆违法行为的实时监控和预防需求。
[0003]针对现有技术的不足,本专利技术提出了一种非法省际客运经营车辆违法行为智能检测方法。该方法基于数据挖掘和机器学习技术的非法省际客运经营车辆违法行为识别方法。该方法利用丰富的ETC通行数据、历史行政处罚案件信息等数据源,通过特征提取与处理、模型训练与验证等步骤,实现对非法省际客运经营车辆违法行为的自动识别和预警。

技术实现思路

[0004]本专利技术提供了提出了一种非法省际客运经营车辆违法行为智能检测方法。该方法利用丰富的ETC通行数据、历史行政处罚案件信息等数据源,通过特征提取与处理、模型训练与验证等步骤,实现对非法省际客运经营车辆违法行为的自动识别和预警。
[0005]为了解决上述技术问题,本专利技术提出一种非法省际客运经营车辆违法行为智能检测方法,该方法包括以下步骤:步骤一,数据收集与预处理;采集数据,对采集到的数据进行预处理;步骤二,对预处理的数据进行特征提取与处理;步骤三,构建梯度提升树模型,进行模型训练;步骤四,模型验证与优化;其中,应用k折交叉验证方法评估梯度提升树机器学习模型的性能;使用网格搜索方法对梯度提升树模型的超参数进行调优,找到最佳参数组合;步骤五,非法省际客运经营车辆违法行为识别;其中,使用训练好的梯度提升树模型对新的车辆特征向量进行预测,得到预测结果;设定一个阈值,当预测结果超过阈值时,判断该车辆存在省际客运黑车违法行为;步骤六,违法行为证据收集与处理;其中,对于该车的通行数据和监控视频进行抓拍和数据收集;当发现存在违法行为时,通知交通管理部门或车辆所属公司,采取措施;对违法行为进行统计分析。
[0006]可选地,所述步骤一,包括,1.1 从各个数据源定期或实时采集相关数据,包括历史行政处罚案件信息、ETC通行数据和车辆信息,所述ETC通行数据包括日期时间、高速入口、高速出口、高速门架经纬
度;1.2 对收集到的数据进行预处理,包括数据清洗、数据整合和缺失值处理。
[0007]可选地,所述步骤二,包括,2.1 从预处理后的数据中提取关键特征,分为以下几类:a. 行驶轨迹特征:根据高速门架经纬度数据,计算车辆在高速公路上的行驶轨迹,并进行聚类分析;b. 行驶时间特征:计算每辆车在高速公路上的行驶时间及特定时间段内的行驶时间占比;c. 行驶速度特征:计算车辆的平均速度、最高速度、最低速度以及速度分布的偏度和峰度;d. 高速出入口信息特征:分析每辆车的高速入口和出口数据,统计频率、转换频率及时间间隔;e. 历史违法行为特征:统计每辆车的历史违法行为次数、违法类型分布以及违法行为发生的时间和地点;f. 时间与空间特征:提取车辆在不同时间段和地理位置的通行特征;2.2 特征权重设定,使用LASSO回归作为特征选择算法,所述LASSO回归是一种线性回归的扩展,在损失函数中加入了正则化项,使得所述LASSO回归在拟合过程中能够进行特征选择;通过对LASSO回归的正则化参数进行调优,找到一个合适的参数值,使得模型只保留对目标变量有较大影响力的特征,从而实现特征筛选;损失函数如下:,其中,n是样本数量,表示车辆的数量;p是特征数量,表示提取的车辆行驶特征的数量;y
i
是第i个样本的目标变量,表示第i辆车是否为非法省际客运经营车辆违法行为,当i=0表示非省际非法客运经营车辆违法行为,i=1表示非法省际客运经营车辆违法行为;x
ij
是第i个样本的第j个特征,表示第i辆车的第j个行驶特征;β
j
是第j个特征的回归系数,表示第j个特征对非法省际客运经营车辆违法行为的影响力;α是正则化参数,用于控制模型的复杂度和特征选择的程度;2.3 确定目标,在特征选择过程中,目标是筛选出对非法省际客运经营车辆违法行为识别最具有影响力的特征;使用已知的非法省际客运经营车辆违法行为数据作为训练数据,所述违法行为数据包括特征和对应的标签;对于LASSO回归,目标变量设定一个二分类变量,0表示非省际非法客运经营车辆违法行为,1表示非法省际客运经营车辆违法行为,特征对应步骤二中提取的特征;2.4 使用LASSO回归进行特征选择后,得到的模型参数,即回归系数,作为特征权重;所述特征权重反映了各个特征在非法省际客运经营车辆违法行为识别中的相对重要性;所述特征权重根据特征在LASSO回归中的回归系数进行分配;对于具有较大回归系数的特征,认为其对非法省际客运经营车辆违法行为识别具有较大的影响力。
[0008]可选地,所述步骤三,包括,3.1 数据准备:使用已知的非法省际客运经营车辆违法行为数据作为训练集,将筛选后的特征向量与对应的标签,是否为非法省际客运经营车辆违法行为,进行匹配;将数据集分为训练集和验证集,以便在训练过程中评估模型性能;3.2 模型初始化:选择梯度提升树模型作为分类器,并根据问题特点设定初始参数,其中,所述参数包括树的数量、树的最大深度、学习率;3.3 特征权重:根据步骤二中得到的特征权重,在梯度提升树模型训练过程中,对各个特征进行加权处理;3.4 模型训练:使用训练集对梯度提升树模型进行训练;在训练过程中,监测模型在验证集上的性能,并记录每次迭代的训练误差和验证误差。
[0009]可选地,所述步骤四,包括,4.1 应用k折交叉验证:使用k折交叉验证方法评估梯度提升树模型的性能;k折交叉验证允许在不牺牲数据集规模的情况下,对模型进行全面评估,从而提高非法省际客运经营车辆识别准确率;4.1.1将已知的非法省际客运经营车辆违法行为数据划分为k个子集;4.1.2 在k次迭代中,每次选择一个子集作为验证集,其余子集作为训练集,使用训练集对梯度提升树模型进行训练;4.1.3 在验证集上评估模型性能,记录准确率、召回率、F1分数等性能指标;重复这个过程k次,使得每个子集都被用作验证集;4.1.4 计算k次迭代的平均性能指标,作为梯度提升树模型的评估结果;4.2 应用网格搜索:使用网格搜索方法对梯度提升树模型的超参数进行调优;网格搜索运行系统地遍历所有可能的超参数组合,找到最佳参数组合,从而提高模型的预测精度和稳定性;4.2.1 确定梯度提升树模型的超参数搜索空间;设置一系列可能的取值范围,以便在网格搜索过程中遍历这些参数组合;4.2.2 对于每一个超参数组合,利用步骤4.1中的k折交叉验证评估模型性能;计算k次迭代的平均性能指标,作为当前超参数组合的评估结果;4.2本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种非法省际客运经营车辆违法行为智能检测方法,其特征在于,该方法包括以下步骤:步骤一,数据收集与预处理;采集数据,对采集到的数据进行预处理;步骤二,对预处理的数据进行特征提取与处理;步骤三,构建梯度提升树模型,进行模型训练;步骤四,模型验证与优化;其中,应用k折交叉验证方法评估梯度提升树机器学习模型的性能;使用网格搜索方法对梯度提升树模型的超参数进行调优,找到最佳参数组合;步骤五,非法省际客运经营车辆违法行为识别;其中,使用训练好的梯度提升树模型对新的车辆特征向量进行预测,得到预测结果;设定一个阈值,当预测结果超过阈值时,判断该车辆存在省际客运黑车违法行为;步骤六,违法行为证据收集与处理;其中,对于该车的通行数据和监控视频进行抓拍和数据收集;当发现存在违法行为时,通知交通管理部门或车辆所属公司,采取措施;对违法行为进行统计分析。2.根据权利要求1所述的一种非法省际客运经营车辆违法行为智能检测方法,其特征在于,该方法还包括:所述步骤一,包括,1.1 从各个数据源定期或实时采集相关数据,包括历史行政处罚案件信息、ETC通行数据和车辆信息,所述ETC通行数据包括日期时间、高速入口、高速出口、高速门架经纬度;1.2 对收集到的数据进行预处理,包括数据清洗、数据整合和缺失值处理。3.根据权利要求1或2所述的一种非法省际客运经营车辆违法行为智能检测方法,其特征在于,该方法还包括:所述步骤二,包括,2.1 从预处理后的数据中提取关键特征,分为以下几类:a. 行驶轨迹特征:根据高速门架经纬度数据,计算车辆在高速公路上的行驶轨迹,并进行聚类分析;b. 行驶时间特征:计算每辆车在高速公路上的行驶时间及特定时间段内的行驶时间占比;c. 行驶速度特征:计算车辆的平均速度、最高速度、最低速度以及速度分布的偏度和峰度;d. 高速出入口信息特征:分析每辆车的高速入口和出口数据,统计频率、转换频率及时间间隔;e. 历史违法行为特征:统计每辆车的历史违法行为次数、违法类型分布以及违法行为发生的时间和地点;f. 时间与空间特征:提取车辆在不同时间段和地理位置的通行特征;2.2 特征权重设定,使用LASSO回归作为特征选择算法,所述LASSO回归是一种线性回归的扩展,在损失函数中加入了正则化项,使得所述LASSO回归在拟合过程中能够进行特征选择;通过对LASSO回归的正则化参数进行调优,找到一个合适的参数值,使得模型只保留对目标变量有较大影响力的特征,从而实现特征筛选;
损失函数如下:,其中,n是样本数量,表示车辆的数量;p是特征数量,表示提取的车辆行驶特征的数量;y
i
是第i个样本的目标变量,表示第i辆车是否为非法省际客运经营车辆违法行为,当i=0表示非省际非法客运经营车辆违法行为,i=1表示非法省际客运经营车辆违法行为;x
ij
是第i个样本的第j个特征,表示第i辆车的第j个行驶特征;β
j
是第j个特征的回归系数,表示第j个特征对非法省际客运经营车辆违法行为的影响力;α是正则化参数,用于控制模型的复杂度和特征选择的程度;2.3 确定目标,在特征选择过程中,目标是筛选出对非法省际客运经营车辆违法行为识别最具有影响力的特征;使用已知的非法省际客运经营车辆违法行为数据作为训练数据,所述违法行为数据包括特征和对应的标签;对于LASSO回归,目标变量设定一个二分类变量,0表示非省际非法客运经营车辆违法行为,1表示非法省际客运经营车辆违法行为,特征对应步骤二中提取的特征;2.4 使用LASSO回归进行特征选择后,得到的模型参数,即回归系数,作为特征权重;所述特征权重反映了各个特征在非法省际客运经营车辆违法行为识别中的相对重要性;所述特征权重根据特征在LASSO回归中的回归系数进行分配;对于具有较大回归系数的特征,认为其对非法省际客运经营车辆违法行为识别具有较...

【专利技术属性】
技术研发人员:肖晖张晓亮裴光石包左军刘冬梅丁丽媛骆林赵琳乔国梁
申请(专利权)人:中路高科交通科技集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1