【技术实现步骤摘要】
路况数据筛选方法、装置、计算机设备及存储介质
本专利技术涉及数据处理领域,尤其涉及一种路况数据筛选方法、装置、计算机设备及存储介质。
技术介绍
随着互联网技术的不断发展,先进交通信息服务系统在完善的信息网络基础上,获得各类交通信息并进行综合处理,实时向社会提供全面、准确的道路交通拥堵信息。然而,由于先进交通信息服务系统的数据源是实时获取的,只能反馈出实时的路况信息,不能实现路况的预测以警示出行者,从而导致经常出现交通堵点疏散不及时的现象。因此,利用历史路况数据进行路况的预测是解决交通堵点疏散不及时现象的重要手段之一。但是,由于上下班高峰期时的路况数据比正常时间段的路况数据往往会有较明显的波动,只使用常规的模型学习得到的结果不能很好的表征路况的实时情况。因此,对获取的路况数据的特征往往有着较高的要求,例如:历史路况数据特征的稳定性,历史路况数据特征的多样性以及历史路况数据特征的平衡等,以更好地保证后续预测的准确性。
技术实现思路
本专利技术实施例提供一种路况数据筛选方法、装置、计算机设备及存储介质,以解决对路况数据进行筛选的准确性较低问题。一种路况数据筛选方法,包括:获取路况样本数据集,将所述路况样本数据集分为训练路况数据集和验证路况数据集;对所述训练路况数据集中的每一训练路况数据进行特征提取,得到所述训练路况数据集的N组训练特征值;对所述验证路况数据集中的每一验证路况数据进行特征提取,得到所述验证路况数据集的M组验证特征值;对所述训练路况数据集中的每一所述训 ...
【技术保护点】
1.一种路况数据筛选方法,其特征在于,包括:/n获取路况样本数据集,将所述路况样本数据集分为训练路况数据集和验证路况数据集;/n对所述训练路况数据集中的每一训练路况数据进行特征提取,得到所述训练路况数据集的N组训练特征值;/n对所述验证路况数据集中的每一验证路况数据进行特征提取,得到所述验证路况数据集的M组验证特征值;/n对所述训练路况数据集中的每一所述训练特征值进行特征编码,得到所述训练路况数据集的训练特征编码,所述训练特征编码为所述训练路况数据集中每一路况特征对应的编码;/n对所述验证路况数据集中的每一所述验证特征值进行特征编码,得到所述验证路况数据集的验证特征编码,所述验证特征编码为所述验证路况数据集中每一路况特征对应的编码;/n计算所述训练路况数据集中每一所述路况特征的所述训练特征编码与对应的所述验证路况数据集中所述路况特征的所述验证特征编码的特征相似度;/n提取出所述特征相似度大于相似度阈值的路况特征,得到目标路况特征。/n
【技术特征摘要】
1.一种路况数据筛选方法,其特征在于,包括:
获取路况样本数据集,将所述路况样本数据集分为训练路况数据集和验证路况数据集;
对所述训练路况数据集中的每一训练路况数据进行特征提取,得到所述训练路况数据集的N组训练特征值;
对所述验证路况数据集中的每一验证路况数据进行特征提取,得到所述验证路况数据集的M组验证特征值;
对所述训练路况数据集中的每一所述训练特征值进行特征编码,得到所述训练路况数据集的训练特征编码,所述训练特征编码为所述训练路况数据集中每一路况特征对应的编码;
对所述验证路况数据集中的每一所述验证特征值进行特征编码,得到所述验证路况数据集的验证特征编码,所述验证特征编码为所述验证路况数据集中每一路况特征对应的编码;
计算所述训练路况数据集中每一所述路况特征的所述训练特征编码与对应的所述验证路况数据集中所述路况特征的所述验证特征编码的特征相似度;
提取出所述特征相似度大于相似度阈值的路况特征,得到目标路况特征。
2.如权利要求1所述的路况数据筛选方法,其特征在于,所述在对所述验证路况数据集中的每一所述验证特征值进行特征编码之后,且在计算所述训练路况数据集中每一所述路况特征的所述训练特征编码与对应的所述验证路况数据集中所述路况特征的所述验证特征编码的特征相似度之前,所述路况数据筛选方法还包括:
判断所述训练特征编码和所述验证特征编码之间是否存在缺失编码值;
若所述训练特征编码和所述验证特征编码之间存在所述缺失编码值,则采用基于正则化最大期望算法进行缺失值填补,得到目标训练特征编码和目标验证特征编码。
3.如权利要求1所述的路况数据筛选方法,其特征在于,所述在计算所述训练路况数据集中每一所述路况特征的所述训练特征编码与对应的所述验证路况数据集中所述路况特征的所述验证特征编码的特征相似度之后,所述路况数据筛选还包括:
提取出所述特征相似度大于相似度阈值的路况特征,作为正常特征,提取出所述特征相似度小于或等于相似度阈值的路况特征,作为异常特征;
分别对所述正常特征和所述异常特征进行标签设置,得到标签信息;
基于所述标签信息,将所述正常特征和所述异常特征存入预设信息数据库中。
4.如权利要求1所述的路况数据筛选方法,其特征在于,所述对所述训练路况数据集中的每一所述训练特征值进行特征编码,得到所述训练路况数据集的训练特征编码,包括:
获取所述训练路况数据集中的每一所述训练特征值,对每一所述训练特征值进行训练,生成梯度提升决策树模型;
将每一所述训练特征值输入所述梯度提升决策树模型中进行特征编码,得到所述训练路况数据集的训练特征编码。
5.如权利要求1所述的路况数据筛选方法,其特征在于,所述对所述训练路况数据集中的每一训练路况数据进行特征提取,得到所述训练路况数据集的N组训练特征值,包...
【专利技术属性】
技术研发人员:孙双,
申请(专利权)人:中国平安人寿保险股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。