路况数据筛选方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:24208645 阅读:30 留言:0更新日期:2020-05-20 15:49
本发明专利技术公开了一种路况数据筛选方法、装置、计算机设备及存储介质,获取路况样本数据集,将路况样本数据集分为训练路况数据集和验证路况数据集;分别对训练路况数据集中的每一训练路况数据和验证路况数据集中的每一验证路况数据进行特征提取,得到N个训练特征值和M个验证特征值;对每一训练特征值和每一验证特征值进行特征编码,得到训练特征编码和验证特征编码;计算训练路况数据集中每一路况特征的训练特征编码与对应的验证路况数据集中路况特征的验证特征编码的特征相似度;提取出特征相似度大于相似度阈值的路况特征,得到目标路况特征;从而保证了生成的目标路况特征的稳定性和精确性,提高了对路况数据进行筛选的准确性。

Road condition data screening method, device, computer equipment and storage medium

【技术实现步骤摘要】
路况数据筛选方法、装置、计算机设备及存储介质
本专利技术涉及数据处理领域,尤其涉及一种路况数据筛选方法、装置、计算机设备及存储介质。
技术介绍
随着互联网技术的不断发展,先进交通信息服务系统在完善的信息网络基础上,获得各类交通信息并进行综合处理,实时向社会提供全面、准确的道路交通拥堵信息。然而,由于先进交通信息服务系统的数据源是实时获取的,只能反馈出实时的路况信息,不能实现路况的预测以警示出行者,从而导致经常出现交通堵点疏散不及时的现象。因此,利用历史路况数据进行路况的预测是解决交通堵点疏散不及时现象的重要手段之一。但是,由于上下班高峰期时的路况数据比正常时间段的路况数据往往会有较明显的波动,只使用常规的模型学习得到的结果不能很好的表征路况的实时情况。因此,对获取的路况数据的特征往往有着较高的要求,例如:历史路况数据特征的稳定性,历史路况数据特征的多样性以及历史路况数据特征的平衡等,以更好地保证后续预测的准确性。
技术实现思路
本专利技术实施例提供一种路况数据筛选方法、装置、计算机设备及存储介质,以解决对路况数据进行筛选的准确性较低问题。一种路况数据筛选方法,包括:获取路况样本数据集,将所述路况样本数据集分为训练路况数据集和验证路况数据集;对所述训练路况数据集中的每一训练路况数据进行特征提取,得到所述训练路况数据集的N组训练特征值;对所述验证路况数据集中的每一验证路况数据进行特征提取,得到所述验证路况数据集的M组验证特征值;对所述训练路况数据集中的每一所述训练特征值进行特征编码,得到所述训练路况数据集的训练特征编码,所述训练特征编码为所述训练路况数据集中每一路况特征对应的编码;对所述验证路况数据集中的每一所述验证特征值进行特征编码,得到所述验证路况数据集的验证特征编码,所述验证特征编码为所述验证路况数据集中每一路况特征对应的编码;计算所述训练路况数据集中每一所述路况特征的所述训练特征编码与对应的所述验证路况数据集中所述路况特征的所述验证特征编码的特征相似度;提取出所述特征相似度大于相似度阈值的路况特征,得到目标路况特征。一种路况数据筛选装置,包括:路况样本数据集获取模块,用于获取路况样本数据集,将所述路况样本数据集分为训练路况数据集和验证路况数据集;第一特征提取模块,用于对所述训练路况数据集中的每一训练路况数据进行特征提取,得到所述训练路况数据集的N组训练特征值;第二特征提取模块,用于对所述验证路况数据集中的每一验证路况数据进行特征提取,得到所述验证路况数据集的M组验证特征值;第一特征编码模块,用于对所述训练路况数据集中的每一所述训练特征值进行特征编码,得到所述训练路况数据集的训练特征编码,所述训练特征编码为所述训练路况数据集中每一路况特征对应的编码;第二特征编码模块,用于对所述验证路况数据集中的每一所述验证特征值进行特征编码,得到所述验证路况数据集的验证特征编码,所述验证特征编码为所述验证路况数据集中每一路况特征对应的编码;特征相似度计算模块,用于计算所述训练路况数据集中每一所述路况特征的所述训练特征编码与对应的所述验证路况数据集中所述路况特征的所述验证特征编码的特征相似度;目标路况特征生成模块,用于提取出所述特征相似度大于相似度阈值的路况特征,得到目标路况特征。一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述路况数据筛选方法。一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述路况数据筛选方法。上述路况数据筛选方法、装置、计算机设备及存储介质,获取路况样本数据集,将路况样本数据集分为训练路况数据集和验证路况数据集;对训练路况数据集中的每一训练路况数据进行特征提取,得到训练路况数据集的N个训练特征值;对验证路况数据集中的每一验证路况数据进行特征提取,得到验证路况数据集的M个验证特征值;对训练路况数据集中的每一训练特征值进行特征编码,得到训练路况数据集的训练特征编码,训练特征编码为训练路况数据集中每一路况特征对应的编码;对验证路况数据集中的每一验证特征值进行特征编码,得到验证路况数据集的验证特征编码,验证特征编码为验证路况数据集中每一路况特征对应的编码;计算训练路况数据集中每一路况特征的训练特征编码与对应的验证路况数据集中路况特征的验证特征编码的特征相似度;提取出特征相似度大于相似度阈值的路况特征,得到目标路况特征;通过将训练路况数据集的训练特征编码和验证路况数据集的验证特征编码进行特征相似度比较,筛选出特征相似度大于相似度阈值的目标路况特征的,从而保证了生成的目标路况特征的稳定性和精确性,提高了对路况数据进行筛选的准确性。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一实施例中路况数据筛选方法的一应用环境示意图;图2是本专利技术一实施例中路况数据筛选方法的一示例图;图3是本专利技术一实施例中路况数据筛选方法的另一示例图;图4是本专利技术一实施例中路况数据筛选方法的另一示例图;图5是本专利技术一实施例中路况数据筛选方法的另一示例图;图6是本专利技术一实施例中路况数据筛选方法的另一示例图;图7是本专利技术一实施例中路况数据筛选装置的一原理框图;图8是本专利技术一实施例中路况数据筛选装置的另一原理框图;图9是本专利技术一实施例中路况数据筛选装置的另一原理框图;图10是本专利技术一实施例中计算机设备的一示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供的路况数据筛选方法,该路况数据筛选方法可应用如图1所示的应用环境中。具体地,该路况数据筛选方法应用在路况数据筛选系统中,该路况数据筛选系统包括如图1所示的客户端和服务端,客户端与服务端通过网络进行通信,用于解决对路况数据进行筛选的准确性较低问题。其中,客户端又称为用户端,是指与服务端相对应,为客户提供本地服务的程序。客户端可安装在但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备上。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在一实施例中,如图2所示,提供一种路况数据筛选方法,以该方法应用在图1中的服务端为例进行说明,包括如下步骤:S10:获取路况样本数据集,将路况样本数据集分为训练路况数据集和验证路况数据集。<本文档来自技高网...

【技术保护点】
1.一种路况数据筛选方法,其特征在于,包括:/n获取路况样本数据集,将所述路况样本数据集分为训练路况数据集和验证路况数据集;/n对所述训练路况数据集中的每一训练路况数据进行特征提取,得到所述训练路况数据集的N组训练特征值;/n对所述验证路况数据集中的每一验证路况数据进行特征提取,得到所述验证路况数据集的M组验证特征值;/n对所述训练路况数据集中的每一所述训练特征值进行特征编码,得到所述训练路况数据集的训练特征编码,所述训练特征编码为所述训练路况数据集中每一路况特征对应的编码;/n对所述验证路况数据集中的每一所述验证特征值进行特征编码,得到所述验证路况数据集的验证特征编码,所述验证特征编码为所述验证路况数据集中每一路况特征对应的编码;/n计算所述训练路况数据集中每一所述路况特征的所述训练特征编码与对应的所述验证路况数据集中所述路况特征的所述验证特征编码的特征相似度;/n提取出所述特征相似度大于相似度阈值的路况特征,得到目标路况特征。/n

【技术特征摘要】
1.一种路况数据筛选方法,其特征在于,包括:
获取路况样本数据集,将所述路况样本数据集分为训练路况数据集和验证路况数据集;
对所述训练路况数据集中的每一训练路况数据进行特征提取,得到所述训练路况数据集的N组训练特征值;
对所述验证路况数据集中的每一验证路况数据进行特征提取,得到所述验证路况数据集的M组验证特征值;
对所述训练路况数据集中的每一所述训练特征值进行特征编码,得到所述训练路况数据集的训练特征编码,所述训练特征编码为所述训练路况数据集中每一路况特征对应的编码;
对所述验证路况数据集中的每一所述验证特征值进行特征编码,得到所述验证路况数据集的验证特征编码,所述验证特征编码为所述验证路况数据集中每一路况特征对应的编码;
计算所述训练路况数据集中每一所述路况特征的所述训练特征编码与对应的所述验证路况数据集中所述路况特征的所述验证特征编码的特征相似度;
提取出所述特征相似度大于相似度阈值的路况特征,得到目标路况特征。


2.如权利要求1所述的路况数据筛选方法,其特征在于,所述在对所述验证路况数据集中的每一所述验证特征值进行特征编码之后,且在计算所述训练路况数据集中每一所述路况特征的所述训练特征编码与对应的所述验证路况数据集中所述路况特征的所述验证特征编码的特征相似度之前,所述路况数据筛选方法还包括:
判断所述训练特征编码和所述验证特征编码之间是否存在缺失编码值;
若所述训练特征编码和所述验证特征编码之间存在所述缺失编码值,则采用基于正则化最大期望算法进行缺失值填补,得到目标训练特征编码和目标验证特征编码。


3.如权利要求1所述的路况数据筛选方法,其特征在于,所述在计算所述训练路况数据集中每一所述路况特征的所述训练特征编码与对应的所述验证路况数据集中所述路况特征的所述验证特征编码的特征相似度之后,所述路况数据筛选还包括:
提取出所述特征相似度大于相似度阈值的路况特征,作为正常特征,提取出所述特征相似度小于或等于相似度阈值的路况特征,作为异常特征;
分别对所述正常特征和所述异常特征进行标签设置,得到标签信息;
基于所述标签信息,将所述正常特征和所述异常特征存入预设信息数据库中。


4.如权利要求1所述的路况数据筛选方法,其特征在于,所述对所述训练路况数据集中的每一所述训练特征值进行特征编码,得到所述训练路况数据集的训练特征编码,包括:
获取所述训练路况数据集中的每一所述训练特征值,对每一所述训练特征值进行训练,生成梯度提升决策树模型;
将每一所述训练特征值输入所述梯度提升决策树模型中进行特征编码,得到所述训练路况数据集的训练特征编码。


5.如权利要求1所述的路况数据筛选方法,其特征在于,所述对所述训练路况数据集中的每一训练路况数据进行特征提取,得到所述训练路况数据集的N组训练特征值,包...

【专利技术属性】
技术研发人员:孙双
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1