【技术实现步骤摘要】
一种车辆匹配方法、装置及计算设备
本专利技术涉及计算机
,尤其涉及一种车辆匹配方法、装置及计算设备。
技术介绍
在公交体系中,用户刷码或刷卡的乘车消费数据和车辆自身的动态数据通常存储在不同的数据源中,如果需要将不同数据源中的数据进行关联,例如需要将数据源1中的某车辆的用户乘车记录与数据源2中该车辆的车辆动态数据进行关联,则需要先从数据源2中识别出与数据源1中的该车辆为同一辆车的车辆,也就是说,需要先将不同数据源中的车辆进行配对,以找到不同数据源中的同一车辆,所以,对不同数据源中的车辆进行匹配是目前需要解决的问题。
技术实现思路
本专利技术实施例提供一种车辆匹配方法、装置及计算设备,用于对不同数据源中的车辆进行匹配,提高车辆的匹配效率和准确性。一方面,提供一种车辆匹配方法,所述方法包括:获得统计时间段内的用户乘车数据和车辆进出站数据,其中,所述用户乘车数据和所述车辆进出站数据均包括多个车辆标识;针对所述用户乘车数据中的每个车辆标识,根据将所述统计时间段划分成的M个时间分段和所述 ...
【技术保护点】
1.一种车辆匹配方法,其特征在于,所述方法包括:/n获得统计时间段内的用户乘车数据和车辆进出站数据,其中,所述用户乘车数据和所述车辆进出站数据均包括多个车辆标识;/n针对所述用户乘车数据中的每个车辆标识,根据将所述统计时间段划分成的M个时间分段和所述用户乘车数据构建该车辆标识对应的M维的用户时序向量,以得到用户时序向量集合,其中,每个用户时序向量包括的M个用户分量与所述M个时间分段一一对应,每个用户分量用于指示在对应的时间分段中是否存在对应车辆标识关联的有效的用户乘车数据;/n针对所述车辆进出站数据中的每个车辆标识,根据所述M个时间分段和所述车辆进出站数据构建该车辆标识对应 ...
【技术特征摘要】
1.一种车辆匹配方法,其特征在于,所述方法包括:
获得统计时间段内的用户乘车数据和车辆进出站数据,其中,所述用户乘车数据和所述车辆进出站数据均包括多个车辆标识;
针对所述用户乘车数据中的每个车辆标识,根据将所述统计时间段划分成的M个时间分段和所述用户乘车数据构建该车辆标识对应的M维的用户时序向量,以得到用户时序向量集合,其中,每个用户时序向量包括的M个用户分量与所述M个时间分段一一对应,每个用户分量用于指示在对应的时间分段中是否存在对应车辆标识关联的有效的用户乘车数据;
针对所述车辆进出站数据中的每个车辆标识,根据所述M个时间分段和所述车辆进出站数据构建该车辆标识对应的M维的车辆时序向量,以得到车辆时序向量集合,其中,每个车辆时序向量包括的M个车辆分量与所述M个时间分段一一对应,每个车辆分量用于指示在对应的时间分段中是否存在对应车辆标识关联的有效的车辆进出站数据;
分别确定所述用户时序向量集合和所述车辆时序向量集合中位于不同集合中的每两个向量之间的相似度;
根据相似度满足预设条件的两个向量对应的车辆标识,确定所述用户乘车数据和所述车辆进出站数据中的配对车辆对。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
以预定时间划分方式将所述统计时间段划分为所述M个时间分段;
构建M维的初始时序向量,其中,所述初始时序向量中的M个分量与所述M个时间分段一一对应,所述M个分量均为第一预定值,所述第一预定值指示在对应的时间分段中不包括任何有效数据。
3.如权利要求2所述的方法,其特征在于,针对所述用户乘车数据中的每个车辆标识,根据将所述统计时间段划分成的M个时间分段和所述用户乘车数据构建该车辆标识对应的M维的用户时序向量,包括:
从所述用户乘车数据中确定该车辆标识关联的多条有效用户数据;
将每条有效用户数据的生成时间分别与所述M个时间分段进行匹配,以确定包括有效用户数据的第一目标时间分段;
将所述初始时序向量中与所述第一目标时间分段对应的分量由所述第一预定值置为第二预定值,其中,所述第二预定值指示在对应的时间分段中存在有效的用户乘车数据;
将重置后的初始时序向量确定为该车辆标识对应的用户时序向量。
4.如权利要求2所述的方法,其特征在于,针对所述车辆进出站数据中的每个车辆标识,根据所述M个时间分段和所述车辆进出站数据构建该车辆标识对应的M维的车辆时序向量,包括:
从所述车辆进出站数据中确定该车辆标识关联的多条有效车辆数据;
将每条有效车辆数据的生成时间分别与所述M个时间分段进行匹配,以确定包括有效车辆数据的第二目标时间分段;
将所述初始时序向量中与所述第二目标时间分段对应的分量由所述第一预定值置为第二预定值,其中,所述第二预定值指示在对应的时间分段中存在有效的车辆进出站数据;
将重置后的初始时序向量确定为该车辆标识对应的车辆时序向量。
5.如权利要求3或4所述的方法,其特征在于,所述第一预定值和所述第二预定值为不同的二进制数。
6.如权利要求1-4任一所述的方法,其特征在于,分别确定所述用户时序向量集合和所述车辆时序向量集合中位于不同集合中的每两个向量之间的相似度,包括:
采用至少两种相似度算法分别确定所述用户时序向量集合和所述车辆时序向量集合中位于不同集合中的每两个向量之间的相似度;
将每两个向量之间的至少两个相似度计算结果的平均值作为该两个向量之间的相似度。
7.如权利要求1-4任一所述的方法,其特征在于,根据相似度满足预设条件的两个向量对应的车辆标识确定所述用户乘车数据...
【专利技术属性】
技术研发人员:高兆远,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。