一种预测目的地地址的方法及系统技术方案

技术编号:20868176 阅读:31 留言:0更新日期:2019-04-17 09:40
本发明专利技术公开一种预测目的地地址的方法及系统。该方法包括:由分布式并行计算框架下的不同终端设备获取被拆分后的目的地地址候选坐标数据;将所述获取的目的地地址候选坐标数据采用密度聚类算法并行进行聚类运算,分别得到运算后的目的地地址坐标数据;将所述分别得到的运算后的目的地地址坐标数据进行汇总聚合,将汇总聚合后的目的地地址作为预测地址。本发明专利技术提供的方案,能更准确和快速地预测海量用户的目的地地址。

【技术实现步骤摘要】
一种预测目的地地址的方法及系统
本专利技术涉及车联网
,具体涉及一种预测目的地地址的方法及系统。
技术介绍
随着汽车技术和车联网技术的不断发展进步,车联网大数据的应用逐渐广泛。例如,可以根据大数据对车辆用户的家庭地址或公司地址等目的地地址进行预测。目前对车辆用户的家庭地址或公司地址进行预测的方法,大部分是在单台PC环境下,基于用户常去地址的GPS(GlobalPositioningSystem,全球定位系统)坐标,使用K-Means(K均值)或KNN(K-NearestNeighbor,K最近邻)等算法进行聚类,然后将聚类后的结果作为用户可能的家庭地址或公司地址。其中,K-Means算法是一种典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大;而KNN算法的核心思想是如果一个样本在特征空间中的K个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。但是,现有技术的目的地地址预测方法大多是针对少量用户的,例如通常是几千个以下用户,并且运行环境为单台PC,使用的聚类算法时间复杂度也较高,随数据的增长本文档来自技高网...

【技术保护点】
1.一种预测目的地地址的方法,其特征在于,包括:由分布式并行计算框架下的不同终端设备获取被拆分后的目的地地址候选坐标数据;将所述获取的目的地地址候选坐标数据采用密度聚类算法并行进行聚类运算,分别得到运算后的目的地地址坐标数据;将所述分别得到的运算后的目的地地址坐标数据进行汇总聚合,将汇总聚合后的目的地地址作为预测地址。

【技术特征摘要】
1.一种预测目的地地址的方法,其特征在于,包括:由分布式并行计算框架下的不同终端设备获取被拆分后的目的地地址候选坐标数据;将所述获取的目的地地址候选坐标数据采用密度聚类算法并行进行聚类运算,分别得到运算后的目的地地址坐标数据;将所述分别得到的运算后的目的地地址坐标数据进行汇总聚合,将汇总聚合后的目的地地址作为预测地址。2.根据权利要求1所述的方法,其特征在于,所述由分布式并行计算框架下的不同终端设备获取被拆分后的目的地地址候选坐标数据之前,还包括:将用户设定时间段内的行程记录数据进行预处理,得到目的地地址候选坐标数据。3.根据权利要求2所述的方法,其特征在于,所述将用户设定时间段内的行程记录数据进行预处理,得到目的地地址候选坐标数据,包括:将用户设定时间段内的行程记录数据中的目的地地址坐标,聚合到候选坐标表的同一行作为目的地地址候选坐标数据。4.根据权利要求3所述的方法,其特征在于,所述将用户设定时间段内的行程记录数据中的目的地地址坐标,聚合到候选坐标表的同一行作为目的地地址候选坐标数据,包括:将用户设定时间段内的行程记录数据中,选取设定时间点内的第一次停车和最后一次停车的地址坐标数据,分别作为公司地址候选坐标数据及家庭地址候选坐标数据,将所述选取的公司地址候选坐标数据及家庭地址候选坐标数据分别聚合到候选坐标表的同一行。5.根据权利要求3或4所述的方法,其特征在于,所述将所述获取的目的地地址候选坐标数据采用密度聚类算法并行进行聚类运算,分别得到运算后的目的地地址坐标数据,包括:遍历所述候选坐标表的每行目的地地址候选坐标数据;采用密度聚类算法判断所述目的地地址候选坐标中的核心点;在判断出的所述核心点中判断同一类别的核心点;根据...

【专利技术属性】
技术研发人员:宁春贵
申请(专利权)人:广州亚美信息科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1