【技术实现步骤摘要】
一种轨迹数据时空切片方法、系统及电子设备
[0001]本申请涉及数据处理的
,尤其是涉及一种轨迹数据时空切片方法、系统及电子设备。
技术介绍
[0002]基于海量的轨迹数据挖掘过程中虽利用了大数据分布式计算方法,但是在对大量数据集进行计算处理时,如时空交叉计算,计算数据量会在输入数据集的量级上放大为n
²
量级,消耗大量内存的同时仍然效率较低。
[0003]一般情况下处理上述效率低的问题的方法是时空切片,即基于地理位置对数据切片后再按时间分段切片,然后将计算量分散在每一个切片内,降低交叉计算量,但是这种方法常因为切片分割不合理等原因,致使计算结果存在较大偏差。
技术实现思路
[0004]本申请目的一是提供一种轨迹数据时空切片方法,具有使切片更合理化从而提高计算效率的特点。
[0005]本申请的上述申请目的一是通过以下技术方案得以实现的:一种轨迹数据时空切片方法,包括:获取轨迹数据;根据抽样规则对所述轨迹数据抽样,抽取的轨迹数据组成初始数据集,抽取后剩余的轨迹数据组成待定数 ...
【技术保护点】
【技术特征摘要】
1.一种轨迹数据时空切片方法,其特征在于,包括:获取轨迹数据;根据抽样规则对所述轨迹数据抽样,抽取的轨迹数据组成初始数据集,抽取后剩余的轨迹数据组成待定数据集;基于层次聚类规则,对所述初始数据集内的轨迹数据进行聚类,聚类后得到目标数据集;根据中心点计算规则,计算所述目标数据集中的每一类的中心点,所述中心点组成对比数据集;根据优化判断规则、所述对比数据集和所述目标数据集,优化所述对比数据集和所述目标数据集;根据数据合并规则,将所述目标数据集和所述待定数据集合并,将合并后的数据集记为合并数据集;基于时空切片规则,对所述合并数据集内的轨迹数据进行数据切片,将数据切片后的轨迹数据标记为切片集合;对切片集合中进行叠瓦处理,得到最终数据集。2.根据权利要求1所述的一种轨迹数据时空切片方法,其特征在于,所述根据优化判断规则、所述对比数据集和所述目标数据集,优化所述对比数据集和所述目标数据集,包括:计算所述目标数据集中每一类的轨迹数据与所述对比数据集中对应类的中心点之间的距离值;根据参数计算规则和所述距离值,确定优化参数;根据所述优化参数和优化规则,优化所述对比数据集和所述目标数据集。3.根据权利要求2所述的一种轨迹数据时空切片方法,其特征在于,所述根据参数计算规则和所述距离值,确定优化参数,包括:获取每一类的所述距离值的最大值;根据所述最大值、预设的距离预设值和参数计算规则,计算所述优化参数。4.根据权利要求2所述的一种轨迹数据时空切片方法,其特征在于,所述根据所述优化参数和优化规则,优化所述对比数据集和所述目标数据集,包括:当所述优化参数不等于优化预设值时,根据层次聚类规则,再次对所述对比数据集和所述目标数据集进行聚类,生成当前优化参数;比较当前优化参数和所述优化参数;当所述优化参数小于所述当前优化参数时,则将所述优化参数对应的目标数据集和对比数据集作为最终的目标数据集和对比数据集。5.根据权利要求1所述的一种轨迹数据时空切片方法,其特征在于,所述根据数据合并规则,将所述目标数据集和所述待定数据集合并,将合并后的数据集记为合并数据集,包括:计算所述待定数据集内的轨迹数据与所述对比数据集中的中心点之间的距离;获取所述距离的最小值;获取所述最小值对应的中心点的类;
...
【专利技术属性】
技术研发人员:徐涛,吴楠,蒋修强,周惊宇,胡大明,卢小军,王金涛,王方舟,
申请(专利权)人:北京码牛科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。