【技术实现步骤摘要】
一种基于ElasticSearch的轨迹碰撞方法
[0001]本专利技术涉及计算机数据挖掘
,具体地说是一种基于ElasticSearch的轨迹碰撞方法。
技术介绍
[0002]随着大数据的发展,数据包含的信息价值越来越丰富。如何对大数据进行快速的检索和实时分析,成为大数据处理的迫切需求。传统的数据库存储和查询方式已无法满足对复杂的、关系型的亿级、PB级数据进行快速存储、高效查询、实时分析。
技术实现思路
[0003]本专利技术的技术任务是针对以上不足之处,提供一种基于ElasticSearch的轨迹碰撞方法,该方法能够实现快速精准的分析多种轨迹碰撞,可高效获得行为轨迹库中多种轨迹碰撞后的结果集,大大减少了轨迹碰撞模型的资源占用,并提升了计算效率。
[0004]本专利技术解决其技术问题所采用的技术方案是:
[0005]一种基于ElasticSearch轨迹碰撞方法,将不同来源、不同类型的轨迹数据融合到同一个ElasticSearch索引进行关联分析,自定义轨迹碰撞关联查询分析的存储结构和
【技术保护点】
【技术特征摘要】
1.一种基于ElasticSearch轨迹碰撞方法,其特征在于,将不同来源、不同类型的轨迹数据融合到同一个ElasticSearch索引进行关联分析,自定义轨迹碰撞关联查询分析的存储结构和查询分析方法;该方法的实现包括确定轨迹碰撞索引结构、创建索引和轨迹碰撞,所述轨迹碰撞索引结构,对时间、平面空间分别建立索引,并先从时间范围过滤,缩小搜索范围,再从空间范围进行过滤;采用复杂数据类型Nested嵌套存储轨迹数据并使用geo_point数据类型存储二维的GIS地理坐标信息,geo_point数据类型的存储将二维的经纬度信息转化为可以排序和比较的字符串编码。2.根据权利要求1所述的一种基于ElasticSearch的轨迹碰撞方法,其特征在于所述不同来源的信息包括住宿信息、上网信息、铁路订票信息、民航订票信息、人脸识别信息、电子围栏捕获信息、卡口过车信息、案件信息;用户根据自己的业务需求来设置查询时间范围、区域范围、空间范围、单种或多种轨迹类型以及其他分析参数,提交分析参数就可以通过ElasticSearch分析出满足轨迹交叉条件的结果集并以毫秒级的速度输出所有满足条件的单种或多种轨迹碰撞结果集。3.根据权利要求1或2所述的一种基于ElasticSearch的轨迹碰撞方法,其特征在于所述时间索引采用倒排索引;平面空间索引使用Space Filling Curve中的Z
‑
Order方案,并使用GeoHash来实现编码。4.根据权利要求3所述的一种基于ElasticSearch的轨迹碰撞方法,其特征在于具体索引结构为:设置人员id或车辆id、案id、物id索引类型为keyword;设置trace字段的索引方式为Nested嵌套类型;设置经纬度信息类型为geo_point;设置发生时间类型为keyword;设置轨迹行为种类类型为keyword,设置区域类型为keyword;设置更新时间索引类型为keyword。5.根据权利要求4所述的一种基于ElasticSearch的轨迹碰撞方法,其特征在于创建索引的过程如下:1)、将人员id或车辆id、案id、物id建立倒排索引;2)、将轨迹记录的经纬度坐标转换为GeoHash;3)、根据GeoHash编码利用空间填充建立空间索引;4)、将轨迹记录的行为类型和区域、发生时间建立Nested类型倒排索引;5)、将数据更新时间建立倒排索引;6)、批量写入住宿、上网、铁路、民航、电子围栏、卡口、案件数据;7)、将多种数据类型按行...
【专利技术属性】
技术研发人员:陈晏鹏,王莉,
申请(专利权)人:浪潮软件科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。