System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于密度聚类的货车聚类方法技术_技高网

一种基于密度聚类的货车聚类方法技术

技术编号:40491209 阅读:6 留言:0更新日期:2024-02-26 19:21
本发明专利技术公开一种基于密度聚类的货车聚类方法,涉及交通管理数据分析技术领域,包括以下步骤:OD分析,将货车实时GPS数据源转为OD点,并计算GeoHash值;聚类分析,采用改进的DBSCAN算法,初步计算出货车的聚类情况,得到初步货车聚类区域;区域合并,对初步货车聚类区域进行基于词向量的相似度分析,并进行空间合并,得到最终聚类区域。本发明专利技术引入采用的是货车的实时点位数据,从根源上解决数据准确性;通过构建GeoHash结构来优化查找邻居点的过程,缩短DBSCAN的计算时间;聚类算法中利用词向量相似度的分析方法,降低因密度聚类领域半径设置过小,导致的聚类区域结果过于小且离散,提高数据的可用性和鲁棒性。

【技术实现步骤摘要】

本专利技术涉及交通管理数据智能分析,尤其是涉及一种基于密度聚类的货车聚类方法


技术介绍

1、交通管理领域,特别是对于货车的管理领域,经常采用货车聚类分析,货车的聚类分析是一种将货车根据其特征参数分类的方法,目的是更好地理解货车的不同类型,优化货车管理,或是为了设计更加精确的物流方案。聚类分析在这里是一个无监督学习的过程,它不需要预先定义货车类型的标签,而是通过分析货车的一些关键特性自行确定类别。

2、目前,在交通管理领域对货车聚类区域,主要两种方案:

3、第一种方案:交通管理人员根据业务管理经验,筛选出平时重点管理的区域

4、第二种方案:利用电子警察和车辆卡口等设备,获得黄牌货车的过车数据,通过设备点位来构建货车的od点来分析货车的聚类情况。

5、两种现有方案分别存在以下问题

6、第一种方案采用的人工经验,会有如下问题:

7、1)局限性强:对交通管理人员的经验依赖极大,无法全局掌握货车的聚类情况;

8、2)时效性差:货车聚类的更新,依赖于交通管理人员日常工作的频率更新或范围的扩大。

9、第二种方案采用的策略依赖于电子警察和车辆卡口等设备数据源进行分析,会有如下问题:

10、1)设备布置限制目的地追踪:由于设备主要部署在路口或特定路段,导致无法精准追踪货车的最终目的地。实际上,货车的起点和终点被限制在了设备的起点和终点,从而无法得到真实目的地的信息。

11、2)聚类计算方法简单:目前所使用的货车聚类计算方法较为简单,主要是以设备的起点和终点为基础进行合并统计。这种方法导致了信息丢失,未能充分反映货车的真实行动轨迹和目的地。

12、3)聚类结果难落实:由于分析结果只能呈现为热力图分布或相对较高粒度的数据,无法与具体的主体企业关联起来。这限制了数据分析的深度和广度,也降低了对交通管理的实际支持。

13、因此货车管理领域亟需解决以下问题:

14、1)选择合适数据源:选择更为合适的数据源,提高最后结果的有效性。

15、2)增强系统性:引入机器学习的方法,降低对交通管理人员经验的依赖。

16、3)优化聚类算法,采用更复杂、高效的聚类算法,并考虑时空因素,以保留更多货车的真实行动轨迹和目的地信息。


技术实现思路

1、为了解决上述技术问题,本专利技术提供一种基于密度聚类的货车聚类方法。采用如下的技术方案:

2、一种基于密度聚类的货车聚类方法,包括以下步骤:

3、步骤1,od分析,获取货车实时gps数据源,将货车实时gps数据源转为od点,并计算geohash值;

4、步骤2,聚类分析,采用改进的dbscan算法,初步计算出货车的聚类情况,得到初步货车聚类区域;

5、步骤3,区域合并,对初步货车聚类区域进行基于词向量的相似度分析,并进行空间合并,得到最终聚类区域。

6、通过采用上述技术方案,相对于传统的方式,引入采用的是货车的实时点位数据,从根源上解决数据准确性;

7、采用了密度聚类的机器学习算法,无需事先设定区域或区域数量,即可计算出货车聚类区域的货车数量、面积及中心点等信息;

8、通过构建geohash结构来优化查找邻居点的过程,缩短dbscan的计算时间;

9、聚类算法中利用词向量相似度的分析方法,合并聚类分析出来的聚类区域结果,降低因密度聚类领域半径设置过小,导致的聚类区域结果过于小且离散,提高数据的可用性。

10、可选的,步骤1包括以下子步骤:

11、步骤11,从货车实时gps数据源队列中获取货车的主要参数,主要参数是唯一识别码数据、经纬度定位数据和定位时间点数据;

12、步骤12,根据同一辆货车定位的后先顺序对od点进行更新,同时根据前后两个时间点区间的时间差,判断是否产生新的od点;

13、步骤13,计算od点的geohash的值。

14、可选的,在步骤11后,分别对货车定位唯一识别码数据、经纬度定位数据和定位时间点数据三个参数进行非空、时间异常、空间异常的数据校验和清洗。

15、通过采用上述技术方案,货车聚类的od(origin-destination)分析是从收集到的货车行驶轨迹数据中提取并分析货车出行的出发地与目的地信息。这些od信息对于理解和优化城市内的货物运输流动至关重要。

16、在进行货车聚类的od分析时,首先需要收集货车实时gps数据源队列中获取货车的主要参数,主要参数是唯一识别码数据、经纬度定位数据和定位时间点数据,这三个数据是与聚类分析关联度最大的三个数据,更新计算od点的geohash的值为后续的聚类分析提供更加准确的数据。

17、可选的,步骤2包括以下子步骤:

18、步骤21,清洗掉od轨迹过短或静止不动的od数据,形成有效od数据集;

19、步骤22,初始化dbscan的算法参数领域半径和密度阈值;

20、步骤23,遍历有效od数据集,找到任意一个核心点,对核心点进行扩充;

21、步骤24,取出核心点的geohash九宫格内的所有点;

22、步骤25,寻找从核心点出发geohash九宫格内的所有密度相连的点;

23、步骤26,遍历核心点的邻域内的所有核心点,寻找与这些数据点密度相连的点,直到没有可以扩充的点为止;

24、步骤27,重新扫描有效od数据集,寻找没有被聚类的核心点,再重复上述步骤23到步骤26对核心点进行扩充,直到有效od数据集中没有新的核心点为止;

25、步骤28,计算聚类区的边界和中心点,并通过gis地理信息系统得到中心点的aoi,形成初步货车聚类区域。

26、可选的,领域半径应小于geohash的km误差。

27、可选的,步骤24的具体方法是:获取核心点的自身的geohash值,加上其八邻域geohash组成九宫格,取出九宫格所有的点。

28、通过采用上述技术方案,构建geohash结构来优化查找邻居点的过程,缩短dbscan的计算时间,提高方法的可用性。

29、可选的,步骤3包括以下子步骤:

30、步骤31,遍历基本的货车聚类区域数据集,去掉aoi区域为空的数据,并提取货车聚类区域aoi值;

31、步骤32,对聚类区域中心点的距离进行比较,选出小于1km的中心点,称为相近的中心点;

32、步骤33,对相近的两个的中心点地址进行分词,每个分词代表空间的一个维度,将文本转化为多维空间的向量;

33、步骤34,根据词向量余弦的公式计算出相似度值;

34、步骤35,合并相似度高于设定相似度阈值的区域,重新计算区域的边界和中心点;

35、步骤36,直到货车聚类区域数据集都完成中心点地址两两比较,形成最终聚类区本文档来自技高网...

【技术保护点】

1.一种基于密度聚类的货车聚类方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于密度聚类的货车聚类方法,其特征在于,步骤1包括以下子步骤:

3.根据权利要求2所述的一种基于密度聚类的货车聚类方法,其特征在于,在步骤11后,分别对货车定位唯一识别码数据、经纬度定位数据和定位时间点数据三个参数进行非空、时间异常、空间异常的数据校验和清洗。

4.根据权利要求1所述的一种基于密度聚类的货车聚类方法,其特征在于,步骤2包括以下子步骤:

5.根据权利要求4所述的一种基于密度聚类的货车聚类方法,其特征在于,步骤22中,领域半径应小于GeoHash的km误差。

6.根据权利要求4所述的一种基于密度聚类的货车聚类方法,其特征在于,步骤24的具体方法是:获取核心的自身的GeoHash值,加上其八邻域GeoHash组成九宫格,取出九宫格所有的点。

7.根据权利要求4所述的一种基于密度聚类的货车聚类方法,其特征在于,步骤3包括以下子步骤:

8.根据权利要求7所述的一种基于密度聚类的货车聚类方法,其特征在于,步骤34中词向量余弦的公式如下:

9.根据权利要求7所述的一种基于密度聚类的货车聚类方法,其特征在于,步骤35中,相似度阈值是0.85。

...

【技术特征摘要】

1.一种基于密度聚类的货车聚类方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于密度聚类的货车聚类方法,其特征在于,步骤1包括以下子步骤:

3.根据权利要求2所述的一种基于密度聚类的货车聚类方法,其特征在于,在步骤11后,分别对货车定位唯一识别码数据、经纬度定位数据和定位时间点数据三个参数进行非空、时间异常、空间异常的数据校验和清洗。

4.根据权利要求1所述的一种基于密度聚类的货车聚类方法,其特征在于,步骤2包括以下子步骤:

5.根据权利要求4所述的一种基于密度聚类的货车聚类方法,其特征在于,步骤22中...

【专利技术属性】
技术研发人员:朱民健梁世挺王昆苏胜林马军亮
申请(专利权)人:中睿信数字技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1