一种基于混合聚类算法进行物流中心选址的方法技术

技术编号:39753191 阅读:12 留言:0更新日期:2023-12-17 23:52
本发明专利技术公开了一种基于混合聚类算法进行物流中心选址的方法,包括以下步骤:步骤

【技术实现步骤摘要】
一种基于混合聚类算法进行物流中心选址的方法


[0001]本专利技术属于选址问题与数据挖掘交叉领域,具体涉及一种基于混合聚类算法进行物流中心选址的方法


技术介绍

[0002]目前生鲜

冷链等配送要求极高的时效性,对物流配送业提出了更高的标准,使得各大物流配送公司不断改进自己的配送路线与方式方法

物流中心是快件在整个过程中的关键中心,有着承上启下的核心作用,合适的物流中心可以使得快件在中转

运输

配送的过程中消耗较低的经济成本与时间成本,提高效率

[0003]物流中心选址与其他传统选址问题不同,根据物流的架构,一般分为四级配送:第一级是智能仓库,是最大的仓储中心,仓储着几乎所有可以运输的商品;第二级是省市级物流中心,负责进行中转

运输本省市的快件;第三级是区域内的配送站点,负责本区域内所有快件的调度;第四级是基层内的物流站点,由快递小哥负责短距离的配送

然而物流配送中心的建立投资巨大,不同的决策者可能会有不同的结果,若主观决策则可能造成较大的资源浪费,数据挖掘领域的聚类就是重要的辅助决策技术之一,通过挖掘出已存在的各站点坐标,应用聚类算法,距离为主要影响因素,挖掘出内在的隐含联系,建设合理的物流中心数量,减少路径配送时间与距离成本,提高平台的效率与利润,增加用户满意度,进一步减轻城市交通拥堵问题

[0004]近些年,站点选址问题受到了许多研究人员的研究,目前已经提出了大量的站点选址方法

如启发式算法中的传算法

蚁群算法

粒子群算法等,还有重心法
、p
中值法
、p
中心法等,这些方法仅仅只能根据理论距离进行单一的计算,不能根据实际情况考虑外界的因素变化

后来,近几年的研究开始考虑构建联合模型,同时捕获外界因素来进行计算,如
K

means++
方法
、Meanshift+K

means
混合聚类方法,都是将城市内坐标划分后,同时加入外界因素来选址,但这些模型大都是根据欧式距离计算,没有克服
Meanshift
算法与
K

means
算法本身可能会出现误归类的缺陷,且大多数人进行的是在已有的站点基础上预测出新的站点,并未考虑重新规划一个城市的所有站点,不能在实质上计算出不合理的站点


技术实现思路

[0005]针对上述尚没有解决的关键问题,本专利技术提出了一种基于混合聚类算法进行物流中心选址的方法,目的是解决城市中需求分布不平衡,模型中欧氏距离存在的误差,提高站点选址精确度

[0006]为实现上述目的,本专利技术采用如下的技术方案:
[0007]一种基于混合聚类算法进行物流中心选址的方法包括以下步骤:
[0008]步骤
1、
提出一种基于密度和距离的混合聚类应用方法
(MS

DPC)
,将
MeanShift
算法的寻找密度极值点的过程与
DPC
算法分配非密度极值点的过程结合起来,控制聚类的数量;
[0009]步骤
2、
预处理坐标数据,对物流中心数据进行数据清洗,主要保留属性有位置信息

快件饱和量

吞吐量;
[0010]步骤
3、
根据应用数据,借用第三方地图平台,得到真实路网站点距离
n
×
n
数据矩阵,记作
A

(a
ij
)
m
×
n
,其中
n
代表物流中心的数量,
a
ij
代表第
i
站点与第
j
站点的真实路网距离

[0011]步骤
4、
根据步骤1提出来的方法,结合真实路网站点距离
n
×
n
数据矩阵
A
,代替高斯核函数中的欧氏距离,得到
ND
个聚类密度极值点,即
Ψ

{dep1,dep2,

,dep
ND
}。
其中,
dep(p)
代表第
p
个密度极值点;
[0012]步骤
5、
建立聚类密度极值点和最大快件数量数据的联合模型,通过使用最大化算法,使得快件数量在阈值
T
内最大化的同时,站点到该密度极值点的距离之和最小

使
MS

DPC
不仅考虑快件数量因素,还充分考虑真实情况下的路径,而不单单是地理位置邻近;
[0013]步骤6:将处理后的
MS

DPC
算法与联合模型融合,通过模型训练与测试,最终得到物流中心地址的预测结果

[0014]作为优选,步骤1分级聚类应用方法包括如下:
[0015]步骤1‑1:给定一个含有
n
个点的
d
维空间
R
d
的数据集
X

{x1,x2,

x
n
}
,随机选择一个点
x
,以
x
为中心的
d
维球体,假设球体内除
x
外有
m
个点,
x
为起点,球体内的
m
个点
x
i
为终点,建立
m
个向量,将
m
个向量相加,得到
Mean shift
向量,那么
Mean shift
向量的基本形式为其中
M
表示向量,
x
i
表示一个点的位置坐标,
S
k
是一个半径为
r
的高维球区域,
h
是可根据数据集密集程度调整的参数,
k
表示有
k
个点落入
S
k
区域中,
Mean shift
向量为区域内的点到原点的向量和;
[0016]步骤1‑2:对
center
(t+1)

center
(t)
+shift
(t)

center
(t)

t
时刻的
Mean shift
向量,以<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于混合聚类算法进行物流中心选址的方法,其特征在于,包括以下步骤:步骤
1、
提出一种基于密度和距离的混合聚类应用方法
MS

DPC
,将
MeanShift
算法的寻找密度极值点的过程与
DPC
算法分配非密度极值点的过程结合起来,控制聚类的数量;步骤
2、
预处理坐标数据,对物流中心数据进行数据清洗,主要保留属性有位置信息

快件饱和量

吞吐量;步骤
3、
根据应用数据,借用第三方地图平台,得到真实路网站点距离
n
×
n
数据矩阵,记作
A

(a
ij
)
m
×
n
,其中
n
代表物流中心的数量,
a
ij
代表第
i
站点与第
j
站点的真实路网距离;步骤
4、
根据步骤1提出来的方法,结合真实路网站点距离
n
×
n
数据矩阵
A
,代替高斯核函数中的欧氏距离,得到
ND
个聚类密度极值点,即
Ψ

{dep1,dep2,

,dep
ND
}
;其中,
dep(p)
代表第
p
个密度极值点;步骤
5、
建立聚类密度极值点和最大快件数量数据的联合模型,通过使用最大化算法,使得快件数量在阈值
T
内最大化的同时,站点到该密度极值点的距离之和最小;使
MS

DPC
不仅考虑快件数量因素,还充分考虑真实情况下的路径,而不单单是地理位置邻近;步骤6:将处理后的
MS

DPC
算法与联合模型融合,通过模型训练与测试,最终得到物流中心地址的预测结果
。2.
根据权利要求1所述的一种基于混合聚类算法进行物流中心选址的方法,其特征在于,步骤1分级聚类应用方法包括如下:步骤1‑1:给定一个含有
n
个点的
d
维空间
R
d
的数据集
X

{x1,x2,

x
n
}
,随机选择一个点
x
,以
x
为中心的
d
维球体,假设球体内除
x
外有
m
个点,
x
为起点,球体内的
m
个点
x
i
为终点,建立
m
个向量,将
m
个向量相加,得到
Mean shift
向量,那么
Mean shift
向量的基本形式为其中
M
表示向量,
x
i
表示一个点的位置坐标,
S
k
是一个半径为
r
的高维球区域,
h
是可根据数据集密集程度调整的参数,
k
表示有
k
个点落入
S
k
区域中,
Mean shift
向量为区域内的点到原点的向量和;步骤1‑2:对
center
(t+1)

center
(t)
+shift
(t)

center
(t)

t
时刻的
Mean shift
向量,以
t
时刻的
Mean shift
向量的终点为原点,做一个半径为
r
的高维球区域,重复以上步骤,得到一个新的
Mean shift
向量
shift
(t)
,两个向量相加得到
t+1
时刻的
Mean shift
向量,终点为
center
(t+1)
;经过多次迭代,
Mean shift
算法可以收敛到概率密度最大的地方,设该点为密度极值点
dep
;步骤1‑3:加入高斯核函数到基本的
Mean shift
向量中,则原向量形式变形为其中是高斯核函数,受带宽
h
与距离的影响,带宽
h
越小,距离越近,函数值越大;步骤1‑4:将高斯核函数中的欧式距离改为自适应距离,利用
DBSCAN
算法的密度可达概念:样本
X
在核心样本
Y
的邻域内,则称
Y

X

【专利技术属性】
技术研发人员:秦维嘉郭黎敏
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1