【技术实现步骤摘要】
基于Sliced
‑
Wasserstein距离的图卷积结构深度嵌入式聚类方法及系统
[0001]本专利技术属于无监督深度学习图像聚类的
,是一种无监督聚类技术方案,具体涉及一种基于Sliced
‑
Wasserstein距离的图卷积结构深度嵌入式聚类方法及系统,本专利技术可用于公交乘客人群的划分,能快速识别出乘客群体中的成人与儿童的人群分布。
技术介绍
[0002]聚类是将无分类标签的一组数据划分为几个簇的过程,是一种无监督学习方法,根据“物以类聚,人以群分”让不同簇的样本尽可能相似,相同簇的样本尽可能不相似。随着互联网的飞速发展,数据呈现海量爆发式增长,而这些数据的背后隐藏着许多重要的信息价值,为了快速分析这些数据巨大的隐藏价值,需要对这些数据经过聚类处理,节省时间资源成本。例如通过对特定运营目的和商业目的所挑选出的指标变量进行聚类分析,把目标群体划分成几个具有明显特征区别的细分群体,从而可以在运营活动中为这些细分群体采取精细化,个性化的运营和服务,最终提升运营的效率和商业效果。又如 ...
【技术保护点】
【技术特征摘要】
1.基于Sliced
‑
Wasserstein距离的图卷积结构深度嵌入式聚类方法,其特征是:步骤1:构造邻接矩阵;步骤2:构造自编码器模块;步骤3:构造图卷积结构GCN模块和自编码器模块的集成网络;步骤4:构造聚类模块中的聚类分配优化函数;步骤5:构造聚类模块中的KL损失优化函数;步骤6:构造聚类模块中的GCN损失优化函数;步骤7:将自编码器模块、GCN模块和聚类模块联合,构造基于Sliced
‑
Wasserstein距离的图卷积结构深度嵌入式聚类网络;步骤8:将数据集输入到步骤7中的聚类网络中进行迭代训练,当达到指定的精度或者训练次数时,聚类网络会终止训练,完成聚类。2.如权利要求1所述基于Sliced
‑
Wasserstein距离的图卷积结构深度嵌入式聚类方法,其特征在于,步骤1具体如下:假设原始数据X∈R
N
·
d
,其中N是样本数,R代表数据空间,d是维数;对于第i个样本,找到其前k个相似的相邻样本,并设置边将其与相邻样本连接它;计算样本相似度矩阵S,选择每个样本的前k个相似点作为相邻点,构造出具有k个相似点连接成的邻近图,得到邻接矩阵A。3.如权利要求2所述基于Sliced
‑
Wasserstein距离的图卷积结构深度嵌入式聚类方法,其特征在于,步骤2具体如下:假设自编码器中有L层,每层有n层数,则得到第n层自编码器网络学习到的表示为H
(n)
,H
(n)
=(W
e(n)
H
(n
‑
1)
+b
e(b)
)
ꢀꢀꢀꢀ
(1)其中,W
e(n)
和b
e(b)
分别是编码器网络的权重矩阵和偏差,H
(n
‑
1)
表示为自编码器在第n
‑
1层得到的表示;H
(0)
表示原始数据X,在编码器的末端输出中间特征向量z;解码器网络用来对原始数据X的重构,则解码器网络的第n层的表示为H
(n)
=(W
d(n)
H
(n
‑
1)
+b
d(b)
)
ꢀꢀꢀꢀꢀꢀ
(2)其中,W
d(n)
和b
d(b)
分别是解码器网络的权重矩阵和偏差,z是自编码器网络中编码器输出的特征向量,采用式(3)mse损失、式(4)l1损失、式(5)Wasserstein距离以及式(6)Sliced
‑
Wasserstein近似距离作为式(7)的优化约束条件Wasserstein近似距离作为式(7)的优化约束条件Wasserstein近似距离作为式(7)的优化约束条件Wasserstein近似距离作为式(7)的优化约束条件Wasserstein近似距离作为式(7)的优化约束条件其中,x
n
表示原始数据,x
n
′
表示对原始输入数据的重构;W
p
(η,μ)表示两个分布之间的
Wasserstein距离,表示一维切片Wasserstein距离,μ是原始输入数据的分布,η是经过自编码器网络重构后的重构数据分布,p
z
是编码后的中间特征分布,q
z
是预先定义的采样分布,λ是超参数,设S
d
‑1是概率空间Ω
d
中的单位球,对于一个向量v∈S
d
‑1,其中v={v1,...,v
N
}代表选取的N个切片单元,(∏
v
)
#
η表示η的投影分布,Γ(η,μ)表示η和μ组合的所有联合分布的集合。4.如权利要求3所述基于Sliced
‑
Wasserstein距离的图卷积结构深度嵌入式聚类方法,其特征在于,步骤3体如下:自编码器模块学习到的所有表示都集成到GCN模块中,GCN模块中可传播的表示将能够适应两种不同类型的信息,即数据本身和数据之间的关系,GCN模块中第l层的表示为式(8)其中,I是单位矩阵;...
【专利技术属性】
技术研发人员:郭春生,吴松,杨萌,应娜,陈华华,
申请(专利权)人:杭州电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。