当前位置: 首页 > 专利查询>中山大学专利>正文

一种基于谱集成学习的服务聚类方法与系统技术方案

技术编号:39755570 阅读:9 留言:0更新日期:2023-12-17 23:54
本发明专利技术公开了一种基于谱集成学习的服务聚类方法与系统

【技术实现步骤摘要】
一种基于谱集成学习的服务聚类方法与系统


[0001]本专利技术涉及聚类领域,具体涉及一种基于谱集成学习的服务聚类方法与系统


技术介绍

[0002]传统社区服务领域存在大量零散

分散的服务形式,难以互相协作形成有机的服务网络,人们需要到不同的社区服务机构获取相应的服务,而无法一站式解决问题,这导致了社区服务质量和效率的低下,增加了人们的时间和金钱成本,给人们生活带来了不便

由此,如何实现多模态跨界物业服务数据的知识集成

管理并且打造面向未来社区场景的智慧社区跨界服务引起了学界的广泛思考和试验,其中,聚类方法引起了国内外学者的兴趣

[0003]谱聚类利用数据的相似度矩阵或图构建一个无向图,并将图中的节点分成不同的聚类

相比传统的聚类算法,谱聚类具有众多优点,它不仅不受数据维度的限制,可以处理高维数据,而且通过使用降维技术,可以提高计算效率

[0004]集成聚类的优点在于它可以结合多个聚类算法的优势来弥补单个算法的不足,并且可以减少由于初始聚类中心的选取和算法参数的选择所带来的影响

此外,集成聚类还可以有效地处理大规模

高维数据和噪声数据等问题

[0005]目前的现有技术之一是专利“一种围绕主题建模的改进型
K

means
服务聚类方法
(CN111475609B)”,该方法是一种基于/>K

means
聚类方法的改进方法,可以将具有主题相关性的服务聚类在一起

该方法的基本思想是使用主题模型对服务进行特征提取,然后使用改进的
K

means
聚类方法进行聚类

该方法的缺点在于,
K

means
聚类方法需要初始化聚类中心,如果聚类中心的选择不合理,可能会导致算法引起误聚类,无法找到最优解

[0006]目前的现有技术之二是专利“一种基于知识图谱表示学习的服务聚类方法
(CN111813955A)”,该方法是一种使用知识图谱将服务抽象为实体并使用表示学习方法将实体表示为低维向量,从而进行聚类的方法

该方法的基本思想是将服务及其属性表示为知识图谱中的实体和关系,并使用图嵌入算法将实体嵌入到低维向量空间中,然后使用传统的聚类算法对服务进行聚类

该方法的缺点在于,知识图谱的表示学习算法需要消耗大量的计算资源和时间,导致算法的效率较低

[0007]目前的现有技术之三是专利“一种融合语义增强与异质关联的
Web
服务聚类方法
(CN115952425A)”,该方法首先采取近义词替换的方式构建服务描述的孪生样本,在
SimCSE
框架下生成语义增强的服务功能向量;然后,从功能和协作角度建立服务异质关联图,设计面向服务关联强度的随机游走策略,利用改进的
GATNE
模型实现异质关联图中服务结点的嵌入表示,生成
Web
服务的关联向量;最后,将服务功能向量与关联向量融合为服务表征向量,实现服务聚类,通过将服务的功能关联与协作关联有机融合,进一步提升服务聚类质量

该方法的缺点在于,方法的步骤过于复杂,运算复杂度过高


技术实现思路

[0008]本专利技术的目的是克服现有方法的不足,提出了一种基于谱集成学习的服务聚类方
法与系统

本专利技术解决的主要问题是,如何避免误聚类的同时,降低算法运算复杂度,提高运算速度,并进一步改进最终服务聚类结果

[0009]为了解决上述问题,本专利技术提出了一种基于谱集成学习的服务聚类方法,所述方法包括:
[0010]记社区服务信息单词数量为
m
,将社区服务信息单词通过
Word2Vec
处理为
m
个低维向量,使得单词之间的语义相似度可以通过向量之间的距离计算;
[0011]输入所述低维向量,通过基本谱聚类得到初始低维嵌入和初始拉普拉斯算子
L
*
,通过初始拉普拉斯算子
L
*
计算得到初始一致嵌入
U
*

[0012]将所述初始低维嵌入和所述初始一致嵌入
U
*
结合到一致性聚类的迭代优化框架中,重复迭代优化直到得到收敛的一致嵌入
U
+

[0013]输入所述收敛的一致嵌入
U
+
,通过
K

means
聚类方法得到最终的服务聚类结果

[0014]优选地,输入所述低维向量,通过基本谱聚类得到初始低维嵌入和初始拉普拉斯算子
L
*
,通过初始拉普拉斯算子
L
*
计算得到初始一致嵌入
U
*
,具体为:
[0015]输入所述低维向量,通过
m
个基本谱聚类得到一组相似性矩阵个基本谱聚类得到一组相似性矩阵
W
i
表示第
i
个低维向量与其他低维向量之间的欧氏距离;
[0016]记
D
i

W
i
的元素之和,拉普拉斯矩阵的元素之和,拉普拉斯矩阵的计算公式为:
[0017][0018]根据所述拉普拉斯矩阵计算初始低维嵌入计算公式如下:
[0019][0020]其中
L
i
是拉普拉斯矩阵的列向量,
I
是单位矩阵;
[0021]初始拉普拉斯算子
L
*
的计算公式如下:
[0022][0023]初始一致嵌入
U
*
的计算公式如下:
[0024][0025]优选地,将所述初始低维嵌入和所述初始一致嵌入
U
*
结合到一致性聚类的迭代优化框架中,重复迭代优化直到得到收敛的一致嵌入
U
+
,具体为:
[0026]第1次迭代优化的低维嵌入计算公式如下:
[0027][0028]其中
α
是用于控制迭代优化速度的优化参数;
[0029]第1次迭代优化的拉普拉斯算子计算公式如下:
[0030][0031]第1次迭代优化的一致嵌入
U
*(1)
计算公式如下:
[0032][0033]记
t
为迭代优化的次数,
t≧2
,重复以下步骤直至迭代优化的一致嵌入收敛,记收敛的一致嵌入为
...

【技术保护点】

【技术特征摘要】
1.
一种基于谱集成学习的服务聚类方法,其特征在于,所述方法包括:记社区服务信息单词数量为
m
,将社区服务信息单词通过
Word2Vec
处理为
m
个低维向量,使得单词之间的语义相似度可以通过向量之间的距离计算;输入所述低维向量,通过基本谱聚类得到初始低维嵌入和初始拉普拉斯算子
L
*
,通过初始拉普拉斯算子
L
*
计算得到初始一致嵌入
U
*
;将所述初始低维嵌入和所述初始一致嵌入
U
*
结合到一致性聚类的迭代优化框架中,重复迭代优化直到得到收敛的一致嵌入
U
+
;输入所述收敛的一致嵌入
U
+
,通过
K

means
聚类方法得到最终的服务聚类结果
。2.
如权利要求1所述的一种基于谱集成学习的服务聚类方法,其特征在于,所述输入所述低维向量,通过基本谱聚类得到初始低维嵌入和初始拉普拉斯算子
L
*
,通过初始拉普拉斯算子
L
*
计算得到初始一致嵌入
U
*
,具体为:输入所述低维向量,通过
m
个基本谱聚类得到一组相似性矩阵个基本谱聚类得到一组相似性矩阵
W
i
表示第
i
个低维向量与其他低维向量之间的欧氏距离;记
D
i

W
i
的元素之和,拉普拉斯矩阵的元素之和,拉普拉斯矩阵的计算公式为:根据所述拉普拉斯矩阵计算初始低维嵌入计算公式如下:其中
L
i
是拉普拉斯矩阵的列向量,
I
是单位矩阵;初始拉普拉斯算子
L
*
的计算公式如下:初始一致嵌入
U
*
的计算公式如下:
3.
如权利要求2所述的一种基于谱集成学习的服务聚类方法,其特征在于,所述将所述初始低维嵌入和所述初始一致嵌入
U
*
结合到一致性聚类的迭代优化框架中,重复迭代优化直到得到收敛的一致嵌入
U
+
,具体为:第1次迭代优化的低维嵌入计算公式如下:其中
α
是用于控制迭代优化速度的优化参数;第1次迭代优化的拉普拉斯算子计算公式如下:第1次迭代优化的一致嵌入
U
*(1)
计算公式如下:

t
为迭代优化的次数,
t≥2
,重复以下步骤直至迭代优化的一致嵌入收敛,记收敛的一致嵌入为
U
+
:第一步,第
t
次迭代优化的低维嵌为基于第
t
‑1次迭代优化的拉普拉斯算子和一致嵌入
U
*(t

1)
的优化学习结果,公式如下:其中,为第
t
‑1次迭代优化的拉普拉斯算子;第二步,第
t
次迭代优化的拉普拉斯算于和第
t
次迭代的一致嵌入通过以下公式优化学习:式优化学习:
4.
一种基于谱集成学习的服务聚类系统,其特征在于,所述系统包括:低维向量转换单元,用于记社区服务信息单词数量为
m
,将社区服务信息单词通过
Word2Vec
处理为
m
...

【专利技术属性】
技术研发人员:周凡林格林淑金张耀日
申请(专利权)人:中山大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1