【技术实现步骤摘要】
一种基于粒子群模糊聚类的服务聚类方法
[0001]本专利技术属于计算机
,具体涉及一种基于粒子群模糊聚类的服 务聚类方法。
技术介绍
[0002]随着面向服务架构技术的发展,服务已经成为互联网上的重要的软件 资源,如何从数量庞大的服务中准确地发现满足用户需求的服务已经成为 领域的热点问题。
[0003]现有技术中,通常采用基于主题模型的服务聚类方法进行服务发现、服 务推荐以及服务管理。如,基于LDA(潜式狄利克雷分布)和模糊C均值 的Web服务多功能聚类方法;又如,基于模糊聚类优化的语义Web服务发 现方法。
[0004]但是,现有技术中的服务聚类方法主要采用LDA和k
‑
means等模型, 这些模型通常只能在同一领域下进行工作,因此,普遍存在以下两点不足:
[0005]1)未充分考虑词汇之间的语义关系,从而导致服务发现的效率低、准 确率低。
[0006]2)未充分考虑服务与服务之间的相互联系,从而导致服务聚类准确率 低、数据服务之间无法相互协作,资源浪费率高。 >
技术实现思路
...
【技术保护点】
【技术特征摘要】
1.一种基于粒子群模糊聚类的服务聚类方法,其特征在于,包括:步骤1:获取多个服务对应的服务数据,其中,所述服务数据包括:服务描述文档、所述服务描述文档对应的种类和所述服务描述文档的个数;步骤2:对所述服务数据进行预处理,以得到目标服务数据,所述目标服务数据中包括关键词数据和关键词词频数据;步骤3:确定所述服务数据对应的服务的簇个数;步骤4:初始化粒子群;步骤5:确定每个粒子的适应度值;步骤6:更新每个粒子的速度和位置;步骤7:判断更新后的每个粒子的位置数值是否小于全局位置最优值;步骤8:根据判断结果,对服务进行聚类处理,其中,当粒子的位置数值小于全局位置最优值时,则基于模糊聚类算法,对所述服务进行聚类;当粒子的位置数值大于或等于全局位置最优值时,则重复步骤5至步骤8,直到服务聚类完成。2.根据权利要求1所述的方法,其特征在于,所述步骤1包括:步骤1
‑
1:通过预设爬取工具,从服务网站中爬取多个服务描述文档;步骤1
‑
2:按照预设统计计算规则,对所述服务描述文档进行统计计算,以得到每个所述服务描述文档对应的种类和所述服务描述文档的个数。3.根据权利要求1所述的方法,其特征在于,所述步骤2包括:步骤2
‑
1:基于预设关键词处理规则,处理所述服务数据,以对所述服务数据中的关键词进行提取;步骤2
‑
2:基于预设词频计算规则,计算所述服务数据中关键词的词频,表示为:表示为:其中,n
ij
代表第j个单词在i个服务文档的数量,n
ij
是第i个服务中所有单词的数量,n
ij
代表文档的个数,IF
ij
表示关键词词频,IDF
i
计算服务文档的重要程度,其中N代表服务文档的个数,n
i
代表在一个文档n
ij
的个数。4.根据权利要求1所述的方法,其特征在于,所述步骤3包括:步骤3
‑
1:计算每个服务数据对应的服务的密度Dens(x
i
),表示为:表示为:其中,x
i
={x
i1
,x
i2
,
…
x
im
}表示服务,所述服务x
i
表示为一组具有m个分类属性为特征的集合,n表示服务的个数;步骤3
‑
2:确定每个服务对应的截断距离dc;步骤3
‑
3:对服务的密度的数值大小按照降序排序,表示为:
rank=arg(sort(Dens(x
i
)),descent);步骤3
‑
4:根据所述截断距离,确定每个服务的相邻服务x
i
,表示为:Neib(x
i
);步骤3
‑
5:将每个服务对应的相邻服务分配给所述每个服务的簇中心,以形成多个簇团;步骤3
‑
6:将所述簇团个数确定为所述服务簇的个数。5.根据权利要求1所述的方法,其特征在于,所述步骤4包括:步骤4
‑
1:设置一个粒子群,所述粒子群中包括N个粒子p;步骤4
‑
2:随机产生控制变量C=(c1,c2,
…
,c
k
),其中,c
i
的值大于0小于1;步骤4
‑
3:确定粒子群中簇的个数,表示为:C(p)=k,其中,k=k
max
;步骤4
‑
4:基于所述控制变量,对非核心区域的服务进行分类,以确定每个粒子中的有效服务簇数,表示为:h
t+1
(p)=count(C
(t+1)
(p)|c
j
>0.5|),j=1,...k,其中,当c
j
≥0.5时,则将非核心区域的服务归为服务簇中;或者,当c
j
<0.5时,不将非核心区域的服务归为服务簇中;步骤4
‑
5:获取所述有效服务簇的初始位置,以得到模糊隶属矩阵,表示为:W(p)=in...
【专利技术属性】
技术研发人员:夏虹,陈彦萍,王忠民,高聪,金小敏,高慧,董庆义,
申请(专利权)人:西安邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。