当前位置: 首页 > 专利查询>东南大学专利>正文

一种B2B平台供应商推荐方法和系统技术方案

技术编号:13893438 阅读:85 留言:0更新日期:2016-10-24 17:49
本发明专利技术公开了一种基于超图的多蚁群并行组合聚类方法,属于数据挖掘技术领域。本发明专利技术针对高维海量数据的快速准确聚类,将改进的基于信息熵的单蚁群聚类算法与超图相结合,其主要思路是不同的蚁群采用改进的基于信息熵的单蚁群聚类算法进行独立地并行工作,通过超图进行聚类结果组合得到不同的相似矩阵,再进行信息交换相互合作,利用相似矩阵对单蚁群聚类过程进行修正;经过反复迭代,最终得到最优的聚类结果。本发明专利技术还公开了一种B2B平台供应商推荐方法及系统。本发明专利技术可进一步提高面对高维海量数据时的算法搜索效率,同时有效克服现有技术易于过早陷入局部最优解的缺陷,提升聚类结果的准确性。

【技术实现步骤摘要】

本专利技术涉及一种聚类方法,尤其涉及一种基于超图的多蚁群并行组合聚类方法,属于计算机数据挖掘

技术介绍
电子商务环境下,越来越多的中小企业入驻第三方B2B电子商务平台。平台方可利用已有的海量数据,基于自设的关键因素指标或者基于用户自身的采购需求,向用户推荐符合要求的供应商。虽然相较于传统商业模式,扩大了商业机会,降低了搜索成本,但是由于提供同质商品的企业的大量增加以及描述企业商品质量、服务质量的信息维数的大幅扩展,如何从现有大数据中快速准确地挖掘出少量最能符合用户需求的供应商信息推荐给客户,就成了摆在所有B2B平台面前的主要问题。数据挖掘是获取符合用户需求的供应商信息的重要方法,而聚类则是数据挖掘中的重要内容,属于无监督学习的过程。聚类的基本原则是根据数据间的不同特征对数据集进行分簇,发现数据中隐含的模式,聚类结果是同一簇中的数据相似度尽量大,不同簇的数据相似度尽量小。目前存在许多经典聚类算法,其中近年来科学家根据蚂蚁群体智能所提出的蚁群聚类算法由于可以自动生成集群,不需要预先设定聚类中心,可以有效地发现数据中隐藏的共同特征,因此蚁群聚类算法在数据分析中已受到越来越多的重视。蚁群算法不仅结合了贪婪搜索算法的优点,还与正反馈机制及分布式计算方法相结合,使得蚁群算法缩短了搜索时间。分布式计算使得蚁群算法具有极强的并行性,避免陷入局部最优解。另外,蚁群算法具有很好的可扩充性,拓宽了算法应用范围。但是,蚁群算法也存在着一些缺陷。由于个体移具有随机性,即使信息交换能够优化路径,但是对于大规模优化问题,搜索时间仍是一个很大的障碍。虽然硬件设备性能提高,蚁群算法并行性在一定程度上缓解了这一问题。但是由于信息正反馈机制,是一个逐渐积累的过程,因此仍然需要较长时间。此外,在搜索进行到一定程度后,个体所发现的解一致,出现停滞现象,放弃了对解空间进一步搜索,陷入局部最优。为了解决传统蚁群算法处理高维海量数据时的问题,有研究者提出了一种基于无向超图的多蚁群聚类组合算法,该算法利用多个运动速度各异的蚁群独立并行地进行单蚁群聚类分析,然后将多个蚁群的聚类结果组合表示成超图的关联矩阵,然后将超图的关联矩阵转换为邻接矩阵,最后利用Hmetis进行超图的划分,从而得到最终的聚类结果。该方法一定程度上克服了传统蚁群算法面对高维海量数据时的不足,可有效提高算法效率和准确度。该方法虽然考虑到了蚁群不同的运动类型对聚类结果产生的影响,在一定程度上改善了蚁群过早陷入最优解,或者聚类速度过慢的问题。但是忽略了各个蚁群之间信息交换的生物功能。
技术实现思路
本专利技术所要解决的技术问题在于克服现有技术不足,提供一种基于超图的多蚁群并行组合聚类方法,可进一步提高面对高维海量数据时的算法搜索效率,同时有效克服现有技术易于过早陷入局部最优解的缺陷,提升聚类结果的准确性。本专利技术具体采用以下技术方案解决上述技术问题:一种基于超图的多蚁群并行组合聚类方法,包括以下步骤:S1、多个蚁群并行地对数据对象分别进行基于信息熵的单蚁群聚类,并将聚类结果传递给蚁后;每个蚁群在进行聚类时,拾起、放下对象的判断方法具体如下:对于空载蚂蚁,将拾取对象Oi前的信息熵E1与拾取对象Oi后的信息熵E2和调整因子v的乘积进行比较,如果E1>vE2,则拾起对象Oi;对于负载蚂蚁,将放下对象Oi前的信息熵E1与放下对象Oi后的信息熵E2和调整因子v的乘积进行比较,如果E1>vE2,则放下对象;各蚁群的调整因子在聚类过程中的变化规律各不相同;S2、蚁后将本轮所收到的所有聚类结果映射为一个超图的邻接矩阵H,并按照下式得到该超图的对称相似性矩阵Z: Z = 1 r HH T , ]]>其中,上标T表示矩阵转置,r为蚁群的数量;蚁后从本轮所收到的聚类结果中选择相应的聚类结果传递给各蚁群,同时将相似性矩阵Z传递给各蚁群;S3、各蚁群分别以所收到的聚类结果作为本次聚类的初始数据集,并行地分别进行基于信息熵的单蚁群聚类,并将聚类结果传递给蚁后;每个蚁群在进行聚类时,拾起、放下对象的判断方法具体如下:对于空载蚂蚁,将拾取对象Oi前的改进信息熵E1′与拾取对象Oi后的改进信息熵E2′和调整因子v的乘积进行比较,如果E1′>vE2′,则拾起对象Oi;对于负载蚂蚁,将放下对象Oi前的改进信息熵E1′与放下对象Oi后的改进信息熵E2′和调整因子v的乘积进行比较,如果E1′>vE2′,则放下对象Oi;所述改进信息熵的计算方法如下: E ′ ( s 2 ) = - Σ i = 1 Σ x ∈ X n ( p ′ ( x ) · log p ′ ( x ) ) ]]>式中,E′(s2)表示蚂蚁当前所能观察到的边长为s的正方形区域内对象的改进信息熵,Xn表示对象所具有的n个相互独立的属性的取值集合, p ′ ( x ) = ( max z o i o j ) p ( x ) ]]>其中,表示在对称相似性矩阵Z中取s×s邻域内所包括的对象间超边的最大值; p ( x ) = c o u n t ( x ) c o u n t ( s × s ) ]]>式中,count(x)表示s×s邻域内蚂蚁个体搜索满足Ai本文档来自技高网
...

【技术保护点】
一种基于超图的多蚁群并行组合聚类方法,其特征在于,包括以下步骤:S1、多个蚁群并行地对数据对象分别进行基于信息熵的单蚁群聚类,并将聚类结果传递给蚁后;每个蚁群在进行聚类时,拾起、放下对象的判断方法具体如下:对于空载蚂蚁,将拾取对象Oi前的信息熵E1与拾取对象Oi后的信息熵E2和调整因子v的乘积进行比较,如果E1>vE2,则拾起对象Oi;对于负载蚂蚁,将放下对象Oi前的信息熵E1与放下对象Oi后的信息熵E2和调整因子v的乘积进行比较,如果E1>vE2,则放下对象;各蚁群的调整因子在聚类过程中的变化规律各不相同;S2、蚁后将本轮所收到的所有聚类结果映射为一个超图的邻接矩阵H,并按照下式得到该超图的对称相似性矩阵Z:Z=1rHHT,]]>其中,上标T表示矩阵转置,r为蚁群的数量;蚁后从本轮所收到的聚类结果中选择相应的聚类结果传递给各蚁群,同时将相似性矩阵Z传递给各蚁群;S3、各蚁群分别以所收到的聚类结果作为本次聚类的初始数据集,并行地分别进行基于信息熵的单蚁群聚类,并将聚类结果传递给蚁后;每个蚁群在进行聚类时,拾起、放下对象的判断方法具体如下:对于空载蚂蚁,将拾取对象Oi前的改进信息熵E′1与拾取对象Oi后的改进信息熵E2′和调整因子v的乘积进行比较,如果E′1>vE′2,则拾起对象Oi;对于负载蚂蚁,将放下对象Oi前的改进信息熵E′1与放下对象Oi后的改进信息熵E′2和调整因子v的乘积进行比较,如果E′1>vE′2,则放下对象Oi;所述改进信息熵的计算方法如下:E′(s2)=-Σi=1Σx∈Xn(p′(x)·log p′(x))]]>式中,E′(s2)表示蚂蚁当前所能观察到的边长为s的正方形区域内对象的改进信息熵,Xn表示对象所具有的n个相互独立的属性的取值集合,p′(x)=(max zoioj)p(x)]]>其中,表示在对称相似性矩阵Z中取s×s邻域内所包括的对象间超边的最大值;p(x)=count(x)count(s×s)]]>式中,count(x)表示s×s邻域内蚂蚁个体搜索满足Ai=x的对象个数;count(s×s)表示邻域内对象总个数;S4、蚁后判断是否达到算法结束条件,如是,则结束算法并从本轮各蚁群所发送的聚类结果中选择孤立点最少的聚类结果作为最终聚类结果输出;如否,则转至S2,进行下一轮迭代。...

【技术特征摘要】
1.一种基于超图的多蚁群并行组合聚类方法,其特征在于,包括以下步骤:S1、多个蚁群并行地对数据对象分别进行基于信息熵的单蚁群聚类,并将聚类结果传递给蚁后;每个蚁群在进行聚类时,拾起、放下对象的判断方法具体如下:对于空载蚂蚁,将拾取对象Oi前的信息熵E1与拾取对象Oi后的信息熵E2和调整因子v的乘积进行比较,如果E1>vE2,则拾起对象Oi;对于负载蚂蚁,将放下对象Oi前的信息熵E1与放下对象Oi后的信息熵E2和调整因子v的乘积进行比较,如果E1>vE2,则放下对象;各蚁群的调整因子在聚类过程中的变化规律各不相同;S2、蚁后将本轮所收到的所有聚类结果映射为一个超图的邻接矩阵H,并按照下式得到该超图的对称相似性矩阵Z: Z = 1 r HH T , ]]>其中,上标T表示矩阵转置,r为蚁群的数量;蚁后从本轮所收到的聚类结果中选择相应的聚类结果传递给各蚁群,同时将相似性矩阵Z传递给各蚁群;S3、各蚁群分别以所收到的聚类结果作为本次聚类的初始数据集,并行地分别进行基于信息熵的单蚁群聚类,并将聚类结果传递给蚁后;每个蚁群在进行聚类时,拾起、放下对象的判断方法具体如下:对于空载蚂蚁,将拾取对象Oi前的改进信息熵E′1与拾取对象Oi后的改进信息熵E2′和调整因子v的乘积进行比较,如果E′1>vE′2,则拾起对象Oi;对于负载蚂蚁,将放下对象Oi前的改进信息熵E′1与放下对象Oi后的改进信息熵E′2和调整因子v的乘积进行比较,如果E′1>vE′2,则放下对象Oi;所述改进信息熵的计算方法如下: E ′ ( s 2 ) = - Σ i = 1 Σ x ∈ X n ( p ′ ( x ) · log p ′ ( x ) ) ]]>式中,E′(s2)表示蚂蚁当前所能观察到的边长为s的正方形区域内对象的改进信息熵,Xn表示对象所具有的n个相互独立的属性的取值集合, p ′ ( x ) = ( max z o i o j ) p ( ...

【专利技术属性】
技术研发人员:武忠李媛张丽媛吕思杰赵飞祥
申请(专利权)人:东南大学无锡云歌电子商务有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1