The present invention discloses a K means clustering method based on neural network, which belongs to the field of neural network and clustering analysis technology. It solves the problem that the existing K means iteratively optimizes the clustering center and label assignment with two independent steps, resulting in slow reasoning speed, inability to process new data, large-scale data, online data, and so on. Sensitive to initial values. The invention includes reconstructing the objective function of K means to obtain the objective function of K means Net, constructing the K means Net neural network model based on the objective function, optimizing the objective function of the obtained K means Net neural network model, and obtaining the trained K means Net neural network. The invention is used to construct a neural network equivalent to K means.
【技术实现步骤摘要】
基于神经网络的k-means聚类方法
基于神经网络的k-means聚类方法,用于构建k-meansNet神经网络模型,属于神经网络领域和聚类分析
技术介绍
聚类是机器学习和计算机视觉中最基本的任务之一,其目的是将相似的模式分组到相同的类中,并将不同的模式分组到不同的类中。在过去的几十年里,研究人员已经提出了各种聚类方法,并在各种应用中取得了巨大的成功。最近,学术界的主要焦点是处理高维数据,其关键在于解决线性不可分割的问题。为了解决这个问题,最流行的方法之一是子空间聚类。子空间聚类隐式地搜索一组低维子空间并将数据聚类到这些子空间中。典型的方法包括代数方法、迭代方法、统计方法和基于谱聚类的方法。最近,基于谱聚类的子空间聚类已经吸引了大量来自学术界的关注,其主要由表示学习和聚类两个步骤组成。更具体地说,通过表示学习将数据投影到潜在子空间中,然后通过在表示上进行k-means算法来进行聚类。根据所使用的表示学习方法,现有的基于谱聚类的子空间聚类方法可以分为两类,即浅层方法和深层方法。简而言之,诸如稀疏子空间聚类、低秩表示、基于F2范数的方法及其变体的浅方法,将每个数据点表示为具有不同正则化的整个数据集的线性/非线性组合,然后使用表示系数建立图拉普拉斯算子以降维。显然,这两个步骤可以被视为著名的流形学习。与浅层方法不同,现有的深度聚类方法采用深度神经网络而不是流形学习来获得可分离的表示,且已在数据聚类中达到了最先进的性能。尽管现有子空间聚类方法已经取得了成功,但它们主要关注在表示学习,而忽略了聚类方面。在深度学习的时代,由于深度神经网络在表示学习中的突出表 ...
【技术保护点】
1.一种基于神经网络的k‑means聚类方法,其特征在于,如下步骤:步骤1、重构k‑means的目标函数,得到k‑meansNet的目标函数;步骤2、基于目标函数,构建k‑meansNet神经网络模型;步骤3、对得到的k‑meansNet神经网络模型中的目标函数进行优化,得到训练好的k‑meansNet神经网络。
【技术特征摘要】
1.一种基于神经网络的k-means聚类方法,其特征在于,如下步骤:步骤1、重构k-means的目标函数,得到k-meansNet的目标函数;步骤2、基于目标函数,构建k-meansNet神经网络模型;步骤3、对得到的k-meansNet神经网络模型中的目标函数进行优化,得到训练好的k-meansNet神经网络。2.根据权利要求1所述的一种基于神经网络的k-means聚类方法,其特征在于,所述步骤1的具体步骤为:步骤11、输入聚类个数k和归一化因子α,选取k个数据点作为聚类中心点Ω,将传统的k-means目标函数重写为等价形式:其中,重写过的式中,n为输入数据样本量,xi为第i个数据点,表示xi的类关系,Ωj为第j个类的中心点;步骤12、根据步骤11中xi和Ωj之间的距离将定义为概率图,即Softmax函...
【专利技术属性】
技术研发人员:彭玺,黄振宇,朱宏远,周天异,
申请(专利权)人:四川大学,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。