当前位置: 首页 > 专利查询>安徽大学专利>正文

一种深度自步主动聚类方法技术

技术编号:40222793 阅读:22 留言:0更新日期:2024-02-02 22:28
本发明专利技术公开一种深度自步主动聚类方法,步骤一、获取数据集及相应数据标签,合并训练集与测试集;步骤二、预训练神经网络;步骤三、使用神经网络提取所有数据特征,并在特征上运行K‑means聚类方法得到聚类结果;步骤四、根据聚类结果计算每个数据的权重,进而选出数据进行人工标注,得到新的有标签数据集和无标签数据集;步骤五、使用新数据集训练网络;重复步骤三到步骤五直至标注预算用完;步骤六、使用分类器得到最终结果,对结果进行评估;本发明专利技术通过在深度图像聚类的基础上引入主动学习与自步学习,帮助找出数据集中既具代表性又具一定困难度的样本与具有高置信度的样本,并分别赋予真实标签与伪标签。

【技术实现步骤摘要】

本专利技术涉及图像聚类领域,尤其涉及一种深度自步主动聚类方法


技术介绍

1、图像聚类是计算机视觉的基本问题,是一种基于图像内容的相似性和关联性进行聚类的方法。这种技术通过对图像的特征进行提取和表示,将相似的图像分组到同一个类别,不相似的图像则分到不同的类别。图像聚类算法可以基于不同的方法和技术,如传统的聚类算法(如k-means算法)、谱聚类算法、自组织映射网络、深度学习等方法。其中,基于传统的聚类算法的图像聚类方法通常利用图像的颜色、纹理、形状等特征进行聚类;基于谱聚类算法的方法通过对图像的相似性矩阵进行谱分解,得到图像的谱分布,从而进行聚类;基于自组织映射网络的方法通过构建一个二维的自组织地图,将相似的图像在地图上邻近的节点进行编码,从而实现聚类。然而传统聚类算法在高维的图像数据、大规模的图像数据、有噪声和异常值的图像数据上的表现不甚理想。近年来,深度学习得到了广泛研究,深度神经网络可以更好地提取图像数据的特征,并在许多任务中取得可喜的性能,因此深度图像聚类吸引了越来越多的关注。

2、然而,由于缺乏数据标签,聚类往往变成一个不适定问题。即本文档来自技高网...

【技术保护点】

1.一种深度自步主动聚类方法,其特征在于:所述深度自步主动聚类方法包括以下步骤:

2.如权利要求1所述的深度自步主动聚类方法,其特征在于:步骤二中,所述对比损失为:

3.如权利要求1所述的深度自步主动聚类方法,其特征在于:步骤三中,使用步骤二中预训练的神经网络提取训练集中所有数据的特征,使用K-means方法对所得特征进行聚类,得到聚类结果。

4.如权利要求1所述的深度自步主动聚类方法,其特征在于:步骤四中,基于步骤三得到的聚类结果,计算每个样本的自步权重,也即置信度,每个数据的自步权重wi计算如下:

5.如权利要求1所述的深度自步主动聚类...

【技术特征摘要】

1.一种深度自步主动聚类方法,其特征在于:所述深度自步主动聚类方法包括以下步骤:

2.如权利要求1所述的深度自步主动聚类方法,其特征在于:步骤二中,所述对比损失为:

3.如权利要求1所述的深度自步主动聚类方法,其特征在于:步骤三中,使用步骤二中预训练的神经网络提取训练集中所有数据的特征,使用k-m...

【专利技术属性】
技术研发人员:周芃赵贺林
申请(专利权)人:安徽大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1