无监督学习方法、系统、计算机设备及可读存储介质技术方案

技术编号：29284554 阅读：22 留言：0更新日期：2021-07-16 23:45

本发明专利技术公开了一种无监督学习方法、系统、计算机设备及可读存储介质，包括：将样本数据集进行聚类，以得到聚类结果；基于所述聚类结果，将所述样本数据集中的目标样本数据打上对应的第一分类标签，以得到多个第一标签数据；将所述多个第一标签数据作为训练集输入至基准训练模型中以对所述基准训练模型进行训练，得到分类模型；从所述分类模型中获取所述多个第一标签数据的置信度；当所述训练集中的至少一个目标第一标签数据的置信度高于预设置信度时，将所述至少一个目标第一标签数据打上对应的第二分类标签，以得到至少一个第二标签数据。本发明专利技术能够极大的提高图像数据分类的准确率。率。率。

全部详细技术资料下载

【技术实现步骤摘要】
无监督学习方法、系统、计算机设备及可读存储介质

[0001]本专利技术涉及图像
，具体涉及一种无监督学习方法、系统、计算机设备及可读存储介质。

技术介绍

[0002]随着人工智能技术的发展，能够实现对图像的识别和分类。在对无标签图像数据的分类的过程中，一般通过将采样数据输入到聚类算法或者其他无监督学习算法中，然后输出标注后的样本数据，以实现对图像数据的分类。然而，利用无监督学习算法对图像数据分类的方法，图像数据分类结果准确率低。
[0003]故，本专利技术旨在解决如何提高图像数据分类的准确率的问题。

技术实现思路

[0004]本专利技术的目的在于提供一种无监督学习方法、系统、计算机设备及可读存储介质，用于解决现有技术中图像数据分类准确率低的缺陷。
[0005]根据本专利技术的一个方面，提供了一种无监督学习方法，该方法包括如下步骤：
[0006]将样本数据集进行聚类，以得到聚类结果，所述样本数据集包括多个未标注的样本数据；
[0007]基于所述聚类结果，将所述样本数据集中的目标样本数据打上对应的第一分类标签，以得到多个第一标签数据；
[0008]将所述多个第一标签数据作为训练集输入至基准训练模型中以对所述基准训练模型进行训练，得到分类模型；
[0009]从所述分类模型中获取所述多个第一标签数据的置信度；
[0010]当所述训练集中的至少一个目标第一标签数据的置信度高于预设置信度时，将所述至少一个目标第一标签数据打上对应的第二分类标签，以得到至...

【技术保护点】

【技术特征摘要】
1.一种无监督学习方法，其特征在于，所述方法包括：将样本数据集进行聚类，以得到聚类结果，所述样本数据集包括多个未标注的样本数据；基于所述聚类结果，将所述样本数据集中的目标样本数据打上对应的第一分类标签，以得到多个第一标签数据；将所述多个第一标签数据作为训练集输入至基准训练模型中以对所述基准训练模型进行训练，得到分类模型；从所述分类模型中获取所述多个第一标签数据的置信度；当所述训练集中的至少一个目标第一标签数据的置信度高于预设置信度时，将所述至少一个目标第一标签数据打上对应的第二分类标签，以得到至少一个第二标签数据。2.如权利要求1所述的无监督学习方法，其特征在于，所述将样本数据集进行聚类，以得到聚类结果，包括：获取所述样本数据集，并对所述样本数据集进行处理，以获取所述样本数据集中每个样本数据的特征向量；将所述特征向量按照预设聚类算法进行聚类，以获取所述聚类结果，其中所述预设聚类算法至少包括Kmeans算法。3.如权利要求2所述的无监督学习方法，其特征在于，所述获取样本数据集，并对所述样本数据集进行处理，以获取所述样本数据集中每个样本数据的特征向量，包括：将所述样本数据集通过自编码器结构进行特征学习以得到所述特征向量。4.如权利要求1所述的无监督学习方法，其特征在于，所述基于所述聚类结果，将所述样本数据集中的目标样本数据打上对应的第一分类标签，以得到多个第一标签数据，包括：根据所述聚类结果，将聚类中心预设距离范围内的预设比例的所述目标样本数据归为一类，并获取归类结果；根据所述归类结果，将所述目标样本数据打上对应的第一分类标签，以得到所述多个第一标签数据。5.如权利要求1所述的无监督学习方法，其特征在于，还包括：记录所述训练集的训练次数；判断所述训练次数是否等于所述预设次数；当所述训练次数等于所述预设...

【专利技术属性】
技术研发人员：汤良，张卓，黄传明，吕考考，商清华，
申请(专利权)人：网神信息技术北京股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人