无监督学习方法、系统、计算机设备及可读存储介质技术方案

技术编号:29284554 阅读:22 留言:0更新日期:2021-07-16 23:45
本发明专利技术公开了一种无监督学习方法、系统、计算机设备及可读存储介质,包括:将样本数据集进行聚类,以得到聚类结果;基于所述聚类结果,将所述样本数据集中的目标样本数据打上对应的第一分类标签,以得到多个第一标签数据;将所述多个第一标签数据作为训练集输入至基准训练模型中以对所述基准训练模型进行训练,得到分类模型;从所述分类模型中获取所述多个第一标签数据的置信度;当所述训练集中的至少一个目标第一标签数据的置信度高于预设置信度时,将所述至少一个目标第一标签数据打上对应的第二分类标签,以得到至少一个第二标签数据。本发明专利技术能够极大的提高图像数据分类的准确率。率。率。

【技术实现步骤摘要】
无监督学习方法、系统、计算机设备及可读存储介质


[0001]本专利技术涉及图像
,具体涉及一种无监督学习方法、系统、计算机设备及可读存储介质。

技术介绍

[0002]随着人工智能技术的发展,能够实现对图像的识别和分类。在对无标签图像数据的分类的过程中,一般通过将采样数据输入到聚类算法或者其他无监督学习算法中,然后输出标注后的样本数据,以实现对图像数据的分类。然而,利用无监督学习算法对图像数据分类的方法,图像数据分类结果准确率低。
[0003]故,本专利技术旨在解决如何提高图像数据分类的准确率的问题。

技术实现思路

[0004]本专利技术的目的在于提供一种无监督学习方法、系统、计算机设备及可读存储介质,用于解决现有技术中图像数据分类准确率低的缺陷。
[0005]根据本专利技术的一个方面,提供了一种无监督学习方法,该方法包括如下步骤:
[0006]将样本数据集进行聚类,以得到聚类结果,所述样本数据集包括多个未标注的样本数据;
[0007]基于所述聚类结果,将所述样本数据集中的目标样本数据打上对应的第一分类标签,以得到多个第一标签数据;
[0008]将所述多个第一标签数据作为训练集输入至基准训练模型中以对所述基准训练模型进行训练,得到分类模型;
[0009]从所述分类模型中获取所述多个第一标签数据的置信度;
[0010]当所述训练集中的至少一个目标第一标签数据的置信度高于预设置信度时,将所述至少一个目标第一标签数据打上对应的第二分类标签,以得到至少一个第二标签数据。
[0011]可选的,所述将样本数据集进行聚类,以得到聚类结果,包括:
[0012]获取所述样本数据集,并对所述样本数据集进行处理,以获取所述样本数据集中每个样本数据的特征向量;
[0013]将所述特征向量按照预设聚类算法进行聚类,以获取所述聚类结果,其中所述预设聚类算法至少包括Kmeans算法。
[0014]可选的,所述获取样本数据集,并对所述样本数据集进行处理,以获取所述样本数据集中每个样本数据的特征向量,包括:
[0015]将所述样本数据集通过自编码器结构进行特征学习以得到所述特征向量。
[0016]可选的,所述基于所述聚类结果,将所述样本数据集中的目标样本数据打上对应的第一分类标签,以得到多个第一标签数据,包括:
[0017]根据所述聚类结果,将聚类中心预设距离范围内的预设比例的所述目标样本数据归为一类,并获取归类结果;
[0018]根据所述归类结果,将所述目标样本数据打上对应的第一分类标签,以得到所述多个第一标签数据。
[0019]可选的,所述无监督学习方法,还包括:
[0020]记录所述训练集的训练次数;
[0021]判断所述训练次数是否等于所述预设次数;
[0022]当所述训练次数等于所述预设次数时,则结束训练,所述样本数据集无监督学习完成。
[0023]可选的,所述判断所述训练次数是否等于所述预设次数之后,还包括:
[0024]当所述训练次数不等于所述预设次数时,根据所述至少一个第二标签数据更新所述训练集,以对所述分类模型重新训练,继续所述样本数据集无监督学习。
[0025]为了实现上述目的,本专利技术还提供一种无监督学习系统,该系统具体包括以下组成部分:
[0026]聚类模块,用于将样本数据集进行聚类,以得到聚类结果,所述样本数据集包括多个未标注的样本数据;
[0027]第一标签模块,用于基于所述聚类结果,将所述样本数据集中的目标样本数据打上对应的第一分类标签,以得到多个第一标签数据;
[0028]训练模块,用于将所述多个第一标签数据作为训练集输入至基准训练模型中以对所述基准训练模型进行训练,得到分类模型;
[0029]获取模块,用于从所述分类模型中获取所述多个第一标签数据的置信度;
[0030]第二标签模块,用于当所述训练集中的至少一个目标第一标签数据的置信度高于预设置信度时,将所述至少一个目标第一标签数据打上对应的第二分类标签,以得到至少一个第二标签数据。
[0031]可选的,所述第一标签模块还用于:
[0032]根据所述聚类结果,将聚类中心预设距离范围内的预设比例的所述目标样本数据归为一类,并获取归类结果;
[0033]根据所述归类结果,将所述目标样本数据打上对应的第一分类标签,以得到所述多个第一标签数据。
[0034]为了实现上述目的,本专利技术还提供一种计算机设备,该计算机设备具体包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述介绍的无监督学习方法的步骤。
[0035]为了实现上述目的,本专利技术还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述介绍的无监督学习方法的步骤。
[0036]本专利技术提供的无监督学习方法、系统、计算机设备及可读存储介质,通过将样本数据进行聚类,并根据聚类结果得到对样本数据打上对应的第一分类标签,然后将打上对应分类标签的样本数据进行模型的训练,将置信度高的数据打上对应的第二分类标签,本实施例通过将无监督算法和有监督算法相结合进行数据的学习,极大的提高了图像数据分类的准确率。在一个具体实施例中,可以利用本专利技术在无标签情况下进行图像分类。
附图说明
[0037]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0038]图1为本公开实施例提供的无监督学习方法的一种可选的应用环境图;
[0039]图2为本公开实施例提供的样本数据集聚类的示意图;
[0040]图3为本公开实施例提供的无监督学习方法的一种可选的流程示意图;
[0041]图4为所述图3中步骤S100的一种可选的具体流程示意图;
[0042]图5为所述图3中步骤S102的一种可选的具体流程示意图;
[0043]图6为本公开实施例提供的无监督学习方法的另一种可选的流程示意图;
[0044]图7为本公开实施例提供的无监督学习系统的一种可选的程序模块示意图;
[0045]图8为本公开实施例提供的计算机设备的一种可选的硬件架构示意图。
具体实施方式
[0046]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0047]图1为本专利技术实施例提供的无监督学习方法一种可选的应用环境图。计算机设备B将样本数据集进行学习,并训练出分类模型,以将所述样本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种无监督学习方法,其特征在于,所述方法包括:将样本数据集进行聚类,以得到聚类结果,所述样本数据集包括多个未标注的样本数据;基于所述聚类结果,将所述样本数据集中的目标样本数据打上对应的第一分类标签,以得到多个第一标签数据;将所述多个第一标签数据作为训练集输入至基准训练模型中以对所述基准训练模型进行训练,得到分类模型;从所述分类模型中获取所述多个第一标签数据的置信度;当所述训练集中的至少一个目标第一标签数据的置信度高于预设置信度时,将所述至少一个目标第一标签数据打上对应的第二分类标签,以得到至少一个第二标签数据。2.如权利要求1所述的无监督学习方法,其特征在于,所述将样本数据集进行聚类,以得到聚类结果,包括:获取所述样本数据集,并对所述样本数据集进行处理,以获取所述样本数据集中每个样本数据的特征向量;将所述特征向量按照预设聚类算法进行聚类,以获取所述聚类结果,其中所述预设聚类算法至少包括Kmeans算法。3.如权利要求2所述的无监督学习方法,其特征在于,所述获取样本数据集,并对所述样本数据集进行处理,以获取所述样本数据集中每个样本数据的特征向量,包括:将所述样本数据集通过自编码器结构进行特征学习以得到所述特征向量。4.如权利要求1所述的无监督学习方法,其特征在于,所述基于所述聚类结果,将所述样本数据集中的目标样本数据打上对应的第一分类标签,以得到多个第一标签数据,包括:根据所述聚类结果,将聚类中心预设距离范围内的预设比例的所述目标样本数据归为一类,并获取归类结果;根据所述归类结果,将所述目标样本数据打上对应的第一分类标签,以得到所述多个第一标签数据。5.如权利要求1所述的无监督学习方法,其特征在于,还包括:记录所述训练集的训练次数;判断所述训练次数是否等于所述预设次数;当所述训练次数等于所述预设...

【专利技术属性】
技术研发人员:汤良张卓黄传明吕考考商清华
申请(专利权)人:网神信息技术北京股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1