一种图片分类方法及装置制造方法及图纸

技术编号:20449258 阅读:36 留言:0更新日期:2019-02-27 03:12
本发明专利技术公开了一种图片分类方法及装置,方法包括:对预设数量的待分类图片中每一图片提取图像特征,得到各图片的特征数据;对得到的各图片的特征数据进行聚类,将各图片的特征数据归属为若干类;根据对特征数据的聚类结果,将各图片对应分类。本发明专利技术图片分类方法及装置,对于获取的无标签图片,通过提取图片的图像特征,对图片的图像特征数据进行聚类而分为若干类,而后根据对特征数据的分类结果对图片进行分类,本方法及装置实现了自动对图片进行分类,与现有技术相比节省了人力和时间成本。

【技术实现步骤摘要】
一种图片分类方法及装置
本专利技术涉及图像处理
,特别是涉及一种图片分类方法及装置。
技术介绍
在基于图像的深度学习领域,海量的用于训练的图片是完成深度学习网络模型训练的基础,而完美符合训练要求的图片往往稀缺,因此,在实际应用中用户会从网络上搜索而获得训练所需要的图片。但是直接从网络上获得的图片为无标签数据,没有标示分类标签,现有技术中由人工对获得的图片进行分类而添加标签,然而对于海量的训练图片,需要消耗巨大的人力和时间成本。
技术实现思路
本专利技术的目的是提供一种图片分类方法及装置,实现了自动对图片进行分类,与现有技术相比节省了人力和时间成本。为实现上述目的,本专利技术提供如下技术方案:一种图片分类方法,包括:对预设数量的待分类图片中每一图片提取图像特征,得到各图片的特征数据;对得到的各图片的特征数据进行聚类,将各图片的特征数据归属为若干类;根据对所述特征数据的聚类结果,将各所述图片对应分类。优选的,对得到的各图片的特征数据进行聚类包括:步骤S1:从得到的各图片的特征数据中随机选取若干个特征数据作为参考数据;步骤S2:对得到的每一特征数据,计算该特征数据与每一参考数据的差异量,将该特征数据和与该特征数据的差异量最小的参考数据分为同一类;步骤S3:求取分为同一类的特征数据的平均值,在分为同一类的特征数据中,将与该类的平均值差异量最小的特征数据更新为该类的参考数据,并计算更新后的参考数据与更新前的参考数据的差异量;步骤S4:判断各类对应的更新后的参考数据与更新前的参考数据的差异量是否都满足预设要求,若各类对应的更新后的参考数据与更新前的参考数据的差异量都满足预设要求,则完成对所述特征数据的聚类,若至少一类对应的更新后的参考数据与更新前的参考数据的差异量不满足预设要求,则执行步骤S2。优选的,所述预设要求为更新后的参考数据与更新前的参考数据的差异量小于预设阈值。优选的,两个所述特征数据之间的差异量为两个所述特征数据的欧式距离。优选的,对图片提取图像特征包括:将所述图片输入到预先训练好的用于提取图像特征的卷积神经网络模型内,由所述卷积神经网络模型输出所述图片的特征数据。优选的,根据对特征数据的聚类结果,将各所述图片对应分类包括:根据对特征数据的聚类结果,对于每一所述特征数据,在数据库中查找出与该特征数据对应的图片的数据文件,将查找出的图片的数据文件移动到该特征数据所属类对应的文件夹内。一种图片分类装置,用于执行以上所述图片分类方法。由上述技术方案可知,本专利技术所提供的图片分类方法及装置,首先对预设数量的待分类图片中每一图片提取图像特征,得到各图片的特征数据,然后对得到的各图片的特征数据进行聚类,将各图片的特征数据归属为若干类,进一步根据对特征数据的聚类结果,将各图片对应分类。本专利技术图片分类方法及装置,对于获取的无标签图片,通过提取图片的图像特征,对图片的图像特征数据进行聚类而分为若干类,而后根据对特征数据的分类结果对图片进行分类,本方法及装置实现了自动对图片进行分类,与现有技术相比节省了人力和时间成本。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种图片分类方法的流程图;图2为本专利技术实施例中对各图片的特征数据进行聚类的方法流程图。具体实施方式为了使本
的人员更好地理解本专利技术中的技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。请参考图1,图1为本专利技术实施例提供的一种图片分类方法的流程图,由图可知,所述图片分类方法包括以下步骤:S10:对预设数量的待分类图片中每一图片提取图像特征,得到各图片的特征数据。对于获取的大量无标签图片,对每一图片提取图像特征,得到各图片的特征数据。S11:对得到的各图片的特征数据进行聚类,将各图片的特征数据归属为若干类。本步骤中对得到的各图片的特征数据进行聚类,根据各特征数据之间包含的相同部分多少,将相互之间符合一定要求的特征数据归为同一类,进而将各图片的特征数据归属为若干类。S12:根据对所述特征数据的聚类结果,将各所述图片对应分类。根据对各图片特征数据的分类结果,将分为同一类的特征数据对应的图片分为同一类,添加类标签,从而完成对获取的大量图片分类。可以看出,本实施例图片分类方法,对于获取的无标签图片,通过提取图片的图像特征,对图片的图像特征数据进行聚类而分为若干类,而后根据对特征数据的分类结果对图片进行分类,本方法实现了自动对图片进行分类,与现有技术相比节省了人力和时间成本。下面结合具体实施方式对本实施例图片分类方法进行详细说明。本实施例提供的一种图片分类方法包括以下步骤:S10:对预设数量的待分类图片中每一图片提取图像特征,得到各图片的特征数据。在具体实施时,可以将图片输入到预先训练好的用于提取图像特征的卷积神经网络模型内,由所述卷积神经网络模型输出所述图片的特征数据。通过深度学习技术对图片提取图像特征,能够很好地、更为精细地提取图片的关键图像特征,有助于提高对特征数据进行聚类的准确性,提高对图片分类的精确性。示例性的,在实际应用中可以使用ResNet101网络模型或者AlexNet网络模型,但不限于此,也可以使用其它网络模型,也都在本专利技术保护范围内。另外,在具体实施时,可以将获得的特征数据与其对应图片对应存储入数据库中,将两者的存储路径配对,使得针对每一特征数据能够根据存储路径从数据库中快速地查找出与特征数据对应的图片数据。S11:对得到的各图片的特征数据进行聚类,将各图片的特征数据归属为若干类。可选的,在一种优选实施方式中可通过以下方法对各图片的特征数据进行聚类,请参考图2,具体包括以下步骤:S20:从得到的各图片的特征数据中随机选取若干个特征数据作为参考数据。从得到的特征数据中随机选取K个特征数据,将该K个特征数据作为K个参考数据。在实际应用时,用户可以根据相应的分类要求以及所获取图片的实际情况来设定类别值K。S21:对得到的每一特征数据,计算该特征数据与每一参考数据的差异量,将该特征数据和与该特征数据的差异量最小的参考数据分为同一类。具体的,两个特征数据的差异量可以是两个特征数据的欧式距离。将所有图片的特征数据合并构成特征矩阵,从其中随机选取K个特征数据作为K个参考数据,对于其中的每一特征数据,计算该特征数据与每一参考数据的欧式距离,将该特征数据和与该特征数据距离最小的参考数据归为同一类。S22:求取分为同一类的特征数据的平均值,在分为同一类的特征数据中,将与该类的平均值差异量最小的特征数据更新为该类的参考数据,并计算更新后的参考数据与更新前的参考数据的差异量。计算被分为同一类的所有特征数据的平均值,并计算属于该类的每一特征数据与平均值的差值,将与平均值的差值最小的特征数据更新作为该类的参考数据。并计本文档来自技高网
...

【技术保护点】
1.一种图片分类方法,其特征在于,包括:对预设数量的待分类图片中每一图片提取图像特征,得到各图片的特征数据;对得到的各图片的特征数据进行聚类,将各图片的特征数据归属为若干类;根据对所述特征数据的聚类结果,将各所述图片对应分类。

【技术特征摘要】
1.一种图片分类方法,其特征在于,包括:对预设数量的待分类图片中每一图片提取图像特征,得到各图片的特征数据;对得到的各图片的特征数据进行聚类,将各图片的特征数据归属为若干类;根据对所述特征数据的聚类结果,将各所述图片对应分类。2.根据权利要求1所述的图片分类方法,其特征在于,对得到的各图片的特征数据进行聚类包括:步骤S1:从得到的各图片的特征数据中随机选取若干个特征数据作为参考数据;步骤S2:对得到的每一特征数据,计算该特征数据与每一参考数据的差异量,将该特征数据和与该特征数据的差异量最小的参考数据分为同一类;步骤S3:求取分为同一类的特征数据的平均值,在分为同一类的特征数据中,将与该类的平均值差异量最小的特征数据更新为该类的参考数据,并计算更新后的参考数据与更新前的参考数据的差异量;步骤S4:判断各类对应的更新后的参考数据与更新前的参考数据的差异量是否都满足预设要求,若各类对应的更新后的参考数据与更新前的参考数据的差异量都满足预设要求,则完成对所述特...

【专利技术属性】
技术研发人员:刘怡俊梁培俊
申请(专利权)人:广东工业大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1