图像分类的方法、装置以及存储介质制造方法及图纸

技术编号:26172857 阅读:25 留言:0更新日期:2020-10-31 13:52
本申请公开了一种图像分类的方法、装置以及存储介质。其中,该方法包括:获取待分类图像的图像特征向量;利用预先训练的图像分类模型对图像特征向量进行计算,确定待分类图像对应于每个分类类别的概率值,其中分类类别包括已知分类类别和未知分类类别,图像分类模型是基于分类类别与类别属性集合训练得到的,类别属性集合包含多个与分类类别具有关联关系的类别属性;以及在根据概率值判断待分类图像属于未知分类类别的情况下,对待分类图像进行聚类,从类别属性集合中确定与未知分类类别对应的类别属性。

【技术实现步骤摘要】
图像分类的方法、装置以及存储介质
本申请涉及人工智能
,特别是涉及一种图像分类的方法、装置以及存储介质。
技术介绍
图像分类是根据图像的语义信息将不同类别图像区分开来,是计算机视觉中重要的基本问题,也是图像检测、图像分割、物体跟踪、行为分析等其他高层视觉任务的基础。现有技术中可以采用神经网络将图像进行分类,然而传统的深度神经网络分类系统,需要大量的标注数据才能进行训练,其训练完成的网络在实际应用中只能识别与标注训练数据相关的图像,当新出现需要分类的类别时,无法进行识别分类。只有重新标注数据,然后重新训练模型,才可以对新出现的类别进行区分,因此扩展性不强。针对上述的现有技术中存在的训练好的神经网络模型只能对训练过程中的类别进行识别,当出现新的类别时需要重新标注数据进行模型训练,因此模型扩展性不强的技术问题,目前尚未提出有效的解决方案。
技术实现思路
本公开的实施例提供了一种图像分类的方法、装置以及存储介质,以至少解决现有技术中存在的训练好的神经网络模型只能对训练过程中的类别进行识别,当出现新的类别时需要重新标注数据进行模型训练,因此模型扩展性不强的技术问题。根据本公开实施例的一个方面,提供了一种图像分类的方法,包括:获取待分类图像的图像特征向量;利用预先训练的图像分类模型对图像特征向量进行计算,确定待分类图像对应于每个分类类别的概率值,其中分类类别包括已知分类类别和未知分类类别,图像分类模型是基于分类类别与类别属性集合训练得到的,类别属性集合包含多个与分类类别具有关联关系的类别属性;以及在根据概率值判断待分类图像属于未知分类类别的情况下,对待分类图像进行聚类,从类别属性集合中确定与未知分类类别对应的类别属性。根据本公开实施例的另一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时由处理器执行以上任意一项所述的方法。根据本公开实施例的另一个方面,还提供了一种图像分类的装置,包括:特征提取模块,用于获取待分类图像的图像特征向量;计算模块,用于利用预先训练的图像分类模型对图像特征向量进行计算,确定待分类图像对应于每个分类类别的概率值,其中分类类别包括已知分类类别和未知分类类别,图像分类模型是基于分类类别与类别属性集合训练得到的,类别属性集合包含多个与分类类别具有关联关系的类别属性;以及类别确定模块,用于在根据概率值判断待分类图像属于未知分类类别的情况下,对待分类图像进行聚类,从类别属性集合中确定与未知分类类别对应的类别属性。根据本公开实施例的另一个方面,还提供了一种图像分类的装置,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:获取待分类图像的图像特征向量;利用预先训练的图像分类模型对图像特征向量进行计算,确定待分类图像对应于每个分类类别的概率值,其中分类类别包括已知分类类别和未知分类类别,图像分类模型是基于分类类别与类别属性集合训练得到的,类别属性集合包含多个与分类类别具有关联关系的类别属性;以及在根据概率值判断待分类图像属于未知分类类别的情况下,对待分类图像进行聚类,从类别属性集合中确定与未知分类类别对应的类别属性。在本公开实施例中,首先提取待分类图像的特征向量,然后利用基于分类类别与类别属性集合训练的图像分类模型对图像特征向量进行计算,确定待分类图像对应于每个分类类别的概率值,其中分类类别包含已知分类类别和未知分类类别。最终,在根据概率值判断该待分类图像为已知分类类别的情况下,确定待分类图像的具体类别。在判断该待分类图像为未知分类类别的情况下,对该图像进行聚类,从类别属性集合中确定与未知分类类别对应的类别属性,即:根据所确定的类别属性重新确定一个新的分类。从而,该模型可以根据类别属性重新确定未训练过的图像所属的新类别,不需要重新标注数据训练模型去识别新类别。因此与现有技术相比,本方案可以实现对为训练过的图像进行识别分类的技术效果,增强了模型的扩展性和鲁棒性。从而解决了现有技术中存在的训练好的神经网络模型只能对训练过程中的类别进行识别,当出现新的类别时需要重新标注数据进行模型训练,因此模型扩展性不强的技术问题。附图说明此处所说明的附图用来提供对本公开的进一步理解,构成本申请的一部分,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。在附图中:图1是用于实现根据本公开实施例1所述的方法的计算设备的硬件结构框图;图2是根据本公开实施例1的第一个方面所述的图像分类的方法的流程示意图;图3是根据本公开实施例1所述的知识图谱的结构示意图;图4a是根据本公开实施例1所述的分类类别和类别属性的关联关系的结构示意图;图4b是根据本公开实施例1所述的分类类别和类别属性的关联关系的结构示意图;图5是根据本公开实施例2所述的图像分类的装置的示意图;以及图6是根据本公开实施例3所述的图像分类的装置的示意图。具体实施方式为了使本
的人员更好地理解本公开的技术方案,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本公开一部分的实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本公开保护的范围。需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。实施例1根据本实施例,提供了一种图像分类的方法,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。本实施例所提供的方法实施例可以在服务器或者类似的计算设备中执行。图1示出了一种用于实现图像分类的方法的计算设备的硬件结构框图。如图1所示,计算设备可以包括一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器、以及用于通信功能的传输装置。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算设备还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。应当注意本文档来自技高网
...

【技术保护点】
1.一种图像分类的方法,其特征在于,包括:/n获取待分类图像的图像特征向量;/n利用预先训练的图像分类模型对所述图像特征向量进行计算,确定所述待分类图像对应于每个分类类别的概率值,其中所述分类类别包括已知分类类别和未知分类类别,所述图像分类模型是基于分类类别与类别属性集合训练得到的,所述类别属性集合包含多个与所述分类类别具有关联关系的类别属性;以及/n在根据所述概率值判断所述待分类图像属于所述未知分类类别的情况下,对所述待分类图像进行聚类,从所述类别属性集合中确定与所述未知分类类别对应的类别属性。/n

【技术特征摘要】
1.一种图像分类的方法,其特征在于,包括:
获取待分类图像的图像特征向量;
利用预先训练的图像分类模型对所述图像特征向量进行计算,确定所述待分类图像对应于每个分类类别的概率值,其中所述分类类别包括已知分类类别和未知分类类别,所述图像分类模型是基于分类类别与类别属性集合训练得到的,所述类别属性集合包含多个与所述分类类别具有关联关系的类别属性;以及
在根据所述概率值判断所述待分类图像属于所述未知分类类别的情况下,对所述待分类图像进行聚类,从所述类别属性集合中确定与所述未知分类类别对应的类别属性。


2.根据权利要求1所述的方法,其特征在于,利用预先训练的图像分类模型对所述图像特征向量进行计算,确定所述待分类图像对应于每个分类类别的概率值,包括:
利用所述图像分类模型,确定所述待分类图像拥有所述类别属性集合中每个类别属性的第一概率值;
利用所述图像分类模型,确定所述待分类图像在拥有所述每个类别属性的情况下,属于所述每个分类类别的第二概率值;以及
根据所述第一概率值和所述第二概率值,确定所述待分类图像对应于每个分类类别的概率值。


3.根据权利要求2所述的方法,其特征在于,还包括:根据以下公式依次确定所述第一概率值、所述第二概率值以及所述待分类图像对应于每个分类类别的概率值:









其中,p(ɑj|I)为所述第一概率值,p(ci|I,ɑj)为所述第二概率值,p(ci|I)为所述待分类图像对应于每个分类类别的概率值,W1、W2、W3、W4、W5、V1、V2为所述图像分类模型的参数,fimage为图像特征提取模型,ftext为文本特征提取模型,I为所述待分类图像,ci为所述分类类别,ɑj为所述类别属性,δ为所述图像分类模型的激活函数。


4.根据权利要求2所述的方法,其特征在于,对所述待分类图像进行聚类,从所述类别属性集合中确定与所述未知分类类别对应的类别属性,包括:
根据所述第一概率值确定与所述待分类图像的类别属性相关的特征向量;以及
对与所述待分类图像的类别属性相关的特征向量进行聚类,从所述类别属性集合中确定与所述未知分类类别对应的类别属性。


5.根据权利要求1所述的方法,其特征在于,还包括:在根据所述概率值判断所述待分类图像属于所述已知分类类别的情况下,根据所述概率值确定所述待分类图像对应的分类类别。


6.根据权利要...

【专利技术属性】
技术研发人员:胡军张玥
申请(专利权)人:上海小零网络科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1