对图像中的多个对象进行分类的方法和系统、计算机系统技术方案

技术编号:14014667 阅读:65 留言:0更新日期:2016-11-17 19:19
本申请公开了一种对图像中的多个对象进行分类的方法和系统、计算机系统,所述方法包括:过滤所述图像以生成第一特征图,第一特征图包括用于表征各对象的语义特征的第一特征值;根据第一特征图和多个偏置值生成多个第二特征图,其中,每个第二特征图包括与经一偏置值偏置处理的各第一特征值分别对应的多个第二特征值;更新每个第二特征图以增强每个第二特征图中各第二特征值之间的差异性;以及根据更新后的各第二特征图对多个对象进行分类。本申请的方案降低了对用于过滤图像的筛选器的数量要求,减小了计算负担,提高了图像识别的速度。

【技术实现步骤摘要】

本申请一般地涉及图像识别领域,更具体地,涉及一种对图像中的多个对象进行分类的方法和系统、计算机系统
技术介绍
将图像中出现的多个对象进行分类是图像识别领域中的一个核心问题。CNN(Convolutional Neural Network,卷积神经网络)作为深度学习网络的一种卓而有效的实现方式,在图像识别领域中得以广泛应用。一般而言,传统的CNN需要使用具有不同卷积核(kernel)的多个筛选器(filter)与图像进行卷积操作从而获得不同的特征图(feature map)。在每个特征图中,图像仅对与所使用的筛选器有关的特征有强的响应。因此,为了对图像中多个不同的对象进行准确的分类,往往需要选用数量众多的筛选器,这增加了计算负担,限制了图像识别的速度。
技术实现思路
本申请提供一种对图像中的多个对象进行分类的技术方案。本申请实施方式的一方面提供用于对图像中的多个对象进行分类的方法,该方法包括:过滤图像以生成第一特征图,第一特征图包括用于表征各对象的语义特征的第一特征值;根据第一特征图和多个偏置值生成多个第二特征图,其中,每个第二特征图包括与经一偏置值偏置处理的各第一特征值分别对应的多个第二特征值;更新每个第二特征图以增强每个第二特征图中各第二特征值之间的差异性;以及根据更新后的各第二特征图对多个对象进行分类。在一些可选的实现方式中,根据更新后的第二特征图对多个对象进行分类包括:根据更新后的各第二特征图评估图像中的多个对象分别属于预定种类的概率值;以及将各对象分别划分到具有最大概率值的预定种类中。在一些可选的实现方式中,根据更新后的各第二特征图对多个对象进行分类包括:将更新后的各第二特征图线性合并为第三特征图;以及根据第三特征图对多个对象进行分类。在一些可选的实现方式中,根据第一特征图和多个偏置值生成多个第二特征图,包括:将多个偏置值中的每个偏置值分别与第一特征图中的各第一特征值叠加。在一些可选的实现方式中,根据第一特征图中的各第一特征值和多个偏置值生成与各偏置值相对应的第二特征图包括:将各第二特征图中的小于预定阈值的第二特征值设置为零。在一些可选的实现方式中,各偏置值各不相同,且各预定阈值基于各偏置值确定。在一些可选的实现方式中,更新每个第二特征图以增强每个第二特征图中各第二特征值之间的差异性,包括:调整至少一对象的至少一语义特征以增强第二特征图中各第二特征值之间的差异性。在一些可选的实现方式中,过滤图像以生成第一特征图包括:将图像输入至卷积神经网络的特征提取层;以及在特征提取层中使用多个第一筛选器与图像进行卷积从而生成与各第一筛选器对应的第一特征图;其中,各第一筛选器用于对图像中的其中一个语义特征进行筛选。在一些可选的实现方式中,卷积神经网络还包括特征图分解层,根据第一特征图和多个偏置值生成多个第二特征图,包括:将第一特征图输入至特征图分解层;将多个偏置值中的每个偏置值分别与第一特征图中的各第一特征值叠加;基于各偏置值确定预定阈值;以及将各第二特征图中的小于预定阈值的第二特征值设置为零。在一些可选的实现方式中,卷积神经网络还包括与特征图分解层联接的特征增强层,更新每个第二特征图以增强每个第二特征图中各第二特征值之间的差异性,包括:将多个第二特征图分别输入至特征增强层;以及在特征增强层中使用第二筛选器与各第二特征图进行卷积,从而更新各第二特征图以增强各第二特征值之间的差异性;其中,第二筛选器用于对第二特征图中的其中一个语义特征进行增强。在一些可选的实现方式中,卷积神经网络还包括联接至特征增强层的分类层,根据更新后的各第二特征图对多个对象进行分类还包括:将更新后各第二特征图输入至分类层;根据更新后的各第二特征图评估图像中的多个对象分别属于预定种类的概率值;以及将各对象分别划分到具有最大概率值的预定种类中。本申请实施方式的另一方面提供用于对图像中的多个对象进行分类的系统,该系统包括:特征提取器,用于过滤图像以生成第一特征图,第一特征图包括用于表征各对象的语义特征的第一特征值;偏置器,用于根据第一特征图和多个偏置值生成多个第二特征图,其中,每个第二特征图包括与经一偏置值偏置处理的各第一特征值分别对应的多个第二特征值;特征强化器,用于更新每个第二特征图以增强每个第二特征图中各第二特征值之间的差异性;以及分类器,用于根据更新后的各第二特征图对多个对象进行分类。在一些可选的实现方式中,分类器包括:评估单元,用于根据更新后的各第二特征图评估图像中的多个对象分别属于预定种类的概率值;以及划分单元,用于将各对象分别划分到具有最大概率值的预定种类中。在一些可选的实现方式中,分类器包括:合并单元,用于将更新后的各第二特征图线性合并为第三特征图;以及分类单元,用于根据第三特征图对多个对象进行分类。在一些可选的实现方式中,偏置器用于:将多个偏置值中的每个偏置值分别与第一特征图中的各第一特征值叠加。在一些可选的实现方式中,偏置器还用于:将各第二特征图中的小于预定阈值的第二特征值设置为零。在一些可选的实现方式中,各偏置值各不相同,且各预定阈值基于各偏置值确定。在一些可选的实现方式中,特征强化器进一步用于:调整至少一对象的至少一语义特征以增强第二特征图中各第二特征值之间的差异性。在一些可选的实现方式中,特征提取器还包括:第一输入单元,用于将图像输入至卷积神经网络的特征提取层;以及第一卷积单元,用于在特征提取层中使用第一筛选器与图像进行卷积从而生成第一特征图;其中,各第一筛选器用于对图像中的其中一个语义特征进行筛选。在一些可选的实现方式中,卷积神经网络包括特征图分解层,偏置器还包括:第二输入单元,用于将第一特征图输入至特征图分解层;叠加单元,用于将多个偏置值中的每个偏置值分别与第一特征图中的各第一特征值叠加;确定单元,用于根据各偏置值确定预定阈值;以及生成单元,用于将小于预定阈值的第二特征值设置为零。在一些可选的实现方式中,卷积神经网络还包括与特征图分解层联接的特征增强层,特征强化器还包括:第三输入单元,用于将多个第二特征图分别输入至特征增强层;以及第二卷积单元,用于在特征增强层中使用第二筛选器与各第二特征图进行卷积,从而更新各第二特征图以增强各第二特征值之间的差异性;其中,第二筛选器用于对第二特征图中的其中一个语义特征进行增强。在一些可选的实现方式中,卷积神经网络包括分类层,分类器还包括:第四输入单元,用于将更新后的各第二特征图输入至分类层;评估单元还用于根据输入至分类层的更新后的第二特征图评估图像中的多个对象分别属于预定种类的概率值。本申请实施方式的再一方面提供一种计算机系统,包括:存储器,存储可执行指令;一个或多个处理器,与存储器通信以执行可执行指令从而完成以下操作:过滤图像以生成第一特征图,第一特征图包括用于表征各对象的语义特征的第一特征值;根据第一特征图和多个偏置值生成多个第二特征图,其中,每个第二特征图包括与经一偏置值偏置处理的各第一特征值分别对应的多个第二特征值;更新每个第二特征图以增强每个第二特征图中各第二特征值之间的差异性;以及根据更新后的各第二特征图对多个对象进行分类。本申请实施方式的又一方面还提供了一种计算机存储介质,用于存储计算机可读取的指令。所述指令包括:过滤图像以生成第一特征图的指令,第一特征图本文档来自技高网...

【技术保护点】
一种用于对图像中的多个对象进行分类的方法,其特征在于,包括:过滤所述图像以生成第一特征图,所述第一特征图包括用于表征各所述对象的语义特征的第一特征值;根据所述第一特征图和多个偏置值生成多个第二特征图,其中,每个所述第二特征图包括与经一偏置值偏置处理的各第一特征值分别对应的多个第二特征值;更新每个所述第二特征图以增强每个所述第二特征图中各所述第二特征值之间的差异性;以及根据更新后的各所述第二特征图对所述多个对象进行分类。

【技术特征摘要】
1.一种用于对图像中的多个对象进行分类的方法,其特征在于,包括:过滤所述图像以生成第一特征图,所述第一特征图包括用于表征各所述对象的语义特征的第一特征值;根据所述第一特征图和多个偏置值生成多个第二特征图,其中,每个所述第二特征图包括与经一偏置值偏置处理的各第一特征值分别对应的多个第二特征值;更新每个所述第二特征图以增强每个所述第二特征图中各所述第二特征值之间的差异性;以及根据更新后的各所述第二特征图对所述多个对象进行分类。2.根据权利要求1所述的方法,其特征在于,所述根据更新后的第二特征图对所述多个对象进行分类包括:根据更新后的各第二特征图评估所述图像中的多个对象分别属于预定种类的概率值;以及将各所述对象分别划分到具有最大概率值的预定种类中。3.根据权利要求1所述的方法,其特征在于,所述根据更新后的各第二特征图对所述多个对象进行分类包括:将更新后的各第二特征图线性合并为第三特征图;以及根据所述第三特征图对所述多个对象进行分类。4.根据权利要求1-3任一所述的方法,其特征在于,根据所述第一特征图和多个偏置值生成多个第二特征图,包括:将多个偏置值中的每个偏置值分别与所述第一特征图中的各第一特征值叠加。5.根据权利要求1-4任一所述的方法,其特征在于,所述根据所述第一特征图中的各所述第一特征值和多个偏置值生成与各所述偏置值相对应的第二特征图包括:将各所述第二特征图中的小于预定阈值的第二特征值设置为零。6.一种用于对图像中的多个对象进行分类的系统,其特征在于,包括:特征提取器,用于过滤所述图像以生成第一特征图,所述第一特征图包括用于表征各所述...

【专利技术属性】
技术研发人员:王晓刚李弘扬欧阳万里
申请(专利权)人:北京市商汤科技开发有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1