【技术实现步骤摘要】
图像多标签分类方法和装置
本专利技术涉及图像处理
,尤其涉及图像多标签分类方法和装置。
技术介绍
随着人工智能的不断发展,通常需要对图像进行标签分类。深度卷积神经网络在单标签图像分类中显示出巨大的优势,但是实际应用中,图像中的对象、场景、动作和属性通常可以对应多个标签,因此,需要对图像进行多标签分类。目前,在针对图像进行多标签分类时,在图像中有一个需要进行多标签分类的对象时,就需要使用一个独立的分类器对该图像进行多标签分类,如果图像中存在多个需要进行多标签分类的对象,那么就需要使用多个独立的分类器分别对图像进行多标签分类。现有的多标签分类方法,由于使用多个独立的分类器对图像进行分类,针对每一个对象进行分类时均需要对图像进行一次特征信息的提取,因此,会造成特征信息的冗余。
技术实现思路
本专利技术实施例提供了图像多标签分类方法和装置,以降低特征信息的冗余。第一方面,本专利技术实施例提供了一种图像多标签分类方法,包括:将包括有若干个待分类对象的待分类图像输入到预先训练好的 ...
【技术保护点】
1.一种图像多标签分类方法,其特征在于,包括:/n将包括有若干个待分类对象的待分类图像输入到预先训练好的CNN中,输出每一个待分类对象分别对应的标签概率集;所述标签概率集中包括该待分类对象对应至少一个标签的概率;/n根据输出的每一个待分类对象分别对应的标签概率集,生成若干个标签序列;所述标签序列中包括每一个待分类对象分别对应一个标签的概率;/n将生成的若干个所述标签序列输入到预先训练好的RNN中,输出所述待分类图像中具有依赖关系的分类标签。/n
【技术特征摘要】
1.一种图像多标签分类方法,其特征在于,包括:
将包括有若干个待分类对象的待分类图像输入到预先训练好的CNN中,输出每一个待分类对象分别对应的标签概率集;所述标签概率集中包括该待分类对象对应至少一个标签的概率;
根据输出的每一个待分类对象分别对应的标签概率集,生成若干个标签序列;所述标签序列中包括每一个待分类对象分别对应一个标签的概率;
将生成的若干个所述标签序列输入到预先训练好的RNN中,输出所述待分类图像中具有依赖关系的分类标签。
2.根据权利要求1所述的方法,其特征在于,
在所述生成若干个标签序列之前,进一步包括:将每一个待分类对象中分别对应的标签概率集中,小于预设概率阈值的概率删除,形成处理后的标签概率集;
所述生成若干个标签序列,包括:确定从每一个待分类对象所对应的处理后的标签概率集中,各选取一个标签的概率的组合方式,将每一种组合方式中所选取的标签的概率分别生成对应的一个标签序列。
3.根据权利要求2所述的方法,其特征在于,
进一步包括:设置至少两个标签分类级别;
在所述将每一种组合方式中所选取的标签的概率分别生成对应的一个标签序列之后,所述将生成的若干个所述标签序列输入到预先训练好的RNN中之前,进一步包括:
针对生成的每一个标签序列,均执行如下处理:
确定该当前标签序列中所选取的标签的概率所对应标签分别属于的标签分类级别;
在该当前标签序列中,将标签分类级别高的标签所对应的概率排列在标签分类级别低的标签所对应的概率的前面,将标签分类级别相同的标签所对应的概率中数值较大的概率排列在数值较小的概率的前面,以及将标签分类级别相同的标签所对应的概率中数值相同的概率按任一先后顺序排列在一起;
根据处理后的每一个标签序列,执行所述输入到预先训练好的RNN中。
4.根据权利要求1-3所述的方法,其特征在于,利用如下方式训练CNN和RNN:
建立样本图像数据集,针对所述样本图像数据集中的每一个样本图像,均执行:
根据当前样本图像中包括的至少一个样本对象,添加样本标签;根据该当前样本图像对应的样本标签,生成与当前样本图像对应的多标签向量;将该当前样本图像和所述多标签向量作为训练CNN的输入项,由CNN针对该当前样本图像输出每一个样本对象分别对应每一个样本标签的概率;确定从每一个样本对象所对应的每一个样本标签的概率中,各选取一个样本标签的概率的组合方式,将每一种组合方式中所选取的样本标签的概率分别生成对应的一个样本标签序列,将生成的样本标签序列作为训练RNN的输入项,将该当前样本图像的多标签向量作为训练RNN的输出项。
5.根据权利要求1-3所述的方法,其特征在于,所述输出所述待分类图像中具有依赖关系的分类标签,包括:
针对输入的每一个标签序列,均执行:
按照该当前标签序列中N个概率的排列前后顺序,依次计算所述待分类图像分别对应每一个第一标签时的计算概率,所述第一...
【专利技术属性】
技术研发人员:李雪,李锐,王建华,
申请(专利权)人:济南浪潮高新科技投资发展有限公司,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。