The present invention relates to an image classification method and device. The method comprises the following steps: to be classified image input multiple different neural network model, the neural network model to specify multiple non input layer data output by generating a plurality of corresponding image features; a plurality of images for each input feature. The neural network model of the corresponding linear discriminant classifier to obtain the corresponding preset categories, the classification of the image contains preset categories object image probability value; image feature extraction based on the training by the neural network model of the corresponding phase of training should be obtained and the linear classifier is obtained; according to various probability value objects the classification of the image judging whether an image contains preset categories. The image classification method provided by the invention enables the image classification to be more accurate.
【技术实现步骤摘要】
图像分类方法和装置
本专利技术涉及计算机视觉
,特别是涉及一种图像分类方法和装置。
技术介绍
图像分类方法是根据在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法,具体利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。对图像进行分类后,便可以根据分类结果做进一步应用,比如图像检索、视频监控以及涉及图像的语义分析等各种应用。目前利用神经网络模型可以实现较为准确的图像分类,但随着图像分类应用的不断扩展和细化,对图像分类准确性的要求不断提高,因此如何提高图像分类的准确性成为目前需要解决的一个重要问题。
技术实现思路
基于此,有必要针对上述问题,提供一种可提高图像分类准确性的图像分类方法和装置。一种图像分类方法,所述方法包括:将待分类的图像输入多个不同的神经网络模型,获取各神经网络模型的指定的多个非输入层输出的数据生成相应的多个图像特征;将多个图像特征分别输入各神经网络模型对应的用于判别预设类别的线性分类器,获得相应的所述待分类的图像包含预设类别的物体图像的概率值;所述线性分类器是根据由相应的神 ...
【技术保护点】
一种图像分类方法,所述方法包括:将待分类的图像输入多个不同的神经网络模型,获取各神经网络模型的指定的多个非输入层输出的数据生成相应的多个图像特征;将多个图像特征分别输入各神经网络模型对应的用于判别预设类别的线性分类器,获得相应的所述待分类的图像包含预设类别的物体图像的概率值;所述线性分类器是根据由相应的神经网络模型提取的相应的训练图像的特征进行训练得到的;根据获得的各个概率值判别所述待分类的图像是否包含预设类别的物体图像。
【技术特征摘要】
1.一种图像分类方法,所述方法包括:将待分类的图像输入多个不同的神经网络模型,获取各神经网络模型的指定的多个非输入层输出的数据生成相应的多个图像特征;将多个图像特征分别输入各神经网络模型对应的用于判别预设类别的线性分类器,获得相应的所述待分类的图像包含预设类别的物体图像的概率值;所述线性分类器是根据由相应的神经网络模型提取的相应的训练图像的特征进行训练得到的;根据获得的各个概率值判别所述待分类的图像是否包含预设类别的物体图像。2.根据权利要求1所述的方法,其特征在于,所述将待分类的图像输入多个不同的神经网络模型,获取各神经网络模型的指定的多个非输入层输出的数据生成相应的多个图像特征,包括:将待分类的图像输入每个神经网络模型;获取每个神经网络模型的中间层和输出层中指定的多个层输出的向量;将每个神经网络模型的不同层的向量拼接,获得分别与每个神经网络模型对应的多个图像特征。3.根据权利要求2所述的方法,其特征在于,所述将待分类的图像输入每个神经网络模型,包括:将待分类的图像按照多个尺度分别输入每个神经网络模型;所述将每个神经网络模型的不同层的向量拼接,获得分别与每个神经网络模型对应的多个图像特征,包括:将每个神经网络模型的相同尺度的图像对应的不同层的向量拼接,并将不同尺度的图像对应的向量求平均值,获得分别与每个神经网络模型对应的多个图像特征。4.根据权利要求1至3中任意一项所述的方法,其特征在于,所述方法还包括:将采用一种训练集训练的原始的神经网络模型的输出层的系数清空,调整输出层与另外的训练集适配,并采用所述另外的训练集重新训练得到重新训练的神经网络模型。5.根据权利要求4所述的方法,其特征在于,所述根据获得的各个概率值判别所述待分类的图像是否包含预设类别的物体图像,包括:采用窗口遍历待分类的图像以提取窗口图像并缩放至相同尺寸;将各个窗口图像输入到重新训练的神经网络模型,并获取非输入层输出的数据生成窗口图像特征;将各个窗口图像特征分别输入重新训练的神经网络模型对应的用于判别预设类别的线性分类器,并根据相应的线性分类器输出的结果获得各个窗口图像包含预设类别的物体图像的概率值;从各个窗口图像对应的概率值中选择值最大的概率值;从选择的概率值和原始的神经网络模型对应的概率值中选取值最大的概率值;计算选取的概率值和重新训练的神经网络模型对应的概率值的加权平均值;根据所述加权平均值与预设类别对应的概率值阈值的大小关系判别所述待分类的图像是否包含预设类别的物体图像。6...
【专利技术属性】
技术研发人员:徐昆,郭晓威,黄飞跃,张睿欣,王巨宏,胡事民,刘斌,
申请(专利权)人:清华大学,腾讯科技深圳有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。