图像分类方法及装置制造方法及图纸

技术编号：14205249 阅读：113 留言：0更新日期：2016-12-18 12:03

本公开关于一种图像分类方法及装置，属于图像处理领域。所述方法包括：获取待分类的图像；确定所述图像中每个对象的类别信息和每两个对象之间的位置信息；根据每个对象的类别信息和每两个对象之间的位置信息确定所述图像的场景；按照所述图像的场景对所述图像进行分类。本公开可以从全局的角度对图像进行分类，解决了根据图像的局部纹理特征对图像进行分类，导致对图像的分类不准确的问题，达到了提高图像的分类准确性的效果。

Image classification method and device

The invention discloses an image classification method and a device, belonging to the field of image processing. The method comprises: acquiring the position information of the image to be classified; determine the image of each object in each of the two categories of information and objects; the image is determined according to the position information of scene category information and each of the two objects of each object; according to the image of the scene on the image classification. The public can classify images from a global perspective, to solve the image according to the classification of local image texture features for image classification, resulting in inaccurate problem, to improve the classification accuracy of the image effect.

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及图像处理领域，特别涉及一种图像分类方法及装置。
技术介绍
随着智能终端的普及，使用智能终端随时随地的记录生活已经成为用户的生活常态。随着用户保存在智能终端中的图像越来越多，图像的分类整理成为人们研究的热点问题。相关技术中采用Bag-of-Words(词袋)模型对图像进行分类，其中，Bag-of-Words模式以图像的局部纹理特征来表示图像，可以取得较好的图像分类的效果。
技术实现思路
为解决相关技术中的问题，本公开提供了一种图像分类方法及装置。根据本公开实施例的第一方面，提供一种图像分类方法，所述方法包括：获取待分类的图像；确定所述图像中每个对象的类别信息和每两个对象之间的位置信息；根据每个对象的类别信息和每两个对象之间的位置信息确定所述图像的场景；按照所述图像的场景对所述图像进行分类。可选的，所述确定所述图像中每个对象的类别信息和每两个对象之间的位置信息，包括：对于从所述图像中选取的n个滑动窗口中的每个滑动窗口中的对象，读取根据预设算法对所述对象进行计算得到的m维的第一向量，将所述第一向量作为所述对象的类别信息，所述第一向量包括所述对象分别属于预设的m个类别中的每个类别的概率；对于筛选出的p个第一向量所对应的p个对象中的每个对象，计算所述对象在所述图像中的绝对位置；对于所述p个对象中的每两个对象，根据所述两个对象在所述图像中的绝对位置计算所述两个对象的位置关系是预设的q种位置关系中的每种位置关系的概率，得到q维的第二向量，将所述第二向量作为所述两个对象之间的位置信息，n、m、p和q均为正整数。可选的，所述计算所述对象在所述图像中的绝对位置，包括：...
图像分类方法及装置

【技术保护点】
一种图像分类方法，其特征在于，所述方法包括：获取待分类的图像；确定所述图像中每个对象的类别信息和每两个对象之间的位置信息；根据每个对象的类别信息和每两个对象之间的位置信息确定所述图像的场景；按照所述图像的场景对所述图像进行分类。

【技术特征摘要】
1.一种图像分类方法，其特征在于，所述方法包括：获取待分类的图像；确定所述图像中每个对象的类别信息和每两个对象之间的位置信息；根据每个对象的类别信息和每两个对象之间的位置信息确定所述图像的场景；按照所述图像的场景对所述图像进行分类。2.根据权利要求1所述的方法，其特征在于，所述确定所述图像中每个对象的类别信息和每两个对象之间的位置信息，包括：对于从所述图像中选取的n个滑动窗口中的每个滑动窗口中的对象，读取根据预设算法对所述对象进行计算得到的m维的第一向量，将所述第一向量作为所述对象的类别信息，所述第一向量包括所述对象分别属于预设的m个类别中的每个类别的概率；对于筛选出的p个第一向量所对应的p个对象中的每个对象，计算所述对象在所述图像中的绝对位置；对于所述p个对象中的每两个对象，根据所述两个对象在所述图像中的绝对位置计算所述两个对象的位置关系是预设的q种位置关系中的每种位置关系的概率，得到q维的第二向量，将所述第二向量作为所述两个对象之间的位置信息，n、m、p和q均为正整数。3.根据权利要求2所述的方法，其特征在于，所述计算所述对象在所述图像中的绝对位置，包括：读取所述对象所在的滑动窗口的原始坐标；读取根据所述预设算法对所述对象进行计算得到的调整坐标，所述调整坐标用于对所述原始坐标进行调整；根据所述调整坐标对所述原始坐标进行调整，将调整结果确定为所述对象在所述图像中的绝对位置。4.根据权利要求3所述的方法，其特征在于，所述方法还包括：按照预设的卷积窗口对所述图像进行卷积，得到全局矩阵；从所述图像中选取n个滑动窗口；对于所述n个滑动窗口中的每个滑动窗口，在所述全局矩阵中查找与所述滑动窗口具有映射关系的局部矩阵；对查找到的n个局部矩阵进行池化处理；对池化处理得到的n个局部矩阵进行全连接处理，得到所述图像中每个对象的所述第一向量；筛选满足预设条件的每个第一向量所对应的对象，得到所述p个对象，所述预设条件是所述第一向量中存在至少一个概率值大于预设阈值；计算所述p个对象中每个对象所在的滑动窗口的所述调整坐标。5.根据权利要求2所述的方法，其特征在于，所述根据每个对象的类别信息和每两个对象之间的位置信息确定所述图像的场景，包括：将所述图像中每个对象的第一向量相接合，得到m×p维的第三向量；将所述图像中每两个对象对应的第二向量相接合，得到q×p×(p-1)/2维的第四向量；将所述第三向量和所述第四向量相接合，得到m×p+q×p×(p-1)/2维的第五向量；将所述第五向量输入到预设的支持向量机SVM中，将所述SVM的输出作为所述图像的场景。6.一种图像分类装置，其特征在于，所述装置包括：图像获取模块，被配置为获取待分类的图像；信息确定模块，被配置为确定所述图像获取模块得到的所述图像中每个对象的类别信息和每两个对象之间的位置信息；场景确定模块，被配置为根据所述信息确定模块确定的每个对象的类别信息和每两个对象之间的位置信息确定所述图像的场景；图像分类模块，被配置为按照所述场景确定模块确定的所述图像的场景对所述图像进行分类。7.根据权利要求6所述的装置，其特征在于，所...

【专利技术属性】
技术研发人员：万韶华，张涛，陈志军，
申请(专利权)人：北京小米移动软件有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人