一种训练图像分类模型的方法和装置制造方法及图纸

技术编号：20589715 阅读：23 留言：0更新日期：2019-03-16 07:25

本申请公开了训练图像分类模型的方法和装置。该方法包括：步骤一、提取图像的特征；步骤二、采用聚类算法对图像的特征进行聚类，以生成所有类别的图像的视觉码书；步骤三、提取其中的第一类别的图像的特征；步骤四、根据欧氏距离最近邻原则，采用视觉码书对第一类别的图像的特征进行特征包模型BOF量化，以计算出第一类别的图像的各个特征在视觉码书中分别出现的频率；步骤五、根据第一类别图像的各个特征分别出现的频率，生成作为第一类别的图像的分类模型的图像的BOF量化直方图；对所有类别的图像依次执行步骤三、步骤四和步骤五，以生成所有类别的图像的BOF量化直方图。上述方案训练出的图像分类模型提高用户查找图像中的内容的效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种训练图像分类模型的方法和装置
本专利技术涉及图像识别领域，尤指一种训练图像分类模型的方法和装置。
技术介绍
移动互联网、智能手机以及社交网络的发展带来了海量图片信息，有文章显示，Instagram每天图片上传量约为6000万张；WhatsApp每天的图片发送量为5亿张；国内的微信朋友圈也是以图片分享为驱动。不受地域和语言限制的图片逐渐取代了繁琐而微妙的文字，成为了传词达意的主要媒介。图片成为互联网信息交流主要媒介的原因主要在于两点：第一，从用户读取信息的习惯来看，相比于文字，图片能够为用户提供更加生动、容易理解、有趣及更具艺术感的信息；第二，从图片来源来看，智能手机为用户带来方便的拍摄和截屏手段，帮助用户更快的用图片来采集和记录信息。但伴随着图像成为互联网中的主要信息载体，难题随之出现。当用户需要查找图像的时候，往往需要翻阅每一张的图像，直到找到合适的图像为止。从上述描述中可以看出，目前缺少一种有效的图像分类模型，可以为图像进行有效的分类，因此用户查找图像中的内容的效率低下。
技术实现思路
为了解决上述技术问题，本申请提供了一种训练图像分类模型的方法和装置，其能够训练出高效的图像分类模型，所训练出的图像分类模型能够提高用户查找图像中的内容的效率。为了达到本专利技术目的，本申请提供了一种训练图像分类模型的方法，该方法包括下列步骤：步骤一、提取所输入的所有类别的图像的特征；步骤二、采用聚类算法对所提取的图像的特征进行聚类，以生成所有类别的图像的视觉码书；其中，视觉码书包括多个视觉码字，每个视觉码字代表相似特征的聚类中心，一个视觉码字作为图像的一个特征类别；步骤...

【技术保护点】
1.一种训练图像分类模型的方法，其特征在于，所述方法包括下列步骤：步骤一、提取所输入的所有类别的图像的特征；步骤二、采用聚类算法对所提取的图像的特征进行聚类，以生成所述所有类别的图像的视觉码书；其中，所述视觉码书包括多个视觉码字，每个视觉码字代表相似特征的聚类中心，一个视觉码字作为图像的一个特征类别；步骤三、提取所输入的所有类别的图像之中的第一类别的图像的特征；步骤四、根据欧氏距离最近邻原则，采用所述视觉码书对所提取的第一类别的图像的特征进行特征包模型BOF量化，以计算出所述第一类别的图像的各个特征在所述视觉码书中分别出现的频率；步骤五、根据所述第一类别的图像的各个特征在所述视觉码书中分别出现的频率，生成所述第一类别的图像的BOF量化直方图，作为所述第一类别的图像的分类模型；对所述所有类别的图像依次执行步骤三、步骤四以及步骤五，直到生成所述所有类别的图像的BOF量化直方图为止。

【技术特征摘要】
1.一种训练图像分类模型的方法，其特征在于，所述方法包括下列步骤：步骤一、提取所输入的所有类别的图像的特征；步骤二、采用聚类算法对所提取的图像的特征进行聚类，以生成所述所有类别的图像的视觉码书；其中，所述视觉码书包括多个视觉码字，每个视觉码字代表相似特征的聚类中心，一个视觉码字作为图像的一个特征类别；步骤三、提取所输入的所有类别的图像之中的第一类别的图像的特征；步骤四、根据欧氏距离最近邻原则，采用所述视觉码书对所提取的第一类别的图像的特征进行特征包模型BOF量化，以计算出所述第一类别的图像的各个特征在所述视觉码书中分别出现的频率；步骤五、根据所述第一类别的图像的各个特征在所述视觉码书中分别出现的频率，生成所述第一类别的图像的BOF量化直方图，作为所述第一类别的图像的分类模型；对所述所有类别的图像依次执行步骤三、步骤四以及步骤五，直到生成所述所有类别的图像的BOF量化直方图为止。2.根据权利要求1所述的方法，其特征在于，在所述生成所述所有类别的图像的BOF量化直方图的步骤之后，所述方法还包括：当接收到第二图像时，提取所述第二图像的特征；根据欧氏距离最近邻原则采用所述视觉码书对所述第二图像的特征进行BOF量化，以计算出所述第二图像的各个特征在所述视觉码书中分别出现的频率，作为所述第二图像的BOF量化直方图；将所述第二图像的BOF量化直方图与所有类别的图像的分类模型进行相似度匹配，以确定所述第二图像的类别。3.根据权利要求1所述的方法，其中，所述步骤四包括：计算第一类别的图像的每个特征与视觉码书中的每个视觉码字的欧式距离；比较各个特征之中的每个特征分别与视觉码书中的各个视觉码字之间的欧式距离，依据欧式距离最近邻原则选取与所述各个特征之中的第一特征距离最小的视觉码字作为所述第一特征的特征类别匹配；统计各个视觉码字匹配的图像特征的数量，并且将在视觉码书中的直方图统计频率高于设定阈值的视觉码字所匹配的特征认作第一类别的图像的特征；根据所述第一类别的图像的特征，生成所述第一类别的图像的BOF量化直方图。4.根据权利要求2所述的方法，其中，所述将所述第二图像的BOF量化直方图与所有类别的图像的分类模型进行相似度匹配，以确定所述第二图像的类别的步骤包括：根据巴氏系数算法，计算所述第二图像BOF量化直方图与各个类别的图像的BOF量化模型的相似度；将所述第二图像的类型判定为相似度最高的图像类型。5.一种训练图像分类模型的...

【专利技术属性】
技术研发人员：陈英南，商晓，胡玉鹏，
申请(专利权)人：郑州云海信息技术有限公司，
类型：发明
国别省市：河南,41

全部详细技术资料下载我是这个专利的主人