一种训练图像分类模型的方法和装置制造方法及图纸

技术编号:20589715 阅读:23 留言:0更新日期:2019-03-16 07:25
本申请公开了训练图像分类模型的方法和装置。该方法包括:步骤一、提取图像的特征;步骤二、采用聚类算法对图像的特征进行聚类,以生成所有类别的图像的视觉码书;步骤三、提取其中的第一类别的图像的特征;步骤四、根据欧氏距离最近邻原则,采用视觉码书对第一类别的图像的特征进行特征包模型BOF量化,以计算出第一类别的图像的各个特征在视觉码书中分别出现的频率;步骤五、根据第一类别图像的各个特征分别出现的频率,生成作为第一类别的图像的分类模型的图像的BOF量化直方图;对所有类别的图像依次执行步骤三、步骤四和步骤五,以生成所有类别的图像的BOF量化直方图。上述方案训练出的图像分类模型提高用户查找图像中的内容的效率。

【技术实现步骤摘要】
一种训练图像分类模型的方法和装置
本专利技术涉及图像识别领域,尤指一种训练图像分类模型的方法和装置。
技术介绍
移动互联网、智能手机以及社交网络的发展带来了海量图片信息,有文章显示,Instagram每天图片上传量约为6000万张;WhatsApp每天的图片发送量为5亿张;国内的微信朋友圈也是以图片分享为驱动。不受地域和语言限制的图片逐渐取代了繁琐而微妙的文字,成为了传词达意的主要媒介。图片成为互联网信息交流主要媒介的原因主要在于两点:第一,从用户读取信息的习惯来看,相比于文字,图片能够为用户提供更加生动、容易理解、有趣及更具艺术感的信息;第二,从图片来源来看,智能手机为用户带来方便的拍摄和截屏手段,帮助用户更快的用图片来采集和记录信息。但伴随着图像成为互联网中的主要信息载体,难题随之出现。当用户需要查找图像的时候,往往需要翻阅每一张的图像,直到找到合适的图像为止。从上述描述中可以看出,目前缺少一种有效的图像分类模型,可以为图像进行有效的分类,因此用户查找图像中的内容的效率低下。
技术实现思路
为了解决上述技术问题,本申请提供了一种训练图像分类模型的方法和装置,其能够训练出高效的图像分类模型,所训练出的图像分类模型能够提高用户查找图像中的内容的效率。为了达到本专利技术目的,本申请提供了一种训练图像分类模型的方法,该方法包括下列步骤:步骤一、提取所输入的所有类别的图像的特征;步骤二、采用聚类算法对所提取的图像的特征进行聚类,以生成所有类别的图像的视觉码书;其中,视觉码书包括多个视觉码字,每个视觉码字代表相似特征的聚类中心,一个视觉码字作为图像的一个特征类别;步骤三、提取所输入的所有类别的图像之中的第一类别的图像的特征;步骤四、根据欧氏距离最近邻原则,采用视觉码书对所提取的第一类别的图像的特征进行特征包模型BOF量化,以计算出第一类别的图像的各个特征在视觉码书中分别出现的频率;步骤五、根据第一类别的图像的各个特征在视觉码书中分别出现的频率,生成第一类别的图像的BOF量化直方图,作为第一类别的图像的分类模型;对所有类别的图像依次执行步骤三、步骤四以及步骤五,直到生成所有类别的图像的BOF量化直方图为止。进一步地,在一个可选的实施例中,在生成所有类别的图像的BOF量化直方图的步骤之后,该方法还包括:当接收到第二图像时,提取第二图像的特征;根据欧氏距离最近邻原则采用视觉码书对第二图像的特征进行BOF量化,以计算出第二图像的各个特征在视觉码书中分别出现的频率,作为第二图像的BOF量化直方图;将第二图像的BOF量化直方图与所有类别的图像的分类模型进行相似度匹配,以确定第二图像的类别。进一步地,在一个可选的实施例中,步骤四包括:计算第一类别的图像的每个特征与视觉码书中的每个视觉码字的欧式距离;比较各个特征之中的每个特征分别与视觉码书中的各个视觉码字之间的欧式距离,依据欧式距离最近邻原则选取与各个特征之中的第一特征距离最小的视觉码字作为第一特征的特征类别匹配;统计各个视觉码字匹配的图像特征的数量,并且将在视觉码书中的直方图统计频率高于设定阈值的视觉码字所匹配的特征认作第一类别的图像的特征;根据第一类别的图像的特征,生成第一类别的图像的BOF量化直方图。进一步地,在一个可选的实施例中,将第二图像的BOF量化直方图与所有类别的图像的分类模型进行相似度匹配,以确定第二图像的类别的步骤包括:根据巴氏系数算法,计算第二图像BOF量化直方图与各个类别的图像的BOF量化模型的相似度;将第二图像的类型判定为相似度最高的图像类型。为了达到本申请的目的,本专利技术实施例提供了一种训练图像分类模型的装置,该装置包括视觉码书生成模块以及分类模型训练模块;其中,视觉码书生成模块用于执行下列步骤:步骤一、提取所输入的所有类别的图像的特征;步骤二、采用聚类算法对所提取的图像的特征进行聚类,以生成所有类别的图像的视觉码书;其中,视觉码书包括多个视觉码字,每个视觉码字代表相似特征的聚类中心,一个视觉码字作为图像的一个特征类别;分类模型训练模块用于执行下列步骤:步骤三、提取所输入的所有类别的图像之中的第一类别的图像的特征;步骤四、根据欧氏距离最近邻原则,采用视觉码书对所提取的第一类别的图像的特征进行特征包模型BOF量化,以计算出第一类别的图像的各个特征在视觉码书中分别出现的频率;步骤五、根据第一类别的图像的各个特征在视觉码书中分别出现的频率,生成第一类别的图像的BOF量化直方图,作为第一类别的图像的分类模型;对所有类别的图像依次执行步骤三、步骤四以及步骤五,直到生成所有类别的图像的BOF量化直方图为止。进一步地,在一个可选的实施例中,该装置还包括图像分类模块;图像分类模块用于:在分类模型训练模块生成所有类别的图像的BOF量化直方图之后,当接收到第二图像时,提取第二图像的特征;根据欧氏距离最近邻原则采用视觉码书对第二图像的特征进行BOF量化,以计算出第二图像的各个特征在视觉码书中分别出现的频率,作为第二图像的BOF量化直方图;将第二图像的BOF量化直方图与所有类别的图像的分类模型进行相似度匹配,以确定第二图像的类别。进一步地,在一个可选的实施例中,分类模型训练模块用于:计算第一类别的图像的每个特征与视觉码书中的每个视觉码字的欧式距离;比较各个特征之中的每个特征分别与视觉码书中的各个视觉码字之间的欧式距离,依据欧式距离最近邻原则选取与各个特征之中的第一特征距离最小的视觉码字作为第一特征的特征类别匹配;统计各个视觉码字匹配的图像特征的数量,并且将在视觉码书中的直方图统计频率高于设定阈值的视觉码字所匹配的特征认作第一类别的图像的特征;根据第一类别的图像的特征,生成第一类别的图像的BOF量化直方图。进一步地,在一个可选的实施例中,图像分类模块用于:根据巴氏系数算法,计算第二图像BOF量化直方图与各个类别的图像的BOF量化模型的相似度;将第二图像的类型判定为相似度最高的图像类型。本专利技术实施例的有益效果在于:上述方案中,采用聚类算法对所提取的图像的特征进行聚类,以生成所述所有类别的图像的视觉码书;根据欧氏距离最近邻原则,采用所述视觉码书对所提取的第一类别的图像的特征进行特征包模型BOF量化,以计算出所述第一类别的图像的各个特征在所述视觉码书中分别出现的频率,根据所述第一类别的图像的各个特征在所述视觉码书中分别出现的频率,生成一种类别的图像的分类模型;重复上述步骤以生成所有类别的图像的分类模型;从而可以为用户提供高效的图像分类模型,上述图像分类模型可以根据图像中的内容而对图像进行分类,使得用户可以根据分类得到的图像的类别而仅仅查找一种或者几种类别的图像就能得到用户需要的图像,从而提高了用户查找图像中的内容的效率。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。附图说明附图用来提供对本专利技术技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本专利技术的技术方案,并不构成对本专利技术技术方案的限制。图1为本专利技术实施例提供的训练图像分类模型的方法的流程图;图2为本专利技术实施例提供的训练图像分类模型的装置的框图。具体实施方本文档来自技高网...

【技术保护点】
1.一种训练图像分类模型的方法,其特征在于,所述方法包括下列步骤:步骤一、提取所输入的所有类别的图像的特征;步骤二、采用聚类算法对所提取的图像的特征进行聚类,以生成所述所有类别的图像的视觉码书;其中,所述视觉码书包括多个视觉码字,每个视觉码字代表相似特征的聚类中心,一个视觉码字作为图像的一个特征类别;步骤三、提取所输入的所有类别的图像之中的第一类别的图像的特征;步骤四、根据欧氏距离最近邻原则,采用所述视觉码书对所提取的第一类别的图像的特征进行特征包模型BOF量化,以计算出所述第一类别的图像的各个特征在所述视觉码书中分别出现的频率;步骤五、根据所述第一类别的图像的各个特征在所述视觉码书中分别出现的频率,生成所述第一类别的图像的BOF量化直方图,作为所述第一类别的图像的分类模型;对所述所有类别的图像依次执行步骤三、步骤四以及步骤五,直到生成所述所有类别的图像的BOF量化直方图为止。

【技术特征摘要】
1.一种训练图像分类模型的方法,其特征在于,所述方法包括下列步骤:步骤一、提取所输入的所有类别的图像的特征;步骤二、采用聚类算法对所提取的图像的特征进行聚类,以生成所述所有类别的图像的视觉码书;其中,所述视觉码书包括多个视觉码字,每个视觉码字代表相似特征的聚类中心,一个视觉码字作为图像的一个特征类别;步骤三、提取所输入的所有类别的图像之中的第一类别的图像的特征;步骤四、根据欧氏距离最近邻原则,采用所述视觉码书对所提取的第一类别的图像的特征进行特征包模型BOF量化,以计算出所述第一类别的图像的各个特征在所述视觉码书中分别出现的频率;步骤五、根据所述第一类别的图像的各个特征在所述视觉码书中分别出现的频率,生成所述第一类别的图像的BOF量化直方图,作为所述第一类别的图像的分类模型;对所述所有类别的图像依次执行步骤三、步骤四以及步骤五,直到生成所述所有类别的图像的BOF量化直方图为止。2.根据权利要求1所述的方法,其特征在于,在所述生成所述所有类别的图像的BOF量化直方图的步骤之后,所述方法还包括:当接收到第二图像时,提取所述第二图像的特征;根据欧氏距离最近邻原则采用所述视觉码书对所述第二图像的特征进行BOF量化,以计算出所述第二图像的各个特征在所述视觉码书中分别出现的频率,作为所述第二图像的BOF量化直方图;将所述第二图像的BOF量化直方图与所有类别的图像的分类模型进行相似度匹配,以确定所述第二图像的类别。3.根据权利要求1所述的方法,其中,所述步骤四包括:计算第一类别的图像的每个特征与视觉码书中的每个视觉码字的欧式距离;比较各个特征之中的每个特征分别与视觉码书中的各个视觉码字之间的欧式距离,依据欧式距离最近邻原则选取与所述各个特征之中的第一特征距离最小的视觉码字作为所述第一特征的特征类别匹配;统计各个视觉码字匹配的图像特征的数量,并且将在视觉码书中的直方图统计频率高于设定阈值的视觉码字所匹配的特征认作第一类别的图像的特征;根据所述第一类别的图像的特征,生成所述第一类别的图像的BOF量化直方图。4.根据权利要求2所述的方法,其中,所述将所述第二图像的BOF量化直方图与所有类别的图像的分类模型进行相似度匹配,以确定所述第二图像的类别的步骤包括:根据巴氏系数算法,计算所述第二图像BOF量化直方图与各个类别的图像的BOF量化模型的相似度;将所述第二图像的类型判定为相似度最高的图像类型。5.一种训练图像分类模型的...

【专利技术属性】
技术研发人员:陈英南商晓胡玉鹏
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1