图像分类方法、装置及计算机可读存储介质制造方法及图纸

技术编号:21799974 阅读:16 留言:0更新日期:2019-08-07 10:43
本发明专利技术涉及人工智能技术领域,公开了一种图像分类方法,该方法采用特征点提取算法提取图像样本中的显著特征点,将各个图像样本对应的显著特征点保存为图像标注。之后,构建卷积神经网络模型,将所有图像样本和上述得到的图像标注分为测试集和训练集,利用所述训练集训练所述构建的卷积神经网络模型,并利用所述测试集对所述卷积神经网络模型进行测试。然后,该方法将待分类的图像输入到训练好的卷积神经网络模型中,提取所述待分类的图像的显著特征点,并根据所述显著特征点进行图像分类。本发明专利技术还提出一种图像分类装置以及一种计算机可读存储介质。本发明专利技术可以训练卷积神经网络模型学习尺度不变特征变换算法提取图像特征点,以实现图像的分类。

Image Classification Method, Device and Computer Readable Storage Media

【技术实现步骤摘要】
图像分类方法、装置及计算机可读存储介质
本专利技术涉及人工智能
,尤其涉及一种图像分类方法、装置及计算机可读存储介质。
技术介绍
近几年来,随着卷积神经网络在图像处理领域的逐渐成熟,如何得到准确可靠的训练模型成为人们研究的热点。目前卷积神经网络的错误率从AlexNet的16.4%到现在广为使用的ResNet的3.6%,理论上错误率已经低于人眼错误率的5.1%。但是,在实际场景应用中,由于环境的复杂度增加,图像更容易受到光照,角度,像素等的影响,错误率会比理论上大大增加。经典ResNet采用残差网络具备更少的参数,并为图像处理带来了更高的准确率和50层的卷积模型。然而进行模型训练时,目前的卷积神经网络仅考虑自身的分类损失,同时在图像特征提取过程中更容易受到视角变化、噪声的不良影响。因此,为了优化分类效果,需要CNN网络能够学习到更好的特征,然后用于分类。
技术实现思路
本专利技术提供一种图像分类方法、装置及计算机可读存储介质,其主要目的在于提供一种优选的图像分类方案。为实现上述目的,本专利技术提供的一种图像分类方法,包括:输入预设数量的图像样本,采用预设类型特征点提取算法分别提取各个所述图像样本中的显著特征点,并分别将各个所述图像样本对应的显著特征点保存为对应的图像样本的图像标注;构建卷积神经网络模型,将所有所述图像样本和上述得到的图像样本的图像标注分为测试集图像和训练集图像,利用所述训练集图像训练所述卷积神经网络模型,并利用所述测试集图像对所述卷积神经网络模型进行测试;将待分类的图像输入到训练好的卷积神经网络模型中,提取所述待分类的图像的显著特征点,并根据所述显著特征点进行图像分类。可选地,所述采用预设类型特征点提取算法分别提取各个所述图像样本中的显著特征点,并分别将各个所述图像样本对应的显著特征点保存为对应的图像样本的图像标注,包括:逐一选择所述图像样本或者批量选择所述图像样本,在一个图像样本被选择后,针对该图像样本执行如下步骤:利用该图像样本制作高斯金字塔:将该图像样本进行下采样得到N个不同尺寸的图像,再对每张图像使用k组不同大小的高斯核进行高斯模糊,得到N*K个不同尺寸和模糊程度的图像,其中,N和K均为正整数;将高斯金字塔转化为差分金字塔:在高斯金字塔中,每层的K张照片按照顺序两两相减,得到差分图像,最后得到N*(K-1)张差分图像,组成所述差分金字塔;对所述差分金字塔进行多尺度空间极值点检测,得到该图像样本的候选特征点;对得到的该图像样本的候选特征点进行定位,并去掉候选特征点中的低对比度的特征点和不稳定的边缘特征点,得到该图像样本的显著特征点;计算所述显著特征点的主方向,及构造所述显著特征点的描述子,并根据所述显著特征点的描述子,将所述显著特征点保存为该图像样本的图像标注。可选地,所述对得到的该图像样本的候选特征点进行定位,并去掉其中的低对比度的特征点和不稳定的边缘特征点,得到该图像样本的显著特征点,包括:将该图像样本I(x,y)的尺度空间定义为:L(x,y,σ)=G(x,y,σ)*I(x,y),其中L(x,y,σ)代表着该图像样本的尺度空间,σ为像素的尺度参数,当σ连续变化,G(x,y,σ)构成可变尺度空间的2维高斯函数;对尺度空间G(x,y,σ)进行二次泰勒展开:并进行求导,令D(x)=0,得到该图像样本的候选特征点的位置:将所述候选特征点带入到所述D(x)函数中,利用二次泰勒展开式进行最小二乘拟合,得到如果预设阈值,则保留该候选特征点,否则将该候选特征点作为低对比度特征点丢弃;将候选特征点的D(x)函数的主曲率与2×2H的特征值成正比:H为候选特征点邻域对应位置的差分矩阵,其中,Dxx,Dxy,Dyx,Dyy是候选特征点邻域对应位置的差分求得;设α=λmax为H的最大特征值,β=λmin为H的最小特征值,则:Th(H)=Dxx+Dyy=α+β,Det(H)=Dxx+Dyy-Dxy2=α·β,其中,Th(H)为矩阵H的迹,Det(H)为矩阵H的行列式;设表示最大特征值和最小特征值的比值,则当时,剔除该候选特征点,否则保留该候选特征点,其中,Tγ为预设阈值。可选地,所述构造所述显著特征点的描述子的步骤包括:旋转所述显著特征点的坐标,使坐标轴旋转为所述显著特征点的主方向上,确保旋转不变性;在旋转后的图像上,以所述显著特征点为中心取8*8大小的窗口,设所述显著特征点位于该窗口的中央位置,所述显著特征点周围的方格代表所述显著特征点的邻域范围,每个小方格代表一个像素,在每个像素上计算梯度,箭头的方向和长度分别表示像素的方向和模值;将所述窗口平均分为4*4的子窗口,再利用高斯模糊方法增加与所述显著特征点邻近域的权重值、降低所述显著特征点较远的权重值,最后计算每个区域的0°、45°、90°、135°、180°、225°、270°、315°方向的梯度累加值,以得到所述显著特征点的描述子的特征向量。可选地,所述显著特征点的主方向为:θ(x,y)=αtan2((L(x+1,y)-L(x-1,y))/(L(x,y+1)-L(x,y-1)))其中,L为每个特征点所在的尺度,α=λmax为H的最大特征值,H为候选特征点邻域对应位置的差分矩阵。此外,为实现上述目的,本专利技术还提供一种图像分类装置,该装置包括存储器和处理器,所述存储器中存储有可在所述处理器上运行的图像分类程序,所述图像分类程序被所述处理器执行时实现如下步骤:输入预设数量的图像样本,采用预设类型特征点提取算法分别提取各个所述图像样本中的显著特征点,并分别将各个所述图像样本对应的显著特征点保存为对应的图像样本的图像标注;构建卷积神经网络模型,将所有所述图像样本和上述得到的图像样本的图像标注分为测试集图像和训练集图像,利用所述训练集图像训练所述构建的卷积神经网络模型,并利用所述测试集图像对所述卷积神经网络模型进行测试;将待分类的图像输入到训练好的卷积神经网络模型中,提取所述待分类的图像的显著特征点,并根据所述显著特征点进行图像分类。可选地,所述采用尺度不变特征变换算法提取所述图像样本中的特征点,并将所述特征点保存为图像标注,包括:逐一选择所述图像样本或者批量选择所述图像样本,在一个图像样本被选择后,针对该图像样本执行如下步骤:利用该图像样本制作高斯金字塔:将该图像样本进行下采样得到N个不同尺寸的图像,再对每张图像使用k组不同大小的高斯核进行高斯模糊,得到N*K个不同尺寸和模糊程度的图像,其中,N和K均为正整数;将高斯金字塔转化为差分金字塔:在高斯金字塔中,每层的K张照片按照顺序两两相减,得到差分图像,最后得到N*(K-1)张差分图像,组成所述差分金字塔;对所述差分金字塔进行多尺度空间极值点检测,得到该图像样本的候选特征点;对得到的该图像样本的候选特征点进行定位,并去掉所述候选特征点中的低对比度的特征点和不稳定的边缘特征点,得到该图像样本的显著特征点;计算所述显著特征点的主方向,及构造所述显著特征点的描述子,并根据所述显著特征点的描述子,将所述显著特征点保存为该图像样本的图像标注。可选地,所述对得到的该图像样本的候选特征点进行定位,并去掉其中的低对比度的特征点和不稳定的边缘特征点,得到该图像样本的显著特征点,包括:将该图像样本I(x,y)的尺度空间定义为:L本文档来自技高网...

【技术保护点】
1.一种图像分类方法,其特征在于,所述方法包括:输入预设数量的图像样本,采用预设类型特征点提取算法分别提取各个所述图像样本中的显著特征点,并分别将各个所述图像样本对应的显著特征点保存为对应的图像样本的图像标注;构建卷积神经网络模型,将所有所述图像样本和上述得到的图像样本的图像标注分为测试集图像和训练集图像,利用所述训练集图像训练所述卷积神经网络模型,并利用所述测试集图像对所述卷积神经网络模型进行测试;将待分类的图像输入到训练好的卷积神经网络模型中,提取所述待分类的图像的显著特征点,并根据所述显著特征点进行图像分类。

【技术特征摘要】
1.一种图像分类方法,其特征在于,所述方法包括:输入预设数量的图像样本,采用预设类型特征点提取算法分别提取各个所述图像样本中的显著特征点,并分别将各个所述图像样本对应的显著特征点保存为对应的图像样本的图像标注;构建卷积神经网络模型,将所有所述图像样本和上述得到的图像样本的图像标注分为测试集图像和训练集图像,利用所述训练集图像训练所述卷积神经网络模型,并利用所述测试集图像对所述卷积神经网络模型进行测试;将待分类的图像输入到训练好的卷积神经网络模型中,提取所述待分类的图像的显著特征点,并根据所述显著特征点进行图像分类。2.如权利要求1所述的图像分类方法,其特征在于,所述采用预设类型特征点提取算法分别提取各个所述图像样本中的显著特征点,并分别将各个所述图像样本对应的显著特征点保存为对应的图像样本的图像标注,包括:逐一选择所述图像样本或者批量选择所述图像样本,在一个图像样本被选择后,针对该图像样本执行如下步骤:利用该图像样本制作高斯金字塔:将该图像样本进行下采样得到N个不同尺寸的图像,再对每张图像使用k组不同大小的高斯核进行高斯模糊,得到N*K个不同尺寸和模糊程度的图像,其中,N和K均为正整数;将高斯金字塔转化为差分金字塔:在高斯金字塔中,每层的K张照片按照顺序两两相减,得到差分图像,最后得到N*(K-1)张差分图像,组成所述差分金字塔;对所述差分金字塔进行多尺度空间极值点检测,得到该图像样本的候选特征点;对得到的该图像样本的候选特征点进行定位,并去其中的低对比度的候选特征点和不稳定的边缘候选特征点,得到该图像样本的显著特征点;计算所述显著特征点的主方向,及构造所述显著特征点的描述子,并根据所述显著特征点的描述子,将所述显著特征点保存为该图像样本的图像标注。3.如权利要求2所述的图像分类方法,其特征在于,所述对得到的该图像样本的候选特征点进行定位,并去掉其中的低对比度的候选特征点和不稳定的边缘候选特征点,得到该图像样本的显著特征点,包括:将该图像样本I(x,y)的尺度空间定义为:L(x,y,σ)=G(x,y,σ)*I(x,y),其中L(x,y,σ)代表该图像样本的尺度空间,σ为像素的尺度参数,当σ连续变化,G(x,y,σ)构成可变尺度空间的2维高斯函数;对尺度空间G(x,y,σ)进行二次泰勒展开:并进行求导,令D(x)=0,得到该图像样本的候选特征点的位置:将所述候选特征点带入到所述D(x)函数中,利用二次泰勒展开式进行最小二乘拟合,得到如果预设阈值,则保留该候选特征点,否则将该候选特征点作为低对比度的候选特征点丢弃;将候选特征点的D(x)函数的主曲率与2×2H的特征值成正比:H为候选特征点邻域对应位置的差分矩阵,其中,Dxx,Dxy,Dyx,Dyy是候选特征点邻域对应位置的差分求得;设α=λmax为H的最大特征值,β=λmin为H的最小特征值,则:Th(H)=Dxx+Dyy=α+β,Det(H)=Dxx+Dyy-Dxy2=α·β,其中,Th(H)为矩阵H的迹,Det(H)为矩阵H的行列式;设表示最大特征值和最小特征值的比值,则当时,剔除该候选特征点,否则保留该候选特征点,其中,Tγ为预设阈值。4.如权利要求3所述的图像分类方法,其特征在于,所述构造所述显著特征点的描述子的步骤包括:旋转所述显著特征点的坐标,使坐标轴旋转为所述显著特征点的主方向上,确保旋转不变性;在旋转后的图像上,以所述显著特征点为中心取8*8大小的窗口,设所述显著特征点位于该窗口的中央位置,所述显著特征点周围的方格代表所述显著特征点的邻域范围,每个小方格代表一个像素,在每个像素上计算梯度,箭头的方向和长度分别表示像素的方向和模值;将所述窗口平均分为4*4的子窗口,再利用高斯模糊方法增加与所述显著特征点邻近域的权重值、降低所述显著特征点较远的权重值,最后计算每个区域的0°、45°、90°、135°、180°、225°、270°、315°方向的梯度累加值,以得到所述显著特征点的描述子的特征向量。5.如权利要求2至4中任意一项所述的图像分类方法,其特征在于,所述显著特征点的主方向为:θ(x,y)=αtan2((L(x+1,y)-L(x-1,y))/(L(x,y+1)-L(x,y-1)))其中,L为每个显著特征点所在的尺度,α=λmax为H的最大特征值,H为显著特征点邻域对应位置的差分矩阵...

【专利技术属性】
技术研发人员:庞烨王义文王健宗
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1