基于lp范数正则化的多任务学习图像分类方法及系统技术方案

技术编号:19178690 阅读:25 留言:0更新日期:2018-10-17 00:37
本发明专利技术公开了一种基于lp范数正则化的多任务学习图像分类方法及系统,其中,方法包括:获取不同地区的同类图像,并对同类图像进行预处理,以获取多组数据中心图像;对多组数据中心图像分别通过纹理特征和边缘特征进行描述或定义,以获取图像特征矩阵和类别标签矩阵;选择基于支持向量机的多任务学习算法设计分类器,并选择lp范数进行正则化,并且设计目标函数;以及优化分类算法的目标函数,以确定输入图像的最终类别。该方法可以采用lp范数进行正则化,从而可以提高分类过程的效率和效果,并能使优化过程让过程更简单,有效的降低模型的计算复杂度,提高分类准确率和可靠性。

Multi task learning image classification method and system based on LP norm regularization

The invention discloses a multi-task learning image classification method and system based on LP norm regularization, wherein the method comprises: acquiring the same image in different areas, and preprocessing the same image to obtain multiple sets of data center images; and performing the multi-group data center images through texture features and edge features respectively. Describing or defining to obtain image feature matrix and category label matrix; selecting support vector machine-based multi-task learning algorithm to design classifier, selecting LP norm to regularize, and designing the objective function; and optimizing the objective function of classification algorithm to determine the final category of the input image. This method can use LP norm to regularize, which can improve the efficiency and effectiveness of the classification process, and make the optimization process simpler, effectively reduce the computational complexity of the model, improve the classification accuracy and reliability.

【技术实现步骤摘要】
基于lp范数正则化的多任务学习图像分类方法及系统
本专利技术涉及图像识别处理
,特别涉及一种基于lp范数正则化的多任务学习图像分类方法及系统。
技术介绍
机器学习作为人工智能领域的核心研究课题之一,近年来取得了快速发展。多任务学习是一种机器学习方法,由归纳偏置问题发展而来,是利用任务间共享有用信息,同时对多个任务作并行学习的一种方法。结合正则化方法、随机过程、支持向量机和深度学习等技术来进行多任务学习建模的方法已广泛应用于语音处理、疾病预测、图像处理、数据挖掘等领域。图像是人类获取外界信息非常重要知识来源,在人类接收的外界信息中,有70%以上来自图像,因此在计算机视觉、遥感、生物、医学等学科中,图像分类是研究的重点之一。但是在实际的图像分类的应用中经常会遇到这种情况,样本的规模和维数很大,但是训练样本数目很少,传统的图像分类方法的精度都不高。此时,应用机器学习中的多任务学习方法可以有效解决这个问题。多任务学习的特点是同时学习现实世界的多个相关任务,并利用它们之间的关联关系来提高系统的整体学习性能。多任务学习系统的分类性能优于单任务学习系统,因为多任务学习过程中考虑了多个任务的关联关系,在同时训练多个任务时,模型利用任务间的共享信息增强系统的归纳偏置能力。从多任务学习角度考虑,同时选择训练样本的一些共有特征去表示测试样本比单独的一个特征或样本更能提高分类准确率。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种基于lp范数正则化的多任务学习图像分类方法,该方法可以提高多任务学习图像分类速度和准确率且模型简单易优化。本专利技术的另一个目的在于提出一种基于lp范数正则化的多任务学习图像分类系统。为达到上述目的,本专利技术一方面实施例提出了一种基于lp范数正则化的多任务学习图像分类方法,包括:获取不同地区的同类图像,并对所述同类图像进行预处理,以获取多组数据中心图像;对所述多组数据中心图像分别通过纹理特征和边缘特征进行描述或定义,以获取图像特征矩阵和类别标签矩阵;选择基于支持向量机的多任务学习算法设计分类器,并选择lp范数进行正则化,并且设计目标函数;以及优化分类算法的目标函数,以确定输入图像的最终类别。本专利技术实施例的基于lp范数正则化的多任务学习图像分类方法,在对获取的不同地区的同类图像进行预处理得到多组数据中心图像,通过纹理特征和边缘特征定义得到图像特征矩阵和类别标签矩阵,选择基于支持向量机的多任务学习算法设计分类器和lp范数进行正则化,从而提高分类的效率和精度,且过程简单易于优化,随后通过对分类算法的目标函数进行优化得到输入图像的最终类别,具有分类效率高、精度高,降低模型计算复杂度,且易于优化的优点。另外,根据本专利技术上述实施例的基于lp范数正则化的多任务学习图像分类方法还可以具有以下附加的技术特征:进一步地,在本专利技术的一个实施例中,所述对所述多组数据中心图像分别通过纹理特征和边缘特征进行描述或定义,以获取图像特征矩阵和类别标签矩阵,进一步包括:利用灰度共生矩阵提取所述纹理特征,其中,所述灰度共生矩阵提供图像的灰度方向、间隔和变化幅度的统计信息;通过所述边缘特征描述并利用Canny算子提取所述边缘特征;将图像特征表示为xi=[x1,x2,...,xn]∈Rd×n,i=1,2,...,t,t为监督学习任务个数,n为输入样本数据的个数,d为样本特征向量的维数;将图像标签集表示为yi=[y1,y2,...,yn]∈Rn,i=1,2,...,t,其中yi∈{+1,-1}为第i个任务中每个样本的类别标签;设置t个监督学习任务的权重系数矩阵为wi=[w1,w2,...,wt]∈Rd×n。进一步地,在本专利技术的一个实施例中,所述选择基于支持向量机的多任务学习算法设计分类器,进一步包括:确定支持向量机分类决策函数为:ai≥0为拉格朗日乘子;核函数采用高斯核函数σ为函数的宽度参数。进一步地,在本专利技术的一个实施例中,所述选择lp范数进行正则化,进一步包括:添加正则化项后的多任务学习支持向量机模型的目标函数为:采用0-1损失函数,λΩ(W)为正则化项;类比l0范数、l1范数和lp范数,所述l1范数为所述l0范数为||x||0=#(i)withxi≠0,所述lp范数为并且,所述设计目标函数,进一步包括:模型中有n个任务,第k个任务样本为m,目标函数为γ为正则化参数,u=(uk:k)∈Rnd,J(u)是参数向量u的齐二次方程且J(u)=u'Eu;当时,函数其中n个任务之间独立学习。进一步地,在本专利技术的一个实施例中,所述确定输入图像的最终类别,进一步包括:所述lp范数计算公式为:其中,x={x1,x2,…,xn}为一个向量,p>0;加入所述lp范数的正则项的多任务学习支持向量机目标函数公式为:利用子梯度法对所述目标函数进行求解,即:wt+1=wt+ηtF'(wt)其中,其中wt是第t次迭代的结果,ηt为步长,通常取表示函数F(w)在w处的子梯度;利用随机梯度下降法:优化分类算法,沿着所述目标函数J(u)参数θ∈R的梯度相反方向不断更新模型参数,直至到达所述目标函数的极小值点,更新步长为η。为达到上述目的,本专利技术另一方面实施例提出了一种基于lp范数正则化的多任务学习图像分类系统,包括:处理模块,用于获取不同地区的同类图像,并对所述同类图像进行预处理,以获取多组数据中心图像;获取模块,用于对所述多组数据中心图像分别通过纹理特征和边缘特征进行描述或定义,以获取图像特征矩阵和类别标签矩阵;正则化模块,用于选择基于支持向量机的多任务学习算法设计分类器,并选择lp范数进行正则化,并且设计目标函数;以及分类模块,用于优化分类算法的目标函数,以确定输入图像的最终类别。本专利技术实施例的基于lp范数正则化的多任务学习图像分类系统,在对获取的不同地区的同类图像进行预处理得到多组数据中心图像,通过纹理特征和边缘特征定义得到图像特征矩阵和类别标签矩阵,选择基于支持向量机的多任务学习算法设计分类器和lp范数进行正则化,从而提高分类的效率和精度,且过程简单易于优化,随后通过对分类算法的目标函数进行优化得到输入图像的最终类别,具有分类效率高、精度高,降低模型计算复杂度,且易于优化的优点。另外,根据本专利技术上述实施例的基于lp范数正则化的多任务学习图像分类系统还可以具有以下附加的技术特征:进一步地,在本专利技术的一个实施例中,所述获取模块进一步包括:第一提取单元,用于利用灰度共生矩阵提取所述纹理特征,其中,所述灰度共生矩阵提供图像的灰度方向、间隔和变化幅度的统计信息;第二提取单元,用于通过所述边缘特征描述并利用Canny算子提取所述边缘特征;第一表示单元,用于将图像特征表示为xi=[x1,x2,...,xn]∈Rd×n,i=1,2,...,t,t为监督学习任务个数,n为输入样本数据的个数,d为样本特征向量的维数;第二表示单元,用于将图像标签集表示为yi=[y1,y2,...,yn]∈Rn,i=1,2,...,t,其中yi∈{+1,-1}为第i个任务中每个样本的类别标签;设置单元,用于设置t个监督学习任务的权重系数矩阵为wi=[w1,w2,...,wt]∈Rd×n。进一步地,在本专利技术的一个实施例中,所述正则化模块进一步本文档来自技高网...

【技术保护点】
1.一种基于lp范数正则化的多任务学习图像分类方法,其特征在于,包括以下步骤:获取不同地区的同类图像,并对所述同类图像进行预处理,以获取多组数据中心图像;对所述多组数据中心图像分别通过纹理特征和边缘特征进行描述或定义,以获取图像特征矩阵和类别标签矩阵;选择基于支持向量机的多任务学习算法设计分类器,并选择lp范数进行正则化,并且设计目标函数;以及优化分类算法的目标函数,以确定输入图像的最终类别。

【技术特征摘要】
1.一种基于lp范数正则化的多任务学习图像分类方法,其特征在于,包括以下步骤:获取不同地区的同类图像,并对所述同类图像进行预处理,以获取多组数据中心图像;对所述多组数据中心图像分别通过纹理特征和边缘特征进行描述或定义,以获取图像特征矩阵和类别标签矩阵;选择基于支持向量机的多任务学习算法设计分类器,并选择lp范数进行正则化,并且设计目标函数;以及优化分类算法的目标函数,以确定输入图像的最终类别。2.根据权利要求1所述的基于lp范数正则化的多任务学习图像分类方法,其特征在于,所述对所述多组数据中心图像分别通过纹理特征和边缘特征进行描述或定义,以获取图像特征矩阵和类别标签矩阵,进一步包括:利用灰度共生矩阵提取所述纹理特征,其中,所述灰度共生矩阵提供图像的灰度方向、间隔和变化幅度的统计信息;通过所述边缘特征描述并利用Canny算子提取所述边缘特征;将图像特征表示为xi=[x1,x2,...,xn]∈Rd×n,i=1,2,...,t,t为监督学习任务个数,n为输入样本数据的个数,d为样本特征向量的维数;将图像标签集表示为yi=[y1,y2,...,yn]∈Rn,i=1,2,...,t,其中yi∈{+1,-1}为第i个任务中每个样本的类别标签;设置t个监督学习任务的权重系数矩阵为wi=[w1,w2,...,wt]∈Rd×n。3.根据权利要求2所述的基于lp范数正则化的多任务学习图像分类方法,其特征在于,所述选择基于支持向量机的多任务学习算法设计分类器,进一步包括:确定支持向量机分类决策函数为:ai≥0为拉格朗日乘子;核函数采用高斯核函数σ为函数的宽度参数。4.根据权利要求3所述的基于lp范数正则化的多任务学习图像分类方法,其特征在于,所述选择lp范数进行正则化,进一步包括:添加正则化项后的多任务学习支持向量机模型的目标函数为:采用0-1损失函数,λΩ(W)为正则化项;类比l0范数、l1范数和lp范数,所述l1范数为所述l0范数为||x||0=#(i)withxi≠0,所述lp范数为并且,所述设计目标函数,进一步包括:模型中有n个任务,第k个任务样本为m,目标函数为γ为正则化参数,u=(uk:k)∈Rnd,J(u)是参数向量u的齐二次方程且J(u)=u'Eu;当时,函数其中n个任务之间是独立学习。5.根据权利要求4所述的基于lp范数正则化的多任务学习图像分类方法,其特征在于,所述确定输入图像的最终类别,进一步包括:所述lp范数计算公式为:其中,x={x1,x2,…,xn}为一个向量,p>0;加入所述lp范数的正则项的多任务学习支持向量机目标函数公式为:利用子梯度法对所述目标函数进行求解,即:wt+1=wt+ηtF'(wt)其中,其中wt是第t次迭代的结果,ηt为步长,通常取表示函数F(w)在w处的子梯度;利用随机梯度下降法:优化分类算法,沿着所述目标函数J(u)参数θ∈R的梯度相反方向不断更新模型参数,直至到达所述目标函数的极小...

【专利技术属性】
技术研发人员:王瑜周文张娜
申请(专利权)人:北京工商大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1