当前位置: 首页 > 专利查询>王树松专利>正文

对象分类方法、装置、设备及存储介质制造方法及图纸

技术编号:32633781 阅读:12 留言:0更新日期:2022-03-12 18:08
本公开涉及一种对象分类方法、装置、设备及存储介质。该方法包括:获取待分类对象;基于对象分类网络对待分类对象进行分类,得到待分类对象的分类结果,对象分类网络中的至少一个目标隐藏层的神经元基于抑制修正线性单元进行激活;抑制修正线性单元包括线性抑制函数和修正线性类函数,修正线性类函数使用线性抑制函数的输出作为输入;线性抑制函数由输入与对应的线性抑制系数相乘的乘积组成;修正线性类函数为正向修正线性函数或者负向修正线性函数;线性抑制系数为小于1的正数值,且目标神经元的线性抑制系数的值与目标神经元所属目标隐藏层其他神经元的对应线性抑制系数的值相同。由此,引入抑制修正线性单元的对象分类网络提高了分类准确性。络提高了分类准确性。络提高了分类准确性。

【技术实现步骤摘要】
对象分类方法、装置、设备及存储介质


[0001]本公开涉及计算机
,尤其涉及一种对象分类方法、装置、设备及存储介质。

技术介绍

[0002]随着计算机技术的不断发展,深度学习技术也被越来越广泛的应用到图像处理、图像识别、物体分类以及数据处理等领域。例如,通常使用人工神经网络(Artificial Neural Network,ANN)对图像、音频等进行分类。人工神经网络由大量的神经元相互连接构成。每个神经元的输出通过一种特定的输出函数进行处理,该特定的输出函数为激活函数。
[0003]现有技术中,激活函数的作用是强化人工神经网络的学习能力,以使人工神经网络适应多样化的数据处理场景。然而,对引入激活函数的人工神经网络进行训练时,人工神经网络的浅层神经元在参数训练过程中容易出现参数梯度消失现象,导致浅层网络难以充分训练;并且,人工神经网络由于层间流量干扰,导致参数训练出现内部协变量漂移问题,影响人工神经网络的参数学习效率和精度。因此,基于上述人工神经网络做对象分类时,分类准确性较差,不能满足用户的分类需求。

技术实现思路

[0004]为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种对象分类方法、装置、设备及存储介质。
[0005]第一方面,本公开提供了一种对象分类方法,该方法包括:
[0006]获取待分类对象;
[0007]基于对象分类网络对待分类对象进行分类,得到待分类对象的分类结果,对象分类网络中的至少一个目标隐藏层的神经元基于抑制修正线性单元进行激活;抑制修正线性单元包括线性抑制函数和修正线性类函数,修正线性类函数使用线性抑制函数的输出作为输入;线性抑制函数由输入与对应的线性抑制系数相乘的乘积组成;修正线性类函数为正向修正线性函数或者负向修正线性函数;在正向修正线性函数的输入值小于0时,正向修正线性函数的输出值为0,在正向修正线性函数的输入值大于或等于0时,正向修正线性函数的输出值与正向修正线性函数的输入值相等;在负向修正线性函数的输入值小于或等于0时,负向修正线性函数的输出值与负向修正线性函数的输入值相等,在负向修正线性函数的输入值大于0时,负向修正线性函数的输出值为0;线性抑制系数为小于1的正数值,且目标神经元的线性抑制系数的值与目标神经元所属目标隐藏层其他神经元的对应线性抑制系数的值相同。
[0008]第二方面,本公开提供了一种对象分类装置,该装置包括:
[0009]对象获取模块,用于获取待分类对象;
[0010]对象分类模块,用于基于对象分类网络对待分类对象进行分类,得到待分类对象的分类结果,对象分类网络中的至少一个目标隐藏层的神经元基于抑制修正线性单元进行
激活;抑制修正线性单元包括线性抑制函数和修正线性类函数,修正线性类函数使用线性抑制函数的输出作为输入;线性抑制函数由输入与对应的线性抑制系数相乘的乘积组成;修正线性类函数为正向修正线性函数或者负向修正线性函数;在正向修正线性函数的输入值小于0时,正向修正线性函数的输出值为0,在正向修正线性函数的输入值大于或等于0时,正向修正线性函数的输出值与正向修正线性函数的输入值相等;在负向修正线性函数的输入值小于或等于0时,负向修正线性函数的输出值与负向修正线性函数的输入值相等,在负向修正线性函数的输入值大于0时,负向修正线性函数的输出值为0;线性抑制系数为小于1的正数值,且目标神经元的线性抑制系数的值与目标神经元所属目标隐藏层其他神经元的对应线性抑制系数的值相同。
[0011]第三方面,本公开实施例还提供了一种对象分类设备,该设备包括:
[0012]一个或多个处理器;
[0013]存储装置,用于存储一个或多个程序,
[0014]当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现第一方面所提供的对象分类方法。
[0015]第四方面,本公开实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现第一方面所提供的对象分类方法。
[0016]本公开实施例提供的技术方案与现有技术相比具有如下优点:
[0017]本公开实施例的一种对象分类方法、装置、设备及存储介质,在获取到待分类对象后,能够基于对象分类网络对待分类对象进行分类,得到待分类对象的分类结果。由于对象分类网络基于由线性抑制函数和修正线性类函数组成的抑制修正线性单元进行激活,这样,抑制修正线性单元在正值输入区间(对于正向修正线性函数)或者负值输入区间(对于负向修正线性函数)的导数是常数,由于一个隐藏层同时存在大量满足正值输入区间或者负值输入区间的神经元,对于带权输入数据,其输出特征表达性不会减弱,抑制修正线性单元的方法一定程度上消除了传统非线性激活函数固有的导数值的分布存在饱和区的问题,可以解决训练人工神经网络过程中的浅层神经元的梯度消失的问题,进而缓解了梯度消失造成的对象分类网络的低层特征参数不能得到充分训练的问题,提高了对象分类网络训练精度。同时,由于线性抑制系数为小于1的正数值,使得对象分类网络的多个神经元对相同输入数据进行特征提取造成的特征传递流量和误差传递流量的放大效应进行抑制,从而减小了对象分类网络在参数训练调整期间各隐藏层的神经元的参数的调整导致的传递流量变化的逐层放大对目标神经元最终收到的特征流量和误差流量的影响,进而缓解了传统神经网络遇到的内部协变量漂移问题,保证了神经元参数学习梯度的准确性,提高了对象分类网络训练精度。综上,引入上述抑制修正线性单元的对象分类网络,可以提高训练过程中的训练精度,基于训练好的对象分类网络做对象分类时,可以提高分类准确性,满足用户的分类需求。
附图说明
[0018]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
[0019]为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现
有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0020]图1是现有技术的提供的一种人工神经网络的逻辑示意图;
[0021]图2是本公开实施例提供的一种对象分类方法的流程图;
[0022]图3是本公开实施例提供的一种对象分类网络的逻辑示意图;
[0023]图4是本公开实施例提供的一种对象分类网络的结构示意图;
[0024]图5是本公开实施例提供的一种对象分类装置的结构示意图;
[0025]图6是本公开实施例提供的一种对象分类设备的结构示意图。
具体实施方式
[0026]为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
[0027]在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对象分类方法,其特征在于,包括:获取待分类对象;基于对象分类网络对所述待分类对象进行分类,得到所述待分类对象的分类结果,所述对象分类网络中的至少一个目标隐藏层的神经元基于抑制修正线性单元进行激活;所述抑制修正线性单元包括线性抑制函数和修正线性类函数,所述修正线性类函数使用线性抑制函数的输出作为输入;所述线性抑制函数由输入与对应的线性抑制系数相乘的乘积组成;所述修正线性类函数为正向修正线性函数或者负向修正线性函数;在所述正向修正线性函数的输入值小于0时,所述正向修正线性函数的输出值为0,在所述正向修正线性函数的输入值大于或等于0时,所述正向修正线性函数的输出值与所述正向修正线性函数的输入值相等;在所述负向修正线性函数的输入值小于或等于0时,所述负向修正线性函数的输出值与所述负向修正线性函数的输入值相等,在所述负向修正线性函数的输入值大于0时,所述负向修正线性函数的输出值为0;所述线性抑制系数为小于1的正数值,且目标神经元的所述线性抑制系数的值与所述目标神经元所属目标隐藏层其他神经元的对应线性抑制系数的值相同。2.根据权利要求1所述的方法,其特征在于,所述线性抑制系数根据输入神经网络层的单特征映射的第一特征数据数量、所述目标神经元所属目标隐藏层的单特征映射的第二特征数据数量、归一化特征映射数量、所述目标神经元对于输入神经网络层特征映射的卷积核尺寸和层扩展参数确定,所述归一化特征映射数量包括所述目标神经元所属的目标隐藏层的第一特征映射数量或所述目标神经元的输入神经网络层的第二特征映射数量,所述层扩展参数为不小于1的值,且所述目标神经元的所述层扩展参数的值与所述目标神经元所属目标隐藏层的其他神经元层扩展参数的值相同。3.根据权利要求2所述的方法,其特征在于,所述线性抑制系数为多特征映射归一化参数、卷积归一化参数和层扩展参数的乘积;其中,所述多特征映射归一化参数为所述归一化特征映射数量的倒数;所述卷积归一化参数为所述卷积核尺寸和所述第二特征数据数量的乘积除以所述第一特征数据数量的商的倒数。4.根据权利要求2所述的方法,其特征在于,所述线性抑制系数还根据所述目标神经元的输入神经网络层数量确定;其中,所述线性抑制系数为多特征映射归一化参数、卷积归一化参数、多输入神经网络层归一化参数和层扩展参数的乘积;其中,多输入神经网络层归一化参数为所述输入神经网络层数量的倒...

【专利技术属性】
技术研发人员:王树松
申请(专利权)人:王树松
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1