【技术实现步骤摘要】
一种基于决策边界的深度学习模型压缩方法
[0001]本专利技术涉及一种基于决策边界的深度学习模型压缩方法,属于深度学习的模型压缩
技术介绍
[0002]深度学习模型是目前人工智能技术的核心算法,依靠大量标注数据,通过层次化建模,实现对复杂问题的非线性拟合。在目前的实践中,深度学习技术已经在图像识别、语音处理等领域取得了巨大的成功,并不断影响着其他行业。
[0003]为了处理复杂的数据,当前的深度学习模型往往具有亿万级别的参数,除了在训练阶段耗费大量的时间与计算资源,在模型的部署与推断过程中,也要占用大量的储存资源并导致推断速度变慢。在计算资源受限的情况下,例如移动端等,则深度学习系统的应用将受到限制。
[0004]深度学习模型压缩主要针对模型参数量过大的问题,目前关于该领域的研究主要集中在如下4点:
[0005](1)矩阵低秩分解:深度学习模型涉及大量矩阵运算,通过将大规模的低秩矩阵分解为数个小矩阵,可以在保证计算结果基本不变的同时大幅减少矩阵的数据量。
[0006](2)模型剪枝与参数量化:模型剪枝的主要出发点是深度学习模型往往会过参数化,使得网络中含有多余的结构与参数,通过重要性等规则,删减多余的网络,从而实现冗余参数、神经元的删减。量化则是指将权重储存的数据类型进行简化,如从浮点数转变为整型,从而实现存储量的减少。这一类方法往往会降低模型的性能。
[0007](3)网络结构搜索(NeuralArchitecture Search,NAS):在给定的模型设计空间, ...
【技术保护点】
【技术特征摘要】
1.一种基于决策边界的深度学习模型压缩方法,其特征在于,所述基于决策边界的深度学习模型压缩方法包括以下步骤:步骤一、进行特征映射;步骤二、进行激活函数分段线性化;步骤三、进行子决策区域计算:计算全连接层的子决策区域;步骤四、进行决策网络构建:根据子决策区域计算相应的决策边界,并用于构建新的决策网络。2.根据权利要求1所述的一种基于决策边界的深度学习模型压缩方法,其特征在于,在步骤一中,若模型压缩的对象为全连接神经网络,则不执行本步骤,直接执行步骤二。3.根据权利要求1所述的一种基于决策边界的深度学习模型压缩方法,其特征在于,在步骤一中,若对象为cnn模型的全连接部分,则将模型视为两个部分的复合f=g
MLP
(g
cnn
(x0)),把g
cnn
(x0)视为特征映射,构建成新的样本集D
′
={x
′
=g
cnn
(x)},然后将其作为全连接神经网络来进行操作。4.根据权利要求1所述的一种基于决策边界的深度学习模型压缩方法,其特征在于,在步骤二中,若激活函数采用分段线性函数,则不执行本步骤,直接执行步骤三。5.根据权利要求1所述的一种基于决策边界的深度学习模型压缩方法,其特征在于,在步骤二中,对于激活函数不是分段线性的函数,采用激活函数分段线性化技术,通过找到与激活函数相近的分段线性函数,来进行近似替代,转化为分段线性函数。6.根据权利要求5所述的一种基于决策边界的深度学习模型压缩方法,其特征在于,在步骤二中,对于激活函数不是分段线性的函数,具体的:首先生成激活函数σ(x)的硬近似函数hard
‑
σ(x),具体如下:σ(x),具体如下:σ(x),具体如下:根据所需要的分段数L=n+2以及可接受的误差δ>0,首先选择两个分段点,使得在(
‑
∞,a0],[a
n
,+∞)两个区间上,满足|σ(x)
‑
hard
‑
σ(x)|≤δ,而在区间[a0,a
n
]上,直接等距取分割点a1,a2,...,a
n
‑1,并按照点对(a1,hard
‑
σ(a1)),(a2,σ(a2)),(a3,σ(a3)),
…
,(a
n
‑2,σ(a
n
‑2)),(a
n
‑1,hard
‑
σ(a
n
‑1)),依次连线,即得到了对原激活函数的L=n+2段分段线性近似函数。...
【专利技术属性】
技术研发人员:董航程,刘国栋,刘炳国,叶东,廖敬骁,
申请(专利权)人:哈尔滨工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。