一种应用于手机端的深度学习图像识别系统及实现方法技术方案

技术编号:15502402 阅读:114 留言:0更新日期:2017-06-03 23:19
本发明专利技术公开了一种应用于手机端的深度学习图像识别系统及实现方法,方法包括:根据概念划分映射得到一树状类别映射关系;基于原始的Inception‑v3网络结构,在网络中的降维处各增加一并联分支作为网络下一层的输入得到改进的Inception‑v3网络结构;按照所述改进的Inception‑v3网络结构并在设定类上根据所述树状类别映射关系训练得到基模型;对所述基模型进行压缩后在手机端运行识别出图像;所述压缩至少包括:参数稀疏化、参数量化或者参数稀疏存储中的一种。本发明专利技术中提供基于概念类别映射的树状图像识别、并在算法上对原始Inception‑v3模型结构做改进,同时提供了一种在不影响改进模型准确率情况下有效压缩模型的方法,保证模型在手机端有效稳定运行。

Depth learning image recognition system applied to mobile phone terminal and implementation method

Deep learning image recognition system of the invention discloses a method for mobile phone terminal and realization method, method includes: according to the concept of a tree mapped category mapping; Inception V3 network structure based on the original, decreasing the dimension in the network of the parallel branch as the input layer of the network under Inception improved V3 networks; Inception improved V3 network structure according to the set and in class according to the category tree mapping training base model; to the base model after compression in the mobile phone terminal operation to identify the images; the compression parameter includes at least a sparse, parameter quantitative parameters or sparse storage in. The concept of category mapping tree image recognition, and the algorithm of the original Inception V3 model structure based on the improvement of the invention, the method provides an improved model accuracy under the condition of effective compression model does not affect the model in the end, to ensure effective and stable operation of mobile phone.

【技术实现步骤摘要】
一种应用于手机端的深度学习图像识别系统及实现方法
本专利技术涉及手机端图像识别技术,特别涉及一种应用于手机端的深度学习图像识别系统及实现方法。
技术介绍
图像识别综合了很多学科内容,其中包括计算机科学与技术、物理学、统计学以及神经生物学等,广泛应用于地质勘探、图像遥感、机器人视觉、生物医学等多个领域。图像识别技术在个人计算机以及嵌入式终端设备上也已有很多成熟的应用案例,而随着手机功能的不断增强,该技术也逐渐被应用到智能手机但智能手机本身的弱处理能力和低内存的局限性对计算复杂的识别算法提出了考验。目前智能手机发展非常迅速,基本上都集成高速处理芯片、大容量存储器、内置了百万像素的摄像头和WI-FI无线局域网接口卡,甚至一些高端的设备中还集成了大量传感器如GPS定位传感器和加速度传感器等这些性能不断提高的硬件设备,给计算机视觉和图像处理领域带来了新的发展空间,许多原来运行在PC上的计算机视觉算法,通过改进和优化,能有效的运行的智能终端的平台上。但是,相对于现在配备高速处理芯片和大容量存储芯片的服务器,智能手机还存在以下不足:较低的图像分辨率、缺少专门的图形加速器、没有浮点运算单元、尤其是低端处理器和低容量存储器等,限制了在智能手机上进行复杂运算和大规模计算具体而言,现有的手机端图像识别技术中具有较多实现方式,比如,手机端单层次的类别图像识别,但缺点在于:类别数不够丰富,也没有表现类别之间的联系。比如,用于分类的卷积神经网络算法模型Inception-v3结构(相较于前一版本v3一个最重要的改进是分解(Factorization),将7x7分解成两个一维的卷积(1x7,7x1),3x3也是一样(1x3,3x1),这样的好处,既可以加速计算(多余的计算能力可以用来加深网络),又可以将1个conv拆成2个conv,使得网络深度进一步增加,增加了网络的非线性,还有值得注意的地方是网络输入从224x224变为了299x299,更加精细设计了35x35/17x17/8x8的模块。),但缺点在于:在原始结构内有两处直接一个Pooling层降维,容易造成一定的信息损失。比如,模型参数稀疏化,但缺点在于:直接用一个简单的阈值去减参数,导致模型准确率有一定的损失。又比如,模型参数量化,但缺点在于:K-means聚类易受参数数量大小而影响效果,鲁棒性不够;改变量化中心的方式计算量大,训练速度慢。再比如,模型参数稀疏存储,但缺点在于:对所有卷积层使用同样的比特位大小,存储效率不高。综上,现如今的手机端图像识别系统大多采用深度学习训练得到的深度模型进行识别,但是如何有效率的展示图像识别的结果、如何更加准确的识别图像、同时还能在不影响模型识别准确率的情况下压缩模型,减少模型存储和计算量以适用于手机端,是有待解决的问题。
技术实现思路
本专利技术要解决的技术问题是,提供基于概念类别映射的树状图像识别、并在算法上对原始Inception-v3模型结构做改进,同时提供了一种在不影响改进模型准确率情况下有效压缩模型的方法,保证模型在手机端有效稳定运行的深度学习图像识别系统。解决上述技术问题,本专利技术提供了一种应用于手机端的深度学习图像识别方法,包括如下步骤:根据概念划分映射得到一树状类别映射关系;基于原始的Inception-v3网络结构,在网络中的降维处各增加一并联分支作为网络下一层的输入得到改进的Inception-v3网络结构;按照所述改进的Inception-v3网络结构并在设定类上根据所述树状类别映射关系训练得到基模型;对所述基模型进行压缩后在手机端运行识别出图像;所述压缩至少包括:参数稀疏化、参数量化或者参数稀疏存储中的一种。更进一步,所述降维处具体是指:对于原始的Inception-v3网络结构,维度变化在147*147->73*73和71*71->35*35的两处降维的地方增加并联分支;其中,所述并联分支是指,一卷积核为3*3,步长为2的卷积层,通过所述卷积层的输出和原始的Inception-v3网络结构中的MaxPooling层的输出做通道维度的拼接。更进一步,方法还包括:在多处相邻串联的Inception模块之间加入跨模块直连分支。更进一步,根据概念划分映射得到一树状类别映射关系的方法具体为:首先,定义2000类细化关键词,用以训练深度卷积神经网络即在网络的最后一个Softmax层输出2000类概念;其次,定义10类基本类为粗概念,定义60类基本细化类为细概念;然后,按照类别概念完成以下映射关系:10类粗概念涵盖60类细概念,60类细概念涵盖2000类细化关键词。更进一步,所述参数稀疏化具体为:设定一与稀疏比呈正比的第一阈值,若小于该阈值的神经元之间的连接则会被剪断,若大于该阈值的神经元的连接则会被保留,得到初步稀疏模型;设定第二阈值,并按照同样的操作得到一个稀疏比大于初步稀疏模型的第二稀疏模型;……设定第三阈值,并按照同样的操作得到一个稀疏比大于第二稀疏模型的第三稀疏模型。更进一步,设定上述稀疏比变化为30%->50%->70%。更进一步,所述参数量化具体为:将权重矩阵聚类为4个类别,其中属于同一类的权重共享同一个权重值大小,并存储权重值的index索引;在原始的Inception-v3网络结构,对每个卷积层和全连接层分别按照压缩比计算公式设定个量化中心,其中n表示参数个数,每个参数用bbits表示,k为量化后的中心数。更进一步,方法进一步还包括:在量化训练时采用固定类别中心不变,并将每次前馈索引离权重最近的类别中心做为该权重值,和/或,根据稀疏模型有效参数的分布范围,线性等间隔的选取类别中心;和/或,后馈时不进行额外计算,即固定类别中心更新权重值的index。更进一步,所述参数稀疏存储具体为:对于权重值的index,存储与上一个有效权重值的相对位置,不存储绝对位置的index。基于上述本专利技术还提供了一种应用于手机端的深度学习图像识别系统,包括:映射关系单元、结构改进单元以及模型单元,所述映射关系单元,用以根据概念划分映射得到一树状类别映射关系;所述结构改进单元,用以基于原始的Inception-v3网络结构,在网络中的降维处各增加一并联分支作为网络下一层的输入得到改进的Inception-v3网络结构;所述模型单元,用以按照所述改进的Inception-v3网络结构并在设定类上根据所述树状类别映射关系训练得到基模型;以及,对所述基模型进行压缩后在手机端运行识别出图像;所述压缩至少包括:参数稀疏化、参数量化或者参数稀疏存储中的一种。本专利技术的有益效果:本专利技术首先是在识别2000类概念的基础上,通过类别概念映射关系得到基本类型10类和基本细化类型60类概念,形成一个树状的图像识别系统。同时,在算法上,本专利技术改进了原始的Inception-v3结构,通过在降维的地方加入并联分支结和Inception模块之间加入直连分支,提升了信息传递的有效性和识别准确率。然后对于改进后的模型结构,通过稀疏参数、量化参数和稀疏存储,再次训练得到一个稀疏模型,保证在准确率不损失的前提下,大大压缩和减少原始模型的计算量,保证在手机端稳定运行。此外,本专利技术中树状概念的类别识别更合理,建立了类别之间联系。还改进了原始网络结构,相本文档来自技高网
...
一种应用于手机端的深度学习图像识别系统及实现方法

【技术保护点】
一种应用于手机端的深度学习图像识别方法,其特征在于,包括如下步骤:根据概念划分映射得到一树状类别映射关系;基于原始的Inception‑v3网络结构,在网络中的降维处各增加一并联分支作为网络下一层的输入得到改进的Inception‑v3网络结构;按照所述改进的Inception‑v3网络结构并在设定类上根据所述树状类别映射关系训练得到基模型;对所述基模型进行压缩后在手机端运行识别出图像;所述压缩至少包括:参数稀疏化、参数量化或者参数稀疏存储中的一种。

【技术特征摘要】
1.一种应用于手机端的深度学习图像识别方法,其特征在于,包括如下步骤:根据概念划分映射得到一树状类别映射关系;基于原始的Inception-v3网络结构,在网络中的降维处各增加一并联分支作为网络下一层的输入得到改进的Inception-v3网络结构;按照所述改进的Inception-v3网络结构并在设定类上根据所述树状类别映射关系训练得到基模型;对所述基模型进行压缩后在手机端运行识别出图像;所述压缩至少包括:参数稀疏化、参数量化或者参数稀疏存储中的一种。2.根据权利要求1所述的深度学习图像识别方法,其特征在于,所述降维处具体是指:对于原始的Inception-v3网络结构,维度变化在147*147->73*73和71*71->35*35的两处降维的地方增加并联分支;其中,所述并联分支是指,一卷积核为3*3,步长为2的卷积层,通过所述卷积层的输出和原始的Inception-v3网络结构中的MaxPooling层的输出做通道维度的拼接。3.根据权利要求1或2所述的深度学习图像识别方法,其特征在于,还包括:在多处相邻串联的多分支并联Inception模块之间加入跨模块直连分支。4.根据权利要求1所述的深度学习图像识别方法,其特征在于,根据概念划分映射得到一树状类别映射关系的方法具体为:首先,定义2000类细化关键词,用以训练深度卷积神经网络即在网络的最后一个Softmax层输出2000类概念;其次,定义10类基本类为粗概念,定义60类基本细化类为细概念;然后,按照类别概念完成以下映射关系:10类粗概念涵盖60类细概念,60类细概念涵盖2000类细化关键词。5.根据权利要求1所述的深度学习图像识别方法,其特征在于,所述参数稀疏化具体为:设定一与稀疏比呈正比的第一阈值,若小于该阈值的神经元之间的连接则会被剪断,若大于该阈值的神经元的连接则会被保留,得到初步稀疏模型;设定第二阈值,并按照...

【专利技术属性】
技术研发人员:黄萱昆白洪亮董远
申请(专利权)人:北京飞搜科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1