深度学习模型动态分支选择的推理方法及系统技术方案

技术编号：27583108 阅读：34 留言：0更新日期：2021-03-09 22:41

本发明专利技术提供一种深度学习模型动态分支选择的推理方法及系统，本发明专利技术针对传统深度学习模型推理过程中卷积神经网络在解码部分中的深层特征存在冗余的问题，能够根据初级特征的类别，自动选择相应的解码分支，每个解码分支通过对应分支类别的初级特征输入以及相应的输出进行训练分别得到不同的特征权重组，能专注于对应分支类别的初级特征的处理和深层特征的识别以完成更加复杂的分类或者表征的生成，从而降低计算冗余，提升推理速度，满足边缘计算设备的实际应用需求。计算设备的实际应用需求。计算设备的实际应用需求。

全部详细技术资料下载

【技术实现步骤摘要】
深度学习模型动态分支选择的推理方法及系统

[0001]本专利技术属于人工智能深度学习推理
，尤其涉及一种应用在边缘计算设备上的深度学习模型动态分支选择的推理方法及系统。

技术介绍

[0002]当前边缘计算终端应用对于深度学习视觉算法的需求越来越多，但受制于当前边缘终端成本，高精度复杂模型运行推理延迟无法满足实际应用，而简单模型精度上达不到要求，这是因为对于数据密集型的复杂任务，通常需要复杂的卷积神经网络模型才能很好地拟合任务，过于轻量型的模型会欠拟合。
[0003]此外，在深度学习视觉模型的推理过程中，卷积神经网络模型实时生成的深层特征会存在冗余。深度卷积神经网络较浅层部分会提取出一些初级特征（如圆、线、纹理等底层特征），一般称作为编码，然后神经网络的更深层部分识别这些初级特征，得到更深层的特征（如车轮特征），最后识别这些更深层的特征输出推理结果，一般称作为解码，传统的深度卷积神经网络模型中只有一个大的解码器，该解码器只有一套特征权重组来对初级特征进行处理和对深层特征进行识别，但我们发现当输入包含较大不同类别的特征的图片时，在神经网络的深层部分，也就是解码部分，往往会存在一部分特征是冗余的，导致神经网络的计算存在冗余。以分类任务为例，区分特征相差较多的两个类别，比如人和车，神经网络的编码部分会提取一些初级特征，通过解码部分的特征识别后，某些层的一些通道可能会生成类似车轮特征，但这些特征对于识别人来说是冗余的。

技术实现思路

[0004]针对目前深度学习模型存在的特征冗余导致在边缘计算设备...

【技术保护点】

【技术特征摘要】
1.一种深度学习模型动态分支选择的推理方法，其特征在于，包括：S101、构建并训练用于图片的语义分类、语义检测或者语义分割的深度学习模型，所述深度学习模型包括编码器、分支选择器以及分别一一对应不同的分支类别的多个解码分支，所述深度学习模型被训练为：由所述编码器从输入的图片中提取多个初级特征；由所述分支选择器识别并输出初级特征的分支类别；由解码分支通过与分支类别对应的特征权重组对所有初级特征进行处理得到深层特征、对所述深层特征进行识别输出推理结果；S102、将所述编码器、分支选择器以及各解码分支的特征权重组部署到边缘计算设备中，在输入推理任务图片后，输出初级特征和分支类别；S103、将所述多个解码分支部署到边缘计算设备中，根据步骤S102输出的分支类别选择相应的解码分支，由该解码分支接收步骤S102输出的初级特征，输出推理结果。2.根据权利要求1所述的一种深度学习模型动态分支选择的推理方法，其特征在于，所述编码器采用常用深度卷积神经网络模型的浅层部分的结构。3.根据权利要求2所述的一种深度学习模型动态分支选择的推理方法，其特征在于，所述编码器采用ResNet、Inception或者MobileNet的浅层部分结构。4.根据权利要求3所述的一种深度学习模型动态分支选择的推理方法，其特征在于，所述分支选择器通过对初级特征进行分类，输出与解码分支数量相同的矢量，并对该矢量进行取最大值位置操作得到被选择的解码分支的编号，所述分支选择器由全局平均池化层、全连接层、激活层以及全连...

【专利技术属性】
技术研发人员：李发成，袁施薇，张如高，虞正华，
申请(专利权)人：魔视智能科技上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人