深度神经网络的下采样方法、装置和计算机设备制造方法及图纸

技术编号:19264036 阅读:22 留言:0更新日期:2018-10-27 02:41
本发明专利技术提供一种深度神经网络的下采样方法、装置和计算机设备,以解决现有方式中深度神经网络下采样过程中信息丢失的技术问题。所述的方法包括步骤:获取多个维度的输入信号,其中,所述维度包括第一通道数和第一空间尺寸;根据所述第一通道数、所述第一空间尺寸和设定比值,确定第二通道数和第二空间尺寸,其中,所述第一通道数与所述第一空间尺寸的乘积与所述第二通道数和所述第二空间尺寸的乘积相等,所述第一空间尺寸大于所述第二空间尺寸;根据所述第二通道数和所述第二空间尺寸,对所述输入信号进行下采样,获得下采样之后的输出信号。本发明专利技术实施例能够在保持所有像素信息的情况下进行深度神经网络的下采样。

【技术实现步骤摘要】
深度神经网络的下采样方法、装置和计算机设备
本专利技术涉及计算机
,具体而言,本专利技术涉及一种深度神经网络的下采样方法、装置和计算机设备。
技术介绍
近不到十年的时间里,人工智能取得了巨大的进步。而这样的进步主要是由深度学习或者说深度神经网络来推动的。深度学习是一种堆叠多层神经网络的机器学习方法。由于神经网络的层数比传统的方法层数多得多,故称为深度学习。随着近年来大量训练数据获得的可能,以及计算机计算性能(主要是显卡的计算性能)的提高,训练大型深度学习模型成为可能。随着深度学习算法的发展,深度学习在很多领域都达到了最先进的水平。例如图像识别、图像分割和自然语言处理等领域。由于深度神经网络体积较大,如果不用适当的下采样方法对输入信号进行下采样以减少深度神经网络对内存的占用需求,很多深度神经网络都没办法进行训练。所以下采样的方法对于深度神经网络来说是非常重要的一部分,也可以说,深度神经网络的基本架构就是将输入信号逐步进行下采样,不断得到转化之后的抽象特征再加以利用。目前深度神经网络的下采样方法包括将卷积的步长(stride)设置为大于1、最大值池化(maxpooling)和平均值池化(averagepooling)等。但是上述三种方法都会导致信息的丢失,导致深度神经网络性能较差。
技术实现思路
本专利技术针对现有方式中深度神经网络下采样过程中信息丢失的问题,提出一种深度神经网络的下采样方法、装置和计算机设备,以在保持所有像素信息的情况下进行深度神经网络的下采样,提高深度神经网络的性能。本专利技术的实施例根据第一个方面,提供了一种深度神经网络的下采样方法,包括步骤:获取多个维度的输入信号,其中,所述维度包括第一通道数和第一空间尺寸;根据所述第一通道数、所述第一空间尺寸和设定比值,确定第二通道数和第二空间尺寸,其中,所述第一通道数与所述第一空间尺寸的乘积与所述第二通道数和所述第二空间尺寸的乘积相等,所述第一空间尺寸大于所述第二空间尺寸;根据所述第二通道数和所述第二空间尺寸,对所述输入信号进行下采样,获得下采样之后的输出信号。在一个实施例中,所述根据所述第一通道数、所述第一空间尺寸和设定比值,确定第二通道数和第二空间尺寸,包括:将所述第一通道数与所述设定比值的N次方相乘,得到第二通道数,其中,N为大于等于1的正整数;将所述第一空间尺寸与所述设定比值的N次方相除,得到第二空间尺寸。在一个实施例中,所述第一空间尺寸包括第一水平方向尺寸和第一竖直方向尺寸,所述第二空间尺寸包括第二水平方向尺寸和第二竖直方向尺寸;所述将所述第一空间尺寸与所述设定比值的N次方相除,得到第二空间尺寸,包括:将所述第一水平方向尺寸与所述设定比值的X次方相除,得到第二水平方向尺寸,其中,X为小于等于N的正整数;将所述第一竖直方向尺寸与所述设定比值的(N-X)次方相除,得到第二竖直方向尺寸。在一个实施例中,所述N为2,所述X为1。在一个实施例中,所述根据所述第二通道数和所述第二空间尺寸,对所述输入信号进行下采样,获得下采样之后的输出信号,包括:从所述输入信号中依次读取与所述第二通道数相同数目的像素;将读取的各个像素一一存储在每个第二通道对应的信号中;将历遍所述输入信号所有像素后得到的每个第二通道对应的信号进行堆叠,形成下采样之后的输出信号。在一个实施例中,所述根据所述第二通道数和所述第二空间尺寸,对所述输入信号进行下采样,获得下采样之后的输出信号,包括:从所述输入信号中依次读取与所述第二空间尺寸相同数目的像素;从每个第二通道对应的信号中选取一个未存储像素的信号,将依次读取的各个像素一一存储在选取的信号中;将历遍所述输入信号所有像素后得到的各个信号进行堆叠,形成下采样之后的输出信号。在一个实施例中,所述根据所述第二通道数和所述第二空间尺寸,对所述输入信号进行下采样,获得下采样之后的输出信号,包括:从所述输入信号中依次读取预设数目的像素;从每个第二通道对应的信号中选取存在空位置的信号,将依次读取的各个像素一一存储在选取的信号中;将历遍所述输入信号所有像素后得到的各个信号进行堆叠,形成下采样之后的输出信号。本专利技术的实施例根据第二个方面,还提供了一种深度神经网络的下采样装置,包括:输入信号获取模块,用于获取多个维度的输入信号,其中,所述维度包括第一通道数和第一空间尺寸;维度确定模块,用于根据所述第一通道数、所述第一空间尺寸和设定比值,确定第二通道数和第二空间尺寸,其中,所述第一通道数与所述第一空间尺寸的乘积与所述第二通道数和所述第二空间尺寸的乘积相等,所述第一空间尺寸大于所述第二空间尺寸;下采样模块,用于根据所述第二通道数和所述第二空间尺寸,对所述输入信号进行下采样,获得下采样之后的输出信号。本专利技术的实施例根据第三个方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任意一项所述的深度神经网络的下采样方法。本专利技术的实施例根据第四个方面,还提供了一种计算机设备,所述计算机设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任意一项所述的深度神经网络的下采样方法。上述的深度神经网络的下采样方法、装置和计算机设备,将第一空间尺寸压缩至第二空间尺寸,将第一通道数扩展至第二通道数,而第一通道数与第一空间尺寸的乘积与第二通道数和第二空间尺寸的乘积相等,因此通过将空间域上面的像素信息重排到通道域上面,就可以在保持所有像素信息的情况下实现对输入信号的下采样,有效解决了深度神经网络下采样过程中信息丢失的问题,提高了神经网络的性能和表现。本专利技术附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本专利技术一个实施例的深度神经网络的下采样方法的流程示意图;图2为本专利技术一个实施例的输入信号和下采样之后的输出信号的示意图;图3为本专利技术一个实施例的下采样之后的输出信号获得方法的示意图;图4为本专利技术另一个实施例的下采样之后的输出信号获得方法的示意图;图5为本专利技术另一个实施例的下采样之后的输出信号获得方法的示意图;图6为本专利技术一个实施例的的深度神经网络的下采装置的结构示意图;图7为本专利技术一个实施例的计算机设备的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能解释为对本专利技术的限制。本
技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本专利技术的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该进一步理解的是,这里使用的“第一”和“第二”仅用于区分同一技术术语,并不对该技术术语的顺序和数量等进行限定。本
技术人员可以理解,除非另外定义,这里使用的所有术本文档来自技高网
...

【技术保护点】
1.一种深度神经网络的下采样方法,其特征在于,包括步骤:获取多个维度的输入信号,其中,所述维度包括第一通道数和第一空间尺寸;根据所述第一通道数、所述第一空间尺寸和设定比值,确定第二通道数和第二空间尺寸,其中,所述第一通道数与所述第一空间尺寸的乘积与所述第二通道数和所述第二空间尺寸的乘积相等,所述第一空间尺寸大于所述第二空间尺寸;根据所述第二通道数和所述第二空间尺寸,对所述输入信号进行下采样,获得下采样之后的输出信号。

【技术特征摘要】
1.一种深度神经网络的下采样方法,其特征在于,包括步骤:获取多个维度的输入信号,其中,所述维度包括第一通道数和第一空间尺寸;根据所述第一通道数、所述第一空间尺寸和设定比值,确定第二通道数和第二空间尺寸,其中,所述第一通道数与所述第一空间尺寸的乘积与所述第二通道数和所述第二空间尺寸的乘积相等,所述第一空间尺寸大于所述第二空间尺寸;根据所述第二通道数和所述第二空间尺寸,对所述输入信号进行下采样,获得下采样之后的输出信号。2.根据权利要求1所述的深度神经网络的下采样方法,其特征在于,所述根据所述第一通道数、所述第一空间尺寸和设定比值,确定第二通道数和第二空间尺寸,包括:将所述第一通道数与所述设定比值的N次方相乘,得到第二通道数,其中,N为大于等于1的正整数;将所述第一空间尺寸与所述设定比值的N次方相除,得到第二空间尺寸。3.根据权利要求2所述的深度神经网络的下采样方法,其特征在于,所述第一空间尺寸包括第一水平方向尺寸和第一竖直方向尺寸,所述第二空间尺寸包括第二水平方向尺寸和第二竖直方向尺寸;所述将所述第一空间尺寸与所述设定比值的N次方相除,得到第二空间尺寸,包括:将所述第一水平方向尺寸与所述设定比值的X次方相除,得到第二水平方向尺寸,其中,X为小于等于N的正整数;将所述第一竖直方向尺寸与所述设定比值的(N-X)次方相除,得到第二竖直方向尺寸。4.根据权利要求3所述的深度神经网络的下采样方法,其特征在于,所述N为2,所述X为1。5.根据权利要求1至4任意一项所述的深度神经网络的下采样方法,其特征在于,所述根据所述第二通道数和所述第二空间尺寸,对所述输入信号进行下采样,获得下采样之后的输出信号,包括:从所述输入信号中依次读取与所述第二通道数相同数目的像素;将读取的各个像素一一存储在每个第二通道对应的信号中;将历遍所述输入信号所有像素后得到的每个第二通道对应的信号进行堆叠,形成下采样之后的输出信号。6.根据权利要求...

【专利技术属性】
技术研发人员:刘凌海王雷
申请(专利权)人:广州华多网络科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1