提升通道随机混合操作运行速度的方法及装置制造方法及图纸

技术编号:26378651 阅读:15 留言:0更新日期:2020-11-19 23:47
本发明专利技术提供了一种提升通道随机混合操作运行速度的方法,包括:将卷积输出的K个分组中的每个分组再进行分组,得到每个分组的K个小组;将每个分组的K个小组分配到K个分组中的不同分组中;调整卷积模块的权重的顺序,使得卷积输出时分配到相同分组中的通道所在位置是连续的;对K个分组中的L个分组进行卷积操作,将L个分组进行卷积操作之后的结果和M个分组进行拼接;其中,K=L+M。由此,降低通道随机混合操作搬运数据的次数和搬运的数据量,从而实现降低功耗、提升运行速度。

【技术实现步骤摘要】
提升通道随机混合操作运行速度的方法及装置
本专利技术数字信号处理
,尤其涉及一种提升通道随机混合操作运行速度的方法及装置。
技术介绍
神经网络架构中引入分组卷积核和通道随机混合操作,可以在相同权重数量的情况下,提升神经网络的精度。分组卷积操作指,将卷积的输入在通道方向上分成N组,分别对每组进行卷积操作,再将所有组卷积的结果在通道方向上拼在一起。使用分组卷积会降低计算量。如果多个分组卷积操作串联,为了使得不同分组间的信息能交流,则对每层的结果进行通道随机混合。通道随机混合指,将每组的通道都分配到所有的组中,从而实现不同组间的信息交流。以2分组为例,假设随机混合操作前特征为src[N],有N个通道,随机混合操作后结果为dst[N],也是N个通道。通道随机混合操作为:将src分成两组为src[0],...,src[N/2-1]和src[N/2],...,src[N-1],则dst与src的关系为:forn=0:N/2-1dst[n*2]=src[n]dst[n*2+1]=src[n+N/2]无论是通用处理器还是专用处理器,进行通道随机混合操作都会消耗时间,降低网络整体的运行速度。
技术实现思路
本专利技术实施例的目的是提供一种提升通道随机混合操作运行速度的方法及装置,以解决现有技术中的通用处理器或者专用处理器进行通道随机混合操作时所存在的耗时、降低网络整体的运行速度的问题。第一方面,本专利技术提供了一种提升通道随机混合操作运行速度的方法,所述提升通道随机混合操作运行速度的方法包括:将卷积输出的K个分组中的每个分组再进行分组,得到每个分组的K个小组;将每个分组的K个小组分配到K个分组中的不同分组中;调整卷积模块的权重的顺序,使得卷积输出时分配到相同分组中的通道所在位置是连续的;对K个分组中的L个分组进行卷积操作,将L个分组进行卷积操作之后的结果和M个分组进行拼接;其中,K=L+M。在一种可能的实现方式中,所述根据所述卷积模块的输入特征通道的顺序和卷积核中对应的通道的顺序,对所述卷积模块的卷积核进行排序具体包括:对卷积模块的权重以卷积核为单位进行排序,将卷积模块的输出结果作为目标结果。在一种可能的实现方式中,所述对K个分组中的L个分组进行卷积操作,将L个分组进行卷积操作之后的结果和M个分组进行拼接之后还包括:将M个分组中的每个分组再分成K个小组,将L个分组进行卷积操作之后的结果中的每个结果分成K个小组,将M个分组对应的K个小组分配到不同的M个分组中,将L个分组对应的K个小组分配到不同的L个分组中,调整卷积模块的权重的顺序,使得卷积输出时分配到相同分组中的通道所在位置是连续的。在一种可能的实现方式中,当有多个卷积神经网络进行串联时,K个小组的数值根据卷积神经网络的串联个数确定。在一种可能的实现方式中,所述调整卷积模块的权重的顺序之后,还包括:调整下一层卷积中权重中卷积核内的通道顺序,使得输出特征的个数与卷积核内通道个数相匹配。第二方面,本专利技术提供了一种提升通道随机混合操作运行速度的装置,所述提升通道随机混合操作运行速度的装置包括:分组模块,所述分组模块用于将卷积输出的K个分组中的每个分组再进行分组,得到每个分组的K个小组;分配模块,所述分配模块用于将每个分组的K个小组分配到K个分组中的不同分组中;调整模块,所述调整模块用于调整卷积模块的权重的顺序,使得卷积输出时分配到相同分组中的通道所在位置是连续的;卷积操作模块,所述卷积操作模块用于对K个分组中的L个分组进行卷积操作,将L个分组进行卷积操作之后的结果和M个分组进行拼接;其中,K=L+M。在一种可能的实现方式中,所述调整模块具体用于:对卷积模块的权重以卷积核为单位进行排序,将卷积模块的输出结果作为目标结果。在一种可能的实现方式中,所述分组模块还用于:将M个分组中的每个分组再分成K个小组,将L个分组进行卷积操作之后的结果中的每个结果分成K个小组,将M个分组对应的K个小组分配到不同的M个分组中,将L个分组对应的K个小组分配到不同的L个分组中,调整卷积模块的权重的顺序,使得卷积输出时分配到相同分组中的通道所在位置是连续的。在一种可能的实现方式中,当有多个卷积神经网络进行串联时,K个小组的数值根据卷积神经网络的串联个数确定。在一种可能的实现方式中,所述调整模块还用于:调整下一层卷积中权重中卷积核内的通道顺序,使得输出特征的个数与卷积核内通道个数相匹配。第三方面,本专利技术提供了一种设备,包括存储器和处理器,存储器用于存储程序,处理器用于执行第一方面任一所述的方法。第四方面,本专利技术提供了一种包含指令的计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行如第一方面任一所述的方法。第五方面,本专利技术提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如第一方面任一所述的方法。由此,通过本专利技术实施例一提供的提升通道随机混合操作运行速度的方法及装置,将卷积输出的K个分组中的每个分组再进行分组,得到每个分组的K个小组;将每个分组的K个小组分配到K个分组中的不同分组中;调整卷积模块的权重的顺序,使得卷积输出时分配到相同分组中的通道所在位置是连续的;对K个分组中的L个分组进行卷积操作,将L个分组进行卷积操作之后的结果和M个分组进行拼接,从而降低通道随机混合操作搬运数据的次数和搬运的数据量,从而实现降低功耗、提升运行速度。附图说明图1为本专利技术实施例一提供的提升通道随机混合操作运行速度的方法流程示意图;图2为现有技术中的原始计算的各层信息示意图;图3为应用本专利技术实施例一提供的提升通道随机混合操作运行速度的方法后的各层信息示意图;图4为本专利技术实施例二提供的提升通道随机混合操作运行速度的方装置结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1为本专利技术实施例一提供的提升通道随机混合操作运行速度的方法流程示意图。在对该方法进行说明之前,首先先对卷积模块的背景进行说明。通常卷积模块的输入为3维,即input[h,w,c],权重为4维,即W[N,h1,w1,c],权重W由N个卷积核ker[h1,w1,c]组成。卷积核的输出为3维,即out[h2,w2,N]。卷积输入input的通道个数和卷积核的通道个数是一样的,都为c。输入和每个卷积核进行卷积操作,结果是输出的一个通道,即一个卷积核对应输出的一个通道,卷积本文档来自技高网...

【技术保护点】
1.一种提升通道随机混合操作运行速度的方法,其特征在于,所述提升通道随机混合操作运行速度的方法包括:/n将卷积输出的K个分组中的每个分组再进行分组,得到每个分组的K个小组;/n将每个分组的K个小组分配到K个分组中的不同分组中;/n调整卷积模块的权重的顺序,使得卷积输出时分配到相同分组中的通道所在位置是连续的;/n对K个分组中的L个分组进行卷积操作,将L个分组进行卷积操作之后的结果和M个分组进行拼接;其中,K=L+M。/n

【技术特征摘要】
1.一种提升通道随机混合操作运行速度的方法,其特征在于,所述提升通道随机混合操作运行速度的方法包括:
将卷积输出的K个分组中的每个分组再进行分组,得到每个分组的K个小组;
将每个分组的K个小组分配到K个分组中的不同分组中;
调整卷积模块的权重的顺序,使得卷积输出时分配到相同分组中的通道所在位置是连续的;
对K个分组中的L个分组进行卷积操作,将L个分组进行卷积操作之后的结果和M个分组进行拼接;其中,K=L+M。


2.根据权利要求1所述的方法,其特征在于,所述根据所述卷积模块的输入特征通道的顺序和卷积核中对应的通道的顺序,对所述卷积模块的卷积核进行排序具体包括:
对卷积模块的权重以卷积核为单位进行排序,将卷积模块的输出结果作为目标结果。


3.根据权利要求1所述的方法,其特征在于,所述对K个分组中的L个分组进行卷积操作,将L个分组进行卷积操作之后的结果和M个分组进行拼接之后还包括:
将M个分组中的每个分组再分成K个小组,将L个分组进行卷积操作之后的结果中的每个结果分成K个小组,将M个分组对应的K个小组分配到不同的M个分组中,将L个分组对应的K个小组分配到不同的L个分组中,调整卷积模块的权重的顺序,使得卷积输出时分配到相同分组中的通道所在位置是连续的。


4.根据权利要求1所述的方法,其特征在于,当有多个卷积神经网络进行串联时,K个小组的数值根据卷积神经网络的串联个数确定。


5.根据权利要求1所述的方法,其特征在于,所述调整卷积模块的权重的顺序之后,还包括:
调整下一层卷积中权重中卷积核内的通道顺序,使得输出特征的个数...

【专利技术属性】
技术研发人员:崔鑫
申请(专利权)人:云知声智能科技股份有限公司厦门云知芯智能科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1