应用在神经网络数据处理中的向量融合计算方法及装置制造方法及图纸

技术编号:33729871 阅读:13 留言:0更新日期:2022-06-08 21:25
本发明专利技术涉及神经网络领域,具体涉及一种应用在神经网络数据处理中的向量融合计算方法及装置,该方法及装置采用指令集控制的方式,将两种不同的Route算子和Shortcut算子在指令集中编码成不同的参数,通过状态机的方式控制系统的运行,指令集的SRAM存储网络各层的功能信息,然后在状态机的解码状态下对其进行解码,当解码出指令集的算子类型是Route或者Shortcut时,然后进行相应的算子处理。因为Route和Shortcut两个算子都是对网络层中的两个中间层进行数据处理,不管是进行拼接还是对应位置数据相加,都使得输出特征图的特征信息增加了,图片的后续处理精度都会得到提升。图片的后续处理精度都会得到提升。图片的后续处理精度都会得到提升。

【技术实现步骤摘要】
应用在神经网络数据处理中的向量融合计算方法及装置


[0001]本专利技术涉及神经网络领域,具体而言,涉及一种应用在神经网络数据处理中的向量融合计算方法及装置。

技术介绍

[0002]随着神经网络的结构越来越复杂,网络层数越来越深,网络的准确率开始达到了饱和甚至出现退化现象,所以越到后边网络越需要将其中的一些中间量做一些必要处理以确保网络数据的准确性和精度。因为在卷积神经网络中,随着网络层深越来越大,图片经过卷积或者池化等操作会剔除部分之前的数据信息,造成图片的特征信息部分丢失,进而导致图片识别的结果出现偏差或者错误。
[0003]现有技术对上述缺陷也有一些处理方法,但还是存在以下缺点:
[0004]1.对图片的处理是一页一页的,没有并行处理,在处理效率上比较低下。
[0005]2.图片从片下DDR到SRAM多次交互,数据的存储浪费延迟较大。
[0006]3.针对性强,但设计过程复杂,不能与系统其他算子模块很好集成,造成系统操作繁杂,能耗和资源开销较大。

技术实现思路

[0007]本专利技术实施例提供了一种应用在神经网络数据处理中的向量融合计算方法及装置,以至少解决现有技术处理输入特征图效率低下的技术问题。
[0008]根据本专利技术的一实施例,提供了一种应用在神经网络数据处理中的向量融合计算方法,包括以下步骤:
[0009]采用指令集控制的方式,将两种不同的Route算子和Shortcut算子在指令集中编码成不同的参数;
[0010]通过状态机的方式控制系统的运行,指令集的SRAM存储网络各层的功能信息,然后在状态机的解码状态下对其进行解码;
[0011]当解码出指令集的算子类型是Route或者Shortcut时,然后进行相应的算子处理。
[0012]进一步地,方法中开始时将两个不同的Route算子和Shortcut算子都有的过程集成在同一个状态中,后续到具体的各自向量数据处理的时候再分开到各自不同的处理状态。
[0013]进一步地,方法中Route算子和Shortcut算子都是在整个的状态机框架下实现,而且采用的是指令集配置和解码的方式,其中Route算子和Shortcut算子在系统前期的配置和解码过程相同,在指令集中的参数代码不同。
[0014]进一步地,方法具体包括:
[0015]首先系统进行前期的控制和配置过程,通过STATE_CFG_RAM在SRAM中存储指令集信息;
[0016]指令集信息配置完成之后状态机在STATE_DECODE_INST状态下对其进行解码,从
而分析下一步做出什么动作;
[0017]当状态机解码到指令集中的网络层类型是Route或者Shortcut的时候,就会跳转到STATE_SHORT_ROUTE状态;其中Route算子或者Shortcut算子前期从片下DDR索引目标网络层的起始位置的过程是一样的,只是具体的参数不同,Route是要将两张特征图的数据传入到SRAM作拼接,得到目标的输出数据后再写回DDR,而Shortcut是要将两层特征图的数据传入到系统的计算单元PE当中作相应的加法,得到新的输出特征图的数据之后再写回到DDR。
[0018]进一步地,Route算子将不同层的网络数据进行拼接,使得输出网络层兼顾到开始的特征信息;Route算子结合了多层的特征图的特征信息,将其数据进行拼接结合成一个新的特征图,新的特征图不仅特征信息数据量增加,而且会结合不同网络层特征信息。
[0019]进一步地,Shortcut算子通过将两层中间层的网络数据进行相加处理得到新的输出特征图的图片数据;Shortcut算子中特征图的对应像素点的数据发生变化,新的输出特征图的对应像素点的数据是由两层的中间网络层的对应像素点的数据相加得到。
[0020]进一步地,指令集的SRAM存储网络各层的功能信息包括功能层和算子的类型、输入特征图的尺寸大小。
[0021]根据本专利技术的另一实施例,提供了一种应用在神经网络数据处理中的向量融合计算装置,包括:
[0022]编码单元,用于采用指令集控制的方式,将两种不同的Route算子和Shortcut算子在指令集中编码成不同的参数;
[0023]解码单元,用于通过状态机的方式控制系统的运行,指令集的SRAM存储网络各层的功能信息,然后在状态机的解码状态下对其进行解码;
[0024]算子对应处理单元,用于当解码出指令集的算子类型是Route或者Shortcut时,然后进行相应的算子处理。
[0025]一种存储介质,存储介质存储有能够实现上述任意一项应用在神经网络数据处理中的向量融合计算方法的程序文件。
[0026]一种处理器,处理器用于运行程序,其中,程序运行时执行上述任意一项的应用在神经网络数据处理中的向量融合计算方法。
[0027]本专利技术实施例中的应用在神经网络数据处理中的向量融合计算方法及装置,采用指令集控制的方式,将两种不同的Route算子和Shortcut算子在指令集中编码成不同的参数,通过状态机的方式控制系统的运行,指令集的SRAM存储网络各层的功能信息,然后在状态机的解码状态下对其进行解码,当解码出指令集的算子类型是Route或者Shortcut时,然后进行相应的算子处理。因为Route和Shortcut两个算子都是对网络层中的两个中间层进行数据处理,不管是进行拼接还是对应位置数据相加,都使得输出特征图的特征信息增加了,图片的后续处理精度都会得到提升。
附图说明
[0028]此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:
[0029]图1为本专利技术应用在神经网络数据处理中的向量融合计算方法中Route算子的工
作过程图;
[0030]图2为本专利技术应用在神经网络数据处理中的向量融合计算方法中Shortcut算子的工作过程图;
[0031]图3为本专利技术应用在神经网络数据处理中的向量融合计算方法中状态机的工作过程图;
[0032]图4为本专利技术应用在神经网络数据处理中的向量融合计算方法中状态机的部分代码图。
具体实施方式
[0033]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0034]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种应用在神经网络数据处理中的向量融合计算方法,其特征在于,包括以下步骤:采用指令集控制的方式,将两种不同的Route算子和Shortcut算子在指令集中编码成不同的参数;通过状态机的方式控制系统的运行,指令集的SRAM存储网络各层的功能信息,然后在状态机的解码状态下对其进行解码;当解码出指令集的算子类型是Route或者Shortcut时,然后进行相应的算子处理。2.根据权利要求1所述的应用在神经网络数据处理中的向量融合计算方法,其特征在于,所述方法中开始时将两个不同的Route算子和Shortcut算子都有的过程集成在同一个状态中,后续到具体的各自向量数据处理的时候再分开到各自不同的处理状态。3.根据权利要求2所述的应用在神经网络数据处理中的向量融合计算方法,其特征在于,所述方法中Route算子和Shortcut算子都是在整个的状态机框架下实现,而且采用的是指令集配置和解码的方式,其中Route算子和Shortcut算子在系统前期的配置和解码过程相同,在指令集中的参数代码不同。4.根据权利要求1所述的应用在神经网络数据处理中的向量融合计算方法,其特征在于,所述方法具体包括:首先系统进行前期的控制和配置过程,通过STATE_CFG_RAM在SRAM中存储指令集信息;指令集信息配置完成之后状态机在STATE_DECODE_INST状态下对其进行解码,从而分析下一步做出什么动作;当状态机解码到指令集中的网络层类型是Route或者Shortcut的时候,就会跳转到STATE_SHORT_ROUTE状态;其中Route算子或者Shortcut算子前期从片下DDR索引目标网络层的起始位置的过程是一样的,只是具体的参数不同,Route是要将两张特征图的数据传入到SRAM作拼接,得到目标的输出数据后再写回DDR,而Shortcut是要将两层特征图的数据传入到系统的计算单元...

【专利技术属性】
技术研发人员:王峥肖玺
申请(专利权)人:中国科学院深圳先进技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1