非线性层数据处理方法、装置及存储介质制造方法及图纸

技术编号:39944324 阅读:17 留言:0更新日期:2024-01-08 22:48
本申请提供一种非线性层数据处理方法、装置及存储介质,该方法包括:获取待处理张量中的当前待处理元素,并确定当前待处理元素对应的当前索引元素;将当前索引元素转化为预设浮点数值格式,并基于转化后的元素确定当前待处理元素所在插值区间的索引值;基于索引值和插值表,确定当前待处理元素对应的插值区间,由于插值表是非线性函数的类型对应的插值表,并且存储有对非线性函数进行拟合的多段插值区间及插值函数,在计算当前待处理元素的非线性结果时,可基于插值表来计算,所以能够适应不同的神经网络模型,提高通用性。并且对总插值区间划分为多段插值区间,所以有效保证训练过程能够使深度学习神经网络模型收敛。

【技术实现步骤摘要】

本申请涉及数据处理领域,尤其涉及一种非线性层数据处理方法、装置及存储介质


技术介绍

1、随着人工智能技术的发展,深度学习神经网络模型被广泛应用。在深度学习神经网络模型中具有用于完成非线性函数运算的非线性层,在将数据(如张量数据)输入到非线性函数,直接采用非线性函数进行非线性运算时,会降低计算效率。

2、所以现有技术中,会在软件层面或者硬件层面对非线性层的运算进行加速。在软件层面中,一般是针对不同的深度学习网络模型设置不同的量化方法来代替非线性运算,从而实现对非线性层运算的加速。在硬件层面,一般针对不同的深度学习网络模型采用专门的硬件加速器,进而来实现对非线性层运算的加速。

3、所以现有技术中对非线性层的加速方法只能针对特定的神经网络模型,通用性较差。并且现有技术的加速方法无法适用于神经网络的训练过程,或者即使能够适用训练过程,也无法保证训练过程能够使深度学习神经网络模型收敛。


技术实现思路

1、本申请实施例提供一种非线性层数据处理方法、装置及存储介质,用以解决现有技术只能针对特定的神本文档来自技高网...

【技术保护点】

1.一种非线性层数据处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1或2所述的方法,其特征在于,所述插值表的总插值区间划分为多个插值区间;

4.根据权利要求3所述的方法,其特征在于,确定所述当前待处理元素对应的当前索引元素,包括:

5.根据权利要求3所述的方法,其特征在于,所述确定所述当前待处理元素对应的当前索引元素,包括:

6.根据权利要求4所述的方法,其特征在于,所述方法还包括:

7.根据权利要求4所述的方法,其特征在于,所述方法还包括:

8...

【技术特征摘要】

1.一种非线性层数据处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1或2所述的方法,其特征在于,所述插值表的总插值区间划分为多个插值区间;

4.根据权利要求3所述的方法,其特征在于,确定所述当前待处理元素对应的当前索引元素,包括:

5.根据权利要求3所述的方法,其特征在于,所述确定所述当前待处理元素对应的当前索引元素,包括:

6.根据权利要求4所述的方法,其特征在于,所述方法还包括:

7.根据权利要求4所述的方法,其特征在于,所述方法还包括:

8.根据权利要求3所述的方法,其特征在于,所述将所述当前索引元素转化为预设浮点数值格式,包括:

9.根据权利要求8所述的方法,其特征在于,所述基于转化后的元素确定当前待处理元素所在插值区间的索引值,包括:

10.一种非线性层数据处理装置,其特征在于,包括:

11.根据权利要求10所述的装置,其特征在于,所述运算模块包括非线性运算模块;所述非线性运算模块,包括:

12.根据权利要求11...

【专利技术属性】
技术研发人员:请求不公布姓名请求不公布姓名
申请(专利权)人:上海寒武纪信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1