【技术实现步骤摘要】
本揭示涉及一种机器学习优化电路及其方法。
技术介绍
1、针对目前的机器学习技术,卷积计算往往是复杂且繁复的,这往往需要消耗大量的资源以及时间。针对此,需要在硬件或软件方面对卷积计算做出改良,以达成卷积计算的加速。然而,目前技术对于卷积计算的加速尚未成熟,仍有许多不足的部分。此外,部分和(partial sum)的数据搬运量以及数据的重用性(reuse)也是卷积计算需要进一步考量的问题。
技术实现思路
1、本揭示的一实施例揭示一种机器学习优化方法,包括:从特征张量矩阵中的获取范围产生局部特征矩阵,局部特征矩阵包含x行y列z通道的特征值;从局部特征矩阵分割出w个子特征矩阵,w个子特征矩阵各自包含x×y×z/w个特征值;利用w×k个平行运算模块对w个子特征矩阵同时进行平行内积运算以产生w×k个暂存特征矩阵,w×k个平行运算模块对应于k个核心,每个核心包含m行n列z通道的权重值,每个暂存特征矩阵包含x×y/w个特征值,平行内积运算包含:其中每个平行运算模块用以对单个核心的其中一个权重值乘上x×y×
...【技术保护点】
1.一种机器学习优化方法,包括:
2.根据权利要求1所述的机器学习优化方法,其中所述每个平行运算模块包括X×Y×K/W个乘法模块以及加法树模块,所述平行内积运算还包含:
3.根据权利要求2所述的机器学习优化方法,其中所述加法树模块包括X×Y/W个累加器模块,其中通过X×Y×K/W个所述多个乘法模块将所述其中一个子特征矩阵中的X×Y×Z/W个特征值与所述单个核心的所述其中一个权重值进行元素与元素之间乘法运算以产生X×Y×K/W个所述多个乘积值的步骤包括:
4.根据权利要求1所述的机器学习优化方法,其中将W×K个所述多个暂存特征矩阵整合
...【技术特征摘要】
1.一种机器学习优化方法,包括:
2.根据权利要求1所述的机器学习优化方法,其中所述每个平行运算模块包括x×y×k/w个乘法模块以及加法树模块,所述平行内积运算还包含:
3.根据权利要求2所述的机器学习优化方法,其中所述加法树模块包括x×y/w个累加器模块,其中通过x×y×k/w个所述多个乘法模块将所述其中一个子特征矩阵中的x×y×z/w个特征值与所述单个核心的所述其中一个权重值进行元素与元素之间乘法运算以产生x×y×k/w个所述多个乘积值的步骤包括:
4.根据权利要求1所述的机器学习优化方法,其中将w×k个所述多个暂存特征矩阵整合为与所...
【专利技术属性】
技术研发人员:蔡介夫,杨家骧,杜承谚,
申请(专利权)人:台达电子工业股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。