当前位置: 首页 > 专利查询>北京大学专利>正文

注意力机制神经网络的向量内积运算处理方法及装置制造方法及图纸

技术编号:41282292 阅读:21 留言:0更新日期:2024-05-11 09:32
本发明专利技术提供一种注意力机制神经网络的向量内积运算处理方法及装置,应用于非易失存储器阵列,所述方法包括:获取第一待计算向量的属性信息,其中,属性信息用于表征第一待计算向量的维度大小和位宽;确定定点数最小位权所对应的电导值;基于第一待计算向量的属性信息和电导值,将第一待计算向量的位权值预存至非易失存储器阵列;基于电导值和所述位权值,对第一待计算向量和第二待计算向量进行向量内积计算,得到第一待计算向量和第二待计算向量的向量内积运算结果,其中,第一待计算向量和第二待计算向量为注意力机制神经网络中的待计算向量。本发明专利技术消除对非易失存储器的编程操作,从而提高计算速度以及减少能耗开销。

【技术实现步骤摘要】

本专利技术涉及半导体,尤其涉及一种注意力机制神经网络的向量内积运算处理方法及装置


技术介绍

1、基于注意力机制的神经网络能够有效地处理语音和图片数据,在物联网、自动驾驶、人机交互等领域应用广泛。区别于传统的卷积神经网络(cnn)和循环神经网络(rnn),基于注意力机制的神经网络不仅包含大量向量矩阵乘运算,也包含大量两输入向量间的内积运算。

2、相关技术可知,针对两输入向量间的内积,传统的方法需要首先将其中一个变量存储到阵列中,再进行计算。由于非易失存储器编程时间长,能耗高的特点,此方法存在延时和能耗开销大的问题。

3、因此,当前寻找一种能够提高计算速度以及减少能耗开销的注意力机制神经网络的向量内积运算处理方法成为研究热点。


技术实现思路

1、本专利技术提供一种注意力机制神经网络的向量内积运算处理方法及装置,实现了能够消除对非易失存储器的编程操作,从而提高计算速度以及减少能耗开销。

2、本专利技术提供一种注意力机制神经网络的向量内积运算处理方法,应用于非易失存储器阵列,所述本文档来自技高网...

【技术保护点】

1.一种注意力机制神经网络的向量内积运算处理方法,其特征在于,应用于非易失存储器阵列,所述方法包括:

2.根据权利要求1所述的注意力机制神经网络的向量内积运算处理方法,其特征在于,所述非易失存储器阵列包括多个阵列单元以及所述阵列单元之间的互联线,所述互联线包括位线、字线和源线,所述位线与所述字线呈平行关系,且与所述源线呈垂直关系;

3.根据权利要求2所述的注意力机制神经网络的向量内积运算处理方法,其特征在于,所述基于所述电导值,控制所述第一待计算向量以电压脉冲方式施加至所述字线,以及控制第二待计算向量以电压脉冲方式施加至所述位线,得到所述非易失存储器阵列中各行的乘...

【技术特征摘要】

1.一种注意力机制神经网络的向量内积运算处理方法,其特征在于,应用于非易失存储器阵列,所述方法包括:

2.根据权利要求1所述的注意力机制神经网络的向量内积运算处理方法,其特征在于,所述非易失存储器阵列包括多个阵列单元以及所述阵列单元之间的互联线,所述互联线包括位线、字线和源线,所述位线与所述字线呈平行关系,且与所述源线呈垂直关系;

3.根据权利要求2所述的注意力机制神经网络的向量内积运算处理方法,其特征在于,所述基于所述电导值,控制所述第一待计算向量以电压脉冲方式施加至所述字线,以及控制第二待计算向量以电压脉冲方式施加至所述位线,得到所述非易失存储器阵列中各行的乘法电流,具体包括:

4.根据权利要求2或3所述的注意力机制神经网络的向量内积运算处理方法,其特征在于,所述将所述乘法电流进行求和,得到求和后乘法电流,具体包括:

5.根据权利要求2或3所述的注意力机制神经网络的向量内积运算处理方法,其特征在于,在所述基于所述位权值...

【专利技术属性】
技术研发人员:刘力锋陈依扬周正黄鹏康晋锋张兴
申请(专利权)人:北京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1