【技术实现步骤摘要】
一种存内数值计算加速器及存内数值计算方法
本专利技术属于模拟电路领域,更具体地,涉及一种存内数值计算加速器及存内数值计算方法。
技术介绍
在大数据时代,传统计算机架构因计算时,大量数据在存储单元与运算单元之间传输导致在处理数据密集型任务时,运算过程产生巨大的能耗,使得使用传统计算机架构处理数据密集型任务时,运算能效非常低。基于各种非易失存储器的存算一体化架构是一种用于处理数据密集型任务的新兴计算架构,由于计算过程直接在存储器中进行,最大限度的降低了运算过程中的数据传输,使得存算一体化架构具有很高的计算能效。目前,存算一体架构已在神经形态计算领域取得了显著的成就,各种基于非易失性存储器搭建的人工神经网络证实了存算一体技术的巨大潜力。然而,同样作为一种数据密集型任务,基于非易失存储器的存算一体化技术在执行数值计算加速时,面临着不小的挑战,目前,多种基于非易失性存储器的数值计算加速电路虽然已被提出,但是这些工作大多只能处理一种或两种任务,而以线性方程组为例,线性方程组本身具有相容方程组,不相容方程组等多种形式,在应 ...
【技术保护点】
1.一种存内数值计算加速器,其特征在于,包括外部控制模块和存内计算模块;其中,所述存内计算模块包括非易失性存储器阵列;/n所述外部控制模块用于在初始阶段,将待求解任务转换成矩阵X与待求解矢量w相乘的形式;预设矢量r
【技术特征摘要】
1.一种存内数值计算加速器,其特征在于,包括外部控制模块和存内计算模块;其中,所述存内计算模块包括非易失性存储器阵列;
所述外部控制模块用于在初始阶段,将待求解任务转换成矩阵X与待求解矢量w相乘的形式;预设矢量rn,依次将矩阵X和矢量rn传输到存内计算模块中;其中,矢量rn与矢量w的维度相同;
所述存内计算模块用于在所述初始阶段,将接收到的矩阵X写入到所述非易失性存储器阵列;并在接收到矢量rn后,将其输入到所述非易失性存储器阵列中,实现矩阵X与矢量rn的乘法运算,并将所得乘法运算结果反馈给所述外部控制模块;
所述外部控制模块还用于在迭代阶段,在接收到所述存内计算模块反馈回来的乘法运算结果后,判断是否满足达到预设迭代次数或者乘法运算结果达到预设精度,若是,则当前矢量rn即为待求解矢量w,停止操作;若否,则更新矢量rn,并将其传输到所述存内计算模块中;
所述存内计算模块还用于在所述迭代阶段,当接收到当前矢量rn时,将其输入到所述非易失性存储器阵列中,实现矩阵X与矢量rn的乘法运算,并将所得乘法运算结果反馈给所述外部控制模块。
2.根据权利要求1所述的存内数值计算加速器,其特征在于,所述外部控制模块包括第一控制单元和动态随机存储器DRAM;
所述第一控制单元在初始阶段,将待求解任务转换成矩阵与矢量相乘的形式;预设矢量rn,并依次将矩阵X和矢量rn传输到存内计算模块中;在迭代阶段,当所述DRAM接收到所述存内计算模块反馈回来的乘法运算结果后,判断是否满足乘法运算结果达到预设精度或者迭代次数达到预设迭代次数,若是,则当前矢量rn即为待求解矢量w,停止操作;若否,则更新矢量rn,并将其通过所述DRAM传输到所述存内计算模块中。
3.根据权利要求1所述的存内数值计算加速器,其特征在于,所述存内计算模块包括第二控制单元和乘法运算单元;所述乘法运算单元包括数模转换器、模数转换器以及所述非易失性存储器阵列;
其中,所述第二控制单元与所述乘法运算单元相连;所述非易失性存储器阵列包括一个输入端和一个输出端;所述数模转换器与所述非易失性存储器阵列的输...
【专利技术属性】
技术研发人员:李祎,李健聪,缪向水,
申请(专利权)人:华中科技大学,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。