The present disclosure belongs to the field of computer and higher mathematics, and more specifically relates to an operation device and method. The device and method proposed in the present disclosure can realize the operation of any size matrix within a constant time complexity by using a single instruction. Comparing with the traditional operation method, it reduces the complexity of operation time and makes the operation more simple and efficient.
【技术实现步骤摘要】
运算装置及方法
本公开属于计算机、高等数学领域,更具体地涉及一种运算装置及方法。
技术介绍
矩阵转置运算是各领域中使用频率很高的一种基本数学运算,它的定义是对一个矩阵进行处理,使其行与列互相交换。当前阶段,使用计算机进行这一操作的通常方法为利用通用处理器编写两层循环,其时间复杂度为O(n^2)。这样时间复杂度的矩阵转置运算在复杂系统中会成为提高性能的瓶颈之一,尤其是在矩阵元素量很大的情况下。
技术实现思路
基于以上问题,本公开的目的在于提出一种运算装置及方法,用于解决以上技术问题的至少之一。为了达到上述目的,作为本公开的一个方面,本公开提出一种运算装置,包括地址存储模块、运算控制模块、运算模块和数据存储模块,其中:地址存储模块,用于存储运算矩阵的地址信息;数据存储模块,用于存储原始矩阵数据,并存储运算后的转置矩阵;运算控制模块,用于从地址存储模块提取运算矩阵的地址信息,并根据运算矩阵的地址信息分析得到分块信息;运算模块,用于从运算控制模块获取运算矩阵的地址信息及分块信息,根据运算矩阵的地址信息从数据存储模块提取运算矩阵,并根据分块信息对运算矩阵进行分块、转置及合并运算 ...
【技术保护点】
1.一种运算装置,包括地址存储模块、运算控制模块、运算模块和数据存储模块,其中:地址存储模块,用于存储运算矩阵的地址信息;数据存储模块,用于存储原始矩阵数据,并存储运算后的转置矩阵;运算控制模块,用于从所述地址存储模块提取所述运算矩阵的地址信息,并根据所述运算矩阵的地址信息分析得到分块信息;运算模块,用于从所述运算控制模块获取运算矩阵的地址信息及分块信息,根据所述运算矩阵的地址信息从所述数据存储模块提取运算矩阵,并根据所述分块信息对所述运算矩阵进行分块、转置及合并运算,得到所述运算矩阵的转置矩阵,并将所述运算矩阵的转置矩阵反馈至所述数据存储模块。
【技术特征摘要】
1.一种运算装置,包括地址存储模块、运算控制模块、运算模块和数据存储模块,其中:地址存储模块,用于存储运算矩阵的地址信息;数据存储模块,用于存储原始矩阵数据,并存储运算后的转置矩阵;运算控制模块,用于从所述地址存储模块提取所述运算矩阵的地址信息,并根据所述运算矩阵的地址信息分析得到分块信息;运算模块,用于从所述运算控制模块获取运算矩阵的地址信息及分块信息,根据所述运算矩阵的地址信息从所述数据存储模块提取运算矩阵,并根据所述分块信息对所述运算矩阵进行分块、转置及合并运算,得到所述运算矩阵的转置矩阵,并将所述运算矩阵的转置矩阵反馈至所述数据存储模块。2.如权利要求1所述的运算装置,其中,所述运算模块包括矩阵分块单元、矩阵运算单元和矩阵合并单元,其中:矩阵分块单元:用于从所述运算控制模块获取运算矩阵的地址信息及分块信息,并根据所述运算矩阵的地址信息从所述数据存储模块提取运算矩阵,根据所述分块信息对所述运算矩阵进行分块,得到n个分块矩阵;矩阵运算单元,用于获取所述n个分块矩阵,并对所述n个分块矩阵进行转置运算,得到所述n个分块矩阵的转置矩阵;矩阵合并单元,用于获取并合并所述n个分块矩阵的转置矩阵,得到所述运算矩阵的转置矩阵,并将所述运算矩阵的转置矩阵反馈至所述数据存储模块,其中,n为自然数。3.如权利要求2所述的运算装置,其中,所述运算模块还包括缓存单元,用于缓存所述n个分块矩阵,以供所述矩阵运算单元获取。4.如权利要求1至3中任一项所述的运算装置,其中,所述运算控制模块包括指令处理单元、指令缓存单元和矩阵判断单元,其中:指令缓存单元,用于存储待执行的矩阵运算指令;指令处理单元,用于从指令缓存单元中获取矩阵运算指令,对所述矩阵运算指令进行译码,并根据所述译码后的矩阵运算指令从所述地址存储模块中获取运算矩阵的地址信息;矩阵判断单元,用于对所述运算矩阵的地址信息进行分析,得到所述分块信息。5.如权利要求4所述的运算装置,其中,所述运算控制模块还包括依赖关系处理单元,用于判断所述译码后的矩阵运算指令和运...
【专利技术属性】
技术研发人员:不公告发明人,
申请(专利权)人:上海寒武纪信息科技有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。