【技术实现步骤摘要】
本专利技术涉及微处理器
,尤其涉及。
技术介绍
随着处理器技术的进步,用户通常期望和需要他们的计算机的性能越来越高,因此处理器的数据并行能力变的尤其重要。矩阵运算广泛存在于图像和信号处理领域,转置运算在其中应用很多。现有的矩阵转置技术方案的内容是1)将待转置矩阵划分为多个小矩阵;2)将小矩阵元素输入到矢量处理器中;3)在矢量处理器中通过元素位移和交换完成小矩阵转置;4)根据转置规则吧数据送至进行变换后的内存地址中;5)将全部小矩阵组合为转置后的矩阵。这种矩阵转置技术方案由于在矢量处理器中通过元素位移和交换完成小矩阵转置,故转置处理速度比较慢,转置需要较多的处理时间。
技术实现思路
本专利技术的目的在于提出,能够有效地提高矩阵转置的执行速度。为达此目的,本专利技术采用以下技术方案,包括以下步骤A、将待转置矩阵划分为不少于1个的子矩阵;B、按顺序从一个子矩阵中每次取出一行数据;C、将取出的数据逐个放入与子矩阵列数相同数量的矢量寄存器中的、与取出的数据在子矩阵中的行数相同的列中;D、重复步骤B和步骤C,直到子矩阵中的所有行数据都放入到矢量寄存器中,再转至步骤E;E、计算子矩阵在转置后矩阵中对应的位置;F、按顺序逐个读取矢量寄存器的数据,放入到转置后矩阵中对应的位置,直到所有矢量寄存器的数据都放入到转置后矩阵中对应的位置;G、重复步骤B到步骤F,直到待转置矩阵中的数据都放入到转置后矩阵中对应的位置。步骤A中,子矩阵是8乘8矩阵。8乘8矩阵中未占满的位置补零。子矩阵与待转置矩阵等同。采用了本专利技术的技术方案,对于一个矩阵转置操作,由于去除了在矢量处理器中的元 ...
【技术保护点】
1.一种矩阵转置的方法,其特征在于,包括以下步骤:A、将待转置矩阵划分为不少于1个的子矩阵;B、按顺序从一个子矩阵中每次取出一行数据;C、将取出的数据逐个放入与子矩阵列数相同数量的矢量寄存器中的、与取出的数据在子矩阵中的行数相同的列中;D、重复步骤B和步骤C,直到子矩阵中的所有行数据都放入到矢量寄存器中,再转至步骤E;E、计算子矩阵在转置后矩阵中对应的位置;F、按顺序逐个读取矢量寄存器的数据,放入到转置后矩阵中对应的位置,直到所有矢量寄存器的数据都放入到转置后矩阵中对应的位置;G、重复步骤B到步骤F,直到待转置矩阵中的数据都放入到转置后矩阵中对应的位置。
【技术特征摘要】
1.一种矩阵转置的方法,其特征在于,包括以下步骤A、将待转置矩阵划分为不少于1个的子矩阵;B、按顺序从一个子矩阵中每次取出一行数据;C、将取出的数据逐个放入与子矩阵列数相同数量的矢量寄存器中的、与取出的数据在子矩阵中的行数相同的列中;D、重复步骤B和步骤C,直到子矩阵中的所有行数据都放入到矢量寄存器中,再转至步骤E;E、计算子矩阵在转置后矩阵中对应的位置;F、按顺序逐个读取矢量寄存器的数据,放入到转置后...
【专利技术属性】
技术研发人员:孙瑞玮,何苗平,
申请(专利权)人:江苏芯动神州科技有限公司,
类型:发明
国别省市:32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。