由图形处理器改进的成组存储器存取效率制造技术

技术编号：13941094 阅读：53 留言：0更新日期：2016-10-29 15:56

将结构阵列(AOS)转换成阵列结构(SOA)改进了从AOS到SOA的传送效率。可使用类似技术有效地从SOA转换成AOS。执行转换的控制器将分区大小计算为第一存储器装置中的组的数量与AOS中结构的结构大小之间的最高公因子，并基于分区大小而不是结构大小传送数据。控制器可从多个不同结构读取分区大小数量的元素以确保对于每次传送都使用全数据传送带宽。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术的实施例一般涉及存储器结构，并且更具体地说，涉及改进存储器总线带宽利用以获取存储器结构。版权声明/许可此专利文档的公开部分可含有受到版权保护的资料。版权拥有人不反对任何人复制该专利文档或专利公开，因为它出现在专利和商标局专利文件或记录中，但以其它方式无论什么都保留所有版权权利。版权声明应用于下面所描述的所有数据，并且在所附的附图中，以及应用于下面描述的任何软件：版权© 2014，英特尔公司，保留所有权利。
技术介绍
大多数电子系统包含某种类型的处理器。处理器可用不同架构制作，并且架构可影响处理器在执行某些处理任务时如何有效。例如，通用处理器倾向于具有一个或小量处理核，并且对于串行处理任务最有效。其它类型处理器可具有许多处理单元，并且在并行处理许多较小任务时更有效。结构阵列（AOS）是供软件使用的方便数据格式，软件可方便地存储在存储器中以便串行运行。然而，阵列结构（SOA）是更方便用于有效并行运行的数据格式。从而，两个不同格式各自更好地适合于不同处理器架构。在许多计算系统中，存在从AOS转换到SOA和/或从SOA转换到AOS的理由。传统上，AOS与SOA之间的转换基于底层数据结构的大小。从而，转换中的总线利用或传送带宽利用取决于底层结构大小，其导致系统资源（总线带宽）上的性能降级或功率损耗，系统资源倾向于受约束，甚至在AOS到SOA转换中没有引入无效的情况下。附图说明如下描述包含具有作为实现本专利技术实施例的示例给出的图示的附图的论述。附图应该作为示例而非作为限制进行理解。如本文所使用的，对一个或多个“实施例”的提及要理解为描述包含在本专利技术至...

【技术保护点】
一种用于存取成组存储器的方法，包括：计算第一存储器装置中的组的数量与结构阵列中的结构的结构大小之间的最高公因子，其中所述最高公因子不同于所述结构的结构大小；将分区大小值设置成所述计算的最高公因子；计算等于所述组的数量除以所述分区大小的移位值；在一个操作循环中从等于所述移位值的若干结构中读取等于所述分区大小的若干元素；在所述一个操作循环中将读取的所述元素传送到具有与所述第一存储器装置相等的组的数量的第二存储器装置中的阵列结构；以及在随后操作循环中继续所述读取和传送，直到所述结构阵列的所有元素都被传送到所述阵列结构。

【技术特征摘要】
【国外来华专利技术】2014.04.09 US 14/2491541.一种用于存取成组存储器的方法，包括：计算第一存储器装置中的组的数量与结构阵列中的结构的结构大小之间的最高公因子，其中所述最高公因子不同于所述结构的结构大小；将分区大小值设置成所述计算的最高公因子；计算等于所述组的数量除以所述分区大小的移位值；在一个操作循环中从等于所述移位值的若干结构中读取等于所述分区大小的若干元素；在所述一个操作循环中将读取的所述元素传送到具有与所述第一存储器装置相等的组的数量的第二存储器装置中的阵列结构；以及在随后操作循环中继续所述读取和传送，直到所述结构阵列的所有元素都被传送到所述阵列结构。2.如权利要求1所述的方法，其中所述第一存储器装置和所述第二存储器装置是单个共享存储器装置的不同部分。3.如权利要求1所述的方法，其中将读取的所述元素传送到阵列结构进一步包括：计算等于所述组的数量的基数的取模运算以确定在所述阵列结构中的位置，其中传送所述元素到所述阵列结构中的所述位置。4.如权利要求1所述的方法，其中将读取的所述元素传送到阵列结构进一步包括：运行单指令多数据(SIMD)操作以传送读取的所述元素。5.如权利要求1所述的方法，其中将读取的所述元素传送到所述阵列结构包括将读取的元素从与主机处理器关联的结构阵列传送到与图形处理器关联的阵列结构。6.如权利要求1所述的方法，进一步包括：移位传送到所述阵列结构的所述数据元素以将公共结构的元素对准到公共组。7.一种用于存取成组存储器的设备，包括：具有若干组的第一存储器装置，用于按结构阵列格式存储数据元素；具有若干组的第二存储器装置，用于按阵列结构格式存储数据元素；以及控制器装置，用于将所述数据元素从所述第一存储器装置传送到所述第二存储器装置，包含所述控制器装置配置成执行如下操作：计算所述第一存储器装置中的所述组的数量与所述结构阵列中的结构的结构大小之间的最高公因子，其中所述最高公因子不同于所述结构的结构大小；将分区大小值设置成所述计算的最高公因子；计算等于所述组的数量除以所述分区大小的移位值；在一个操作循环中从等于所述移位值的若干结构中读取等于所述分区大小的若干元素；在所述一个操作循环中将读取的所述元素传送到所述第二存储器装置中的所述阵列...

【专利技术属性】
技术研发人员：S帕尔，M孙达雷桑，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人