【技术实现步骤摘要】
本专利技术涉及高速緩存一致性(Cache coherence)机制,并且尤 其涉及利用基于环的侦测响应收集(ring-based snoop response collection )在基于网络的多处理器系统中的高速緩存一致性。
技术介绍
对称多处理器(SMP)系统采用高速緩存一致性机制以确保 高速緩存一致性。基于侦测的高速緩存一致性是实现SMP系统的高速 緩存一致性的典型方案。利用基于侦测的高速緩存一致性,当高速緩 存缺失(Cache Miss)发生时,请求高速緩存向其对等的高速緩存广 播高速緩存请求。适当的高速緩存侦测过滤机制用于减少由高速緩存 一致性消息和高速緩存侦测操作造成的开销。通常,在基于总线的 SMP系统中实现基于侦测的高速緩存一致性,在该SMP系统中高速緩 存经由共享总线互相通信。为避免潜在的通信瓶颈,现代SMP系统通 常使用消息传递网络,而不是在物理上共享的总线。此类SMP系统被 称为基于网络的SMP系统。现在参照图l,示出了一个示例性高速緩存一致性多处理器系统,其包括经由节点间互连网络互连的多个节点,其中每个节点包括中央处理单元(CPU)和高速緩存。同样连接到该节点间互连网络上的是存储器和输入/输出(IO)设备。虽然存储器被描述成一个部件,但是存储器可被物理地分成多个存储器部分,其中每个存储器部分在 操作上与节点相关。现在参照图2,示出了另一个示例性高速緩存一致性多处理器系 统,其包括经由节点间互连网络互连的多个节点,其中每个节点包括 芯片多处理器(CMP)子系统。每个CMP子系统包括一个或多个能够经由节点内结构互相通信的高速緩存。存 ...
【技术保护点】
一种用于实施高速缓存一致性的计算机实现的方法,包括:通过网络无需排序限制地从请求节点多播对于存储器地址的高速缓存请求;通过嵌入所述网络中的单向环,由所述请求节点收集所述高速缓存请求的组合侦测响应;以及根据所述组合侦测响应,在所述请求节点处实施所述存储器地址的高速缓存一致性。
【技术特征摘要】
1.一种用于实施高速缓存一致性的计算机实现的方法,包括通过网络无需排序限制地从请求节点多播对于存储器地址的高速缓存请求;通过嵌入所述网络中的单向环,由所述请求节点收集所述高速缓存请求的组合侦测响应;以及根据所述组合侦测响应,在所述请求节点处实施所述存储器地址的高速缓存一致性。2. 如权利要求l所述的计算机实现的方法,进一步包括 通过所述网络将所述存储器地址的数据提供给所述请求节点; 在由所述请求节点收集所述高速緩存请求的所述侦测响应之前,使用在所述请求节点处的所述数据;以及在接收到所述高速緩存请求的数据和侦测响应后,完成在所述请 求节点处的所述高速緩存请求。3. 如权利要求2所迷的计算机实现的方法,进一步包括 在侦测节点处从所述请求节点接收所述高速緩存请求; 在所述侦测节点处执行本地高速緩存侦测操作,并且产生所述高速緩存请求的LSR (本地侦测响应);以及为了后续处理在所述侦测节点处记录所述LSR。4. 如权利要求2所述的计算机实现的方法,进一步包括 在侦测节点处从所述请求节点接收所述高速緩存请求;在所述侦测节点处执行本地高速緩存侦测操作,并且产生所述高 速緩存请求的LSR (本地侦测响应);基于来自在前节点的所述高速緩存请求的所述LSR以及在前 PCSR,确定所述高速緩存请求的新PCSR (部分组合侦测响应),其 中在嵌入所述网络中的单向环中所述在前节点在所述侦测节点之前; 以及通过嵌入所述网络中的所述单向环,将来自所述侦测节点的所述 高速緩存请求的所述新PCSR转发给后续节点,其中在嵌入所述网络 中的所述单向环中所述后续节点在所述侦测节点之后。5. 如权利要求2所述的计算机实现的方法,进一步包括 在侦测节点处从在前节点接收在前PCSR(部分组合侦测响应),其中在嵌入所述网络中的所述单向环中所述在前节点在所述侦测节 点之前;以及为了后续处理在所述侦测节点处记录所述在前PCSR。6. 如权利要求2所述的计算机实现的方法,进一步包括 在侦测节点处从在前节点接收在前PCSR(部分组合侦测响应),其中在嵌入所述网络中的所述单向环中所述在前节点在所述侦测节 点之前;基于所述高速緩存请求的所述在前PCSR和先前记录的LSR (本 地侦测响应),确定所述高速緩存请求的新PCSR;以及通过嵌入所述网络中的所述单向环,将来自所述侦测节点的所述 高速緩存请求的所述新PCSR转发给后续节点,其中在嵌入所述网络 中的所述单向环中所述后续节点在所述侦测节点之后,7,如权利要求2所述的计算机实现的方法,进一步包括 在侦测节点处从在前节点接收在前PCSR (部分组合侦测响应)和侦测列表,其中所述侦测列表包括针对所述高速緩存请求需要被侦测的至少一个节点;以及如果所述侦测节点被包含在所述侦测列表中,则在所述侦测节点处为后续处理记录所述在前PCSR。8. 如权利要求2所述的计算机实现的方法,进一步包括 在侦测节点处从在前节点接收在前PCSR (部分组合侦测响应)和侦测列表,其中所述侦测列表包括针对所述高速緩存请求需要被侦 测的至少一个节点;以及如果所述侦测节点没有被包含在所述侦测列表中,则通过嵌入所 述网络中的所述单向环,将所述在前PCSR和所述侦测列表转发给后 续节点。9. 如权利要求2所述的计算机实现的方法,进一步包括 在侦测节点处从在前节点接收在前PCSR (部分组合侦测响应)和侦测列表,其中所述侦测列表包括针对所述高速緩存请求需要被侦 测的至少一个节点;基于所述高速緩存请求的所述在前PCSR和先前记录的LSR (本 地侦测响应),确定所述高速緩存请求的新PCSR;以及通过嵌入所述网络中的所述单向环,将来自所述侦测节点的所述 高速緩存请求的所述新PCSR和所述侦测列表转发给后续节点。10. 如权利要求2所述的计算机实现的方法,其中,将所述数据 提供给所述请求节点的步骤包括提供来自侦测节点的所述数据或提 供来自存储器的所述数据中的一个。11. 如权利要求l所述的计算机实现的方法,其中对于所述存储 器地址的高速緩存请求为数据请求、数据和所有权请求或所有权请 求。12. 如权利要求l所述的计算机实现的方法,进一步包括 通过所述网络无需排序限制地多播来自所述请求节点的、对于第二存储器地址的第二高速緩存请求;通过嵌入所述网络中的第二单向环,由所述请求节点收集所述第 二高速緩存请求的第二组合侦测响应;以及根据所述第二组合侦测响应,在所述请求节点处实施所述第二存...
【专利技术属性】
技术研发人员:沈晓卫,卡里恩·施特劳斯,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。