一种基于CHI协议的多核Cache共享一致性协议构建方法技术

技术编号:38923834 阅读:33 留言:0更新日期:2023-09-25 09:33
一种基于CHI协议的多核Cache共享一致性协议构建方法,属于多核Cache共享一致性协议领域。由于多核处理器的内核之间的数据交互愈加频繁,导致的共享Cache信息增多,为了提高缓存一致性协议的状态维护效率的问题。设计一种基于CHI协议的多核Cache共享一致性协议构建方法,包括:设计系统整体的拓扑结构,系统整体的拓扑结构包括RN0和RN1;设计HN的数据通路,HN的数据通路包括REQ通路、RSP通路、SNP和DAT通路;设计HN中Cache的组成结构;设计HN中Cache主要是设计Cache中L3Cache,包括Tag_SRAM和Data_SRAM,Tag_SRAM包含Tag位和Status位。本发明专利技术提高将Dirty的数据写到主存的写速度。实现跟踪每一个Cacheline的状态,根据CPUCore的读写操作及总线上的相应事务,更新Cacheline的状态维护Cache一致性。Cacheline的状态维护Cache一致性。Cacheline的状态维护Cache一致性。

【技术实现步骤摘要】
一种基于CHI协议的多核Cache共享一致性协议构建方法


[0001]本专利技术涉及Cache共享一致性协议的设计方法,特别涉及一种基于CHI协议的多核Cache共享一致性协议构建方法。

技术介绍

[0002]为了缓解处理器与存储器之间的性能差距造成的处理器中“剪刀差”的问题,在处理器架构中引入高速缓冲存储器(Cache)以进行解决。由于CPU主频的快速发展,内核的运行速度远大于主存储器的运行速度,随着制造技术的发展,CPU的性能和主存储器的性能差距越来越大。随着半导体工艺技术与集成电路产业的迅速发展,单核处理器的性能急速增长,其功耗也随之呈线性增长,“功耗墙”严重制约了处理器整体性能的提升。单核处理器的性能趋近极限促使人们试图从架构上进行突破,例如,引入并行处理的思想以提升处理器的整体性能。随着多核处理器集成的内核数量和存储架构级数的增加,Cache一致性协议的设计复杂度急剧增加,“一致性墙”问题日益严峻,为多核处理器中一致性协议的验证带来新的挑战。
[0003]在多核处理器中,把一段程序分为多个部分,由多个内核同时处理,因此在多个内本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于CHI协议的多核Cache共享一致性协议构建方法,其特征在于:所述构建方法包括:第一、设计系统整体的拓扑结构:包括RN0和RN1,两个核连接到XP上,每个XP分别连接HN和SN两个外设,对于Cache,L1Cache和L2Cache放在RN里进行管理,并且每一个RN是一个核,L3Cache放在HN中进行管理;SN存放主存,XP负责数据的转发和流控;第二、设计HN的数据通路:HN的数据通路包括REQ通路、RSP通路、SNP和DAT通路;第三、设计HN中Cache的组成结构;设计HN中Cache主要是设计Cache中L3Cache,Cache包括Tag_SRAM和Data_SRAM,二者是一一对应的,其中Tag_SRAM包含Tag位和Status位,Tag位保存物理地址,Status存放当前Cache的状态;Data_SRAM存放Cache中的数据,每个Cache_line对应Data位宽为64Byte。2.根据权利要求1所述的一种基于CHI协议的多核Cache共享一致性协议构建方法,其特征在于:所述的设计HN的数据通路的过程,具体为:首先,RN产生一个RequestFlit在REQ通路进行传输,报文的长度为131位,并且携带请求的信息,报文进入数据通路时,进入第一个SetMSHR,对访问同一个Cache_line的RequestFlit进行堵塞;之后,在RequestFlit中包括AddressFlit,CPU通过该Flit找到对应的Cache_line地址,D模块表示触发器为了实现流水延时一拍,寻找到对应的Cache_line的地址以后,进入TxnIDMSHR,RSP和DAT通路的Flit进入TxnIDMSHR,ResponseFlit的长度为66位,DATAFlit的长度为406位;之后,DECODE模块是通过解析每个通道的Flit;TxnIDMSHR对解析好的Flit进行判断,来更改Cache_line的状态和数据,将要写入L3Cache的数据写入WB_BUFFER,将要替换的Cache_line的行数通知DATA_SRAM;最后,将WB_BUFFER里面的数据写入到DATA_SRAM里面。3.根据权利要求2所述的一种基于CHI协议的多核Cache共享一致性协议构建方法,其特征在于:所述的设计HN中Cache的组成结构的过程中,L3Cache的具体设计内容为:整个L3Cache的大小为1MB,每一路的大小是16KB,寻址Cache_line中的每个字节需要使用PA[5:0],剩下的PA[15:6]用来找到一个Cache_line所在的Set,其中PA[7:6]用于选择Bank;CPU采用的Address的位宽为[43:0],Tag的位宽为[43:16];采用Directory结构,Directory包括L1和L2的Tag_SRAM,L1和L2是Inclusive策略,Directory里存放L2的Tag;L2的大小是512KB,8路组相联结构,Cache_line对应Data位宽位64Byte;HN中包括L3Cache和Directory,在RX_REQ通路中将接收到的AddressFlit进行解析,通过仲裁进入L3Cache对应的B...

【专利技术属性】
技术研发人员:郭兵王洋
申请(专利权)人:哈尔滨理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1