一种处理访存请求的方法和节点控制器技术

技术编号:12356330 阅读:275 留言:0更新日期:2015-11-20 11:40
本发明专利技术公开了一种处理访存请求的方法和节点控制器,该方法包括以下步骤:第一节点控制器接收来自第一处理器的访存请求;所述第一节点控制器将所述访存请求转发给与所述访存请求对应的处理器,并接收与所述访存请求对应的处理器返回的访存应答;所述第一节点控制器将所述访存应答发送给所述第一处理器,接收所述第一处理器返回的一致性状态信息,并对来自所述第一处理器的一致性状态信息进行记录。本发明专利技术能够减少节点控制器的数量,进而减少节点控制器所占内存空间,降低节点间互连规模,简化节点间拓扑,提升系统性能,对于互连端口数目和能够支持的域内处理器ID数量非常有限的处理器而言,效果更加显著。

【技术实现步骤摘要】

本专利技术涉及计算机
,具体涉及一种处理访存请求的方法和节点控制器
技术介绍
随着计算机技术的迅速发展,大规模的CC-NUMA(Cache Coherent Non-UniformMemory Access,缓存一致性非一致内存访问)系统的应用日益广泛。CC-NUMA系统包括多个节点,每个节点由处理器和节点控制器构成,其中,节点控制器用于扩展系统规模以及维护全局缓存的一致性,即,需要同时维护各节点逻辑域间以及节点内各物理域间的缓存一致性。现有技术中,每个节点内的缓存一致性域由一颗处理器和一个节点控制器构成。例如,若构建一个由64颗仅支持域内2个处理器ID的处理器组成的CC-NUMA系统,每个处理器对应L个缓存行,必须使用至少64个节点控制器,每个节点控制器的RP(RemoteProxy,远端内存代理)和LP (Local Proxy,本地内存代理)的目录项分别为:2bit+lbit=3bit、2bit+63bit = 65bit,节点控制器的目录项共占 63*L* (3bit+65bit) *64 =274176Lbit = (267.75L)Kb。因此,现有技术增加了跨域处理和域间通信的开销,导致访问远端内存的显著下降,且系统规模越大,访问远端内存的下降越明显。
技术实现思路
本专利技术提供了一种处理访存请求的方法和节点控制器,以解决现有技术中跨域处理和域间通信的开销较大的缺陷。本专利技术提供了一种处理访存请求的方法,包括以下步骤:第一节点控制器接收来自第一处理器的访存请求;所述第一节点控制器将所述访存请求转发给与所述访存请求对应的处理器,并接收与所述访存请求对应的处理器返回的访存应答;所述第一节点控制器将所述访存应答发送给所述第一处理器,接收所述第一处理器返回的一致性状态信息,并对来自所述第一处理器的一致性状态信息进行记录。可选地,与所述访存请求对应的处理器为本地节点中的第二处理器;所述第一节点控制器将所述访存请求转发给与所述访存请求对应的处理器,具体为:所述第一节点控制器中的LP向所述第二处理器转发所述访存请求。可选地,所述第一节点控制器中的LP向所述第二处理器转发所述访存请求之后,还包括:所述第一节点控制器中的LP接收所述第二处理器返回的一致性状态信息,对来自所述第二处理器的一致性状态信息进行记录。可选地,与所述访存请求对应的处理器为远端节点中的第三处理器;所述第一节点控制器将所述访存请求转发给与所述访存请求对应的处理器,并接收与所述访存请求对应的处理器返回的访存应答,具体为:所述第一节点控制器中的RP通过第二节点控制器向所述第三处理器转发所述访存请求,并通过所述第二节点控制器接收所述第三处理器返回的访存应答,所述第二节点控制器为所述远端节点中的节点控制器。可选地,所述第一节点控制器接收所述第一处理器返回的一致性状态信息之后,还包括:所述第一节点控制器将来自所述第一处理器的一致性状态信息发送给所述第二节点控制器。可选地,所述第一节点控制器将所述访存请求转发给与所述访存请求对应的处理器之前,还包括:所述第一节点控制器对所述访存请求对应的处理器进行判断。可选地,所述第一节点控制器对访存请求对应的处理器进行判断,具体为:所述第一节点控制器查询自身存储的目录,如果在LP中查找到所述访存请求对应的信息,则确定所述访存请求对应的处理器为本地节点中的第二处理器;如果在RP中查找到所述访存请求对应的信息,则确定所述访存请求对应的处理器是远端节点中的第三处理器。本专利技术还提供了一种节点控制器,包括:第一接收模块,用于接收来自第一处理器的访存请求;第一收发模块,用于将所述第一接收模块接收到的所述访存请求转发给与所述访存请求对应的处理器,并接收与所述访存请求对应的处理器返回的访存应答;第二收发模块,用于将所述第一收发模块接收到的所述访存应答发送给所述第一处理器,接收所述第一处理器返回的一致性状态信息;第一记录模块,用于对所述第二收发模块接收到的来自所述第一处理器的一致性状态?目息进彳T记录。可选地,与所述访存请求对应的处理器为本地节点中的第二处理器。可选地,所述的节点控制器,还包括:第二接收模块,用于接收所述第二处理器返回的一致性状态信息;所述记录模块,还用于对来自所述第二处理器的一致性状态信息进行记录。可选地,与所述访存请求对应的处理器为远端节点中的第三处理器;所述第一收发模块,具体用于通过所述远端节点中的节点控制器向所述第三处理器转发所述访存请求,并通过所述远端节点中的节点控制器接收所述第三处理器返回的访存应答。可选地,所述的节点控制器,还包括:第一发送模块,用于将所述第二收发模块接收到的来自所述第一处理器的一致性状态信息发送给所述第二节点控制器。可选地,所述的节点控制器,还包括:判断模块,用于对所述第一接收模块接收到的访存请求对应的处理器进行判断。可选地,所述的节点控制器,还包括:存储模块,用于存储目录;所述判断模块,具体用于查询所述存储模块存储的目录,如果在LP中查找到所述访存请求对应的信息,则确定所述访存请求对应的处理器为本地节点中的第二处理器;如果在RP中查找到所述访存请求对应的信息,则确定所述访存请求对应的处理器是远端节点中的第三处理器。本专利技术能够减少节点控制器的数量,进而减少节点控制器所占内存空间,降低节点间互连规模,简化节点间拓扑,提升系统性能,对于互连端口数目和能够支持的域内处理器ID数量非常有限的处理器而言,效果更加显著。【附图说明】图1为本专利技术实施例中的一种节点系统的结构示意图;图2为本专利技术实施例中的一种节点的结构示意图;图3为本专利技术实施例中的另一种节点的结构示意图;图4为本专利技术实施例中的一种处理访存请求的方法流程图;图5为本专利技术实施例中的RP中存储的目录的结构示意图;图6为本专利技术实施例中的LP中存储的目录的结构示意图;图7为本专利技术实施例中的一种节点控制器的结构示意图。【具体实施方式】下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,如果不冲突,本专利技术实施例以及实施例中的各个特征可以相互结合,均在本专利技术的保护范围之内。另外,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。本专利技术实施例提供了一种处理访存请求的方法,应用与包括多个节点的系统,如图1所示,每个节点为一个逻辑域,包括一个节点控制器、多个处理器以及与归属于各个处理器的缓存,每个处理器以及归属于该处理器的缓存组成一个物理子域,不同物理子域之间彼此隔离,通过节点控制器连接。每个节点控制器同与其相连的处理器组成节点内物理缓存一致性域,各个节点控制器处于同一层次,并通过域间互连网络进行级联。处理器可以通过节点控制器访问本地节点中的其他处理器,也可以通过节点控制器访问远端节点中的处理器。本实施例中的多节点系统包括第一节点和第二节点,第一节点包括第一节点控制器、第一处理器和第二处理器,如图2所示,第二节点包括第二节点控制器、第三处理器和第四处理器,如图3所示。第一本文档来自技高网...
一种处理访存请求的方法和节点控制器

【技术保护点】
一种处理访存请求的方法,其特征在于,包括以下步骤:第一节点控制器接收来自第一处理器的访存请求;所述第一节点控制器将所述访存请求转发给与所述访存请求对应的处理器,并接收与所述访存请求对应的处理器返回的访存应答;所述第一节点控制器将所述访存应答发送给所述第一处理器,接收所述第一处理器返回的一致性状态信息,并对来自所述第一处理器的一致性状态信息进行记录。

【技术特征摘要】

【专利技术属性】
技术研发人员:赵雅倩倪璠史宏志李一韩陈继承
申请(专利权)人:浪潮北京电子信息产业有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1