【技术实现步骤摘要】
一种GPU板卡、GPU互连系统及地址转换方法
[0001]本申请地址翻译领域,具体而言本申请实施例涉及一种GPU板卡、GPU互连系统及地址转换方法。
技术介绍
[0002]为满足日益增长的算力需求,系统中通常需要配置多张GPU板块,板卡间多采用专用的高速链接互联组成GPU互连系统,通过高速链接可以实现GPU间的高速访问,降低延迟。GPU互连系统上的一个GPU板卡访问另一个GPU板卡的过程称之为peer to peer访问,简称P2P。按P2P访问时发出的地址类型分类,可将地址翻译过程分为本地地址翻译和远端地址翻译。
技术实现思路
[0003]本申请实施例的目的在于提供一种GPU板卡、GPU互连系统及地址转换方法,本申请的一些实施例通过在互连的GPU板卡上引入了页表缓存及地址转换模块RMMU,实现GPU页表在各GPU板卡间自动更新和同步,避免了在各个GPU板卡上的显存上“到处”建页表的问题,本申请的一些实施例还通过页表缓存及地址转换模块RMMU实现页表缓存功能,有效解除了板卡间的强依赖关系,让多卡系统变得简单灵 ...
【技术保护点】
【技术特征摘要】
1.一种GPU板卡,其特征在于,所述GPU板卡上包括:显存,用于存储属于本GPU板卡的页表数据;页表缓存及地址转换模块,被配置为缓存来自于GPU互连系统包括的除所述本板卡以外的其它GPU板卡的页表数据,并在需要访问所述其它板卡时根据所述其它GPU板卡的页表数据完成地址转换。2.如权利要求1所述的GPU板卡,其特征在于,所述GPU板卡还包括:内存管理模块,被配置为若需要所述显存数据时根据所述显存上存储的页表数据完成地址转换。3.如权利要求1
‑
2任一项所述的GPU板卡,其特征在于,所述GPU板卡还包括:GPU,被配置为执行运算并生成用于访问所述显存或者访问所述其它GPU板卡上显存的虚拟地址;其中,所述页表缓存及地址转换模块被配置为根据所述虚拟地址完成地址转换,或者,所述内存管理模块被配置为根据所述虚拟地址完成地址转换。4.如权利要求1所述的GPU板卡,其特征在于,所述GPU板卡和所述其它GPU板卡之间是独立调度的。5.一种GPU互连系统,其特征在于,所述GPU互连系统包括多个互连GPU板卡,其中,所述多个互连GPU板卡上的每个GPU板卡包括:显存,用于存储属于本板卡的页表数据;页表缓存及地址转换模块,被配置为缓存来自于GPU互连系统包括的除所述本板卡以外的其它GPU板卡的页表数据,并在需要访问所述其它板卡时根据所述其它GPU板卡的页表数据完成地址转换。6.如权利要求5所述的GPU互连系统,其特征在于,所述每个GPU板卡还包括:内存管理模块,被配置为若需要所述显存数据时根据所述显存上存储的页表数据完成地址转换。7.如权利要求5所述的GPU互连系统,其特征在于,所述每个GPU板卡还包括:GPU,被配置为执行运算并生成用于访问所述显存或者访问所述其它GPU板卡上显存的虚拟地址;其中,...
【专利技术属性】
技术研发人员:叶敬茂,郑成根,
申请(专利权)人:上海天数智芯半导体有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。