【技术实现步骤摘要】
本公开涉及数据传输,尤其涉及一种cpu、gpu系统、电子组件、电子设备及数据传输方法。
技术介绍
1、在异构计算等应用场景中,通常采用gpu(graphics processing unit,图形处理器)进行辅助计算,以提升计算速度。在利用gpu进行辅助计算时,将需要计算的数据从主机对应的内存拷贝至gpu对应的显存中;在gpu完成计算后,再将计算结果从gpu对应的显存拷贝至主机对应的内存中。
2、gpu显存和主机内存之间在拷贝一些小字节数据时,通常采用内存复制函数memcpy进行处理。采用memcpy函数拷贝数据时,需要通过pci-e总线进行数据传输,因而会产生很多pci-e总线的事务,导致数据拷贝速度较慢,影响gpu的性能。并且,对于一些主机无法访问的gpu私有内存,不能通过memcpy函数进行数据拷贝。
技术实现思路
1、本公开的目的是提供一种cpu、gpu系统、电子组件、电子设备及数据传输方法,以提升gpu显存和cpu内存之间的数据拷贝速度,并解决不能通过memcpy函数
...【技术保护点】
1.一种CPU,包括:
2.根据权利要求1所述的CPU,所述待传输数据为存放在所述GPU显存中的指令,所述传输控制模块包括:
3.根据权利要求1所述的CPU,所述待传输数据为存放在所述主机内存中的数据,所述传输控制模块包括:
4.根据权利要求1至3任一项所述的CPU,所述DMA结构体包括所述待传输数据的大小、所述待传输数据的源地址和所述待传输数据的目的地址。
5.一种GPU系统,包括GPU显存、共享内存、MCU以及XDMA模块,所述共享内存、所述MCU以及所述XDMA模块被配置为传输主机内存和所述GPU显存之间的待传输数
6...
【技术特征摘要】
1.一种cpu,包括:
2.根据权利要求1所述的cpu,所述待传输数据为存放在所述gpu显存中的指令,所述传输控制模块包括:
3.根据权利要求1所述的cpu,所述待传输数据为存放在所述主机内存中的数据,所述传输控制模块包括:
4.根据权利要求1至3任一项所述的cpu,所述dma结构体包括所述待传输数据的大小、所述待传输数据的源地址和所述待传输数据的目的地址。
5.一种gpu系统,包括gpu显存、共享内存、mcu以及xdma模块,所述共享内存、所述mcu以及所述xdma模块被配置为传输主机内存和所述gpu显存之间的待传输数据。
6.一种电子组件,包括主机内存、权利要求1至4任一项所述的cpu以及权利要求5所述的gpu系统。
7.一种电子设备,包括权利要求6所述的电子组件。
8.一种数据传输方法,包括:
9.根据权利要求8所述的数据传输方法,所述待传输数据为存放在所述gpu显存中的指令,所述控制主机内存和gpu显存之间通过共享内存、mcu以及xdma模块传输所述待传输数据,包括:
10.根据权利要求8所述的数据传输方法,所述待传输数据为存放在所述主机内存中的数据,所述控制主机内存和gpu显存之间通过共享内存、mcu以及xdma模块传输所述待传输数据,包括:
11.根据权利要求8至10任一项所述的数据传输方法,所述dma结构体包括所述待传输数据的大小、所述待传输数据的源地址和所述待传输数据的目的地址。
12.一种cpu,包括:
13.根据权利要求12所述的cpu,还包括:
14.根据权利要求12所述的cpu,所述数据封装模块还被配置为在所述待传输数据满足dma传输方式的对齐要求时,针对所述待传输数据封装第三dma结构体;
15.根据权利要求14所述的cpu,所述第三dma...
【专利技术属性】
技术研发人员:朱世杰,李小波,
申请(专利权)人:象帝先计算技术重庆有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。