【技术实现步骤摘要】
CUDA异构平台中的数据处理方法及设备
本专利技术实施例涉及超声成像
,尤其涉及一种CUDA异构平台中的数据处理方法及设备。
技术介绍
超声成像技术是通过超声换能器向待检测物体发出超声波并接受从待检测物体返回来的回波,利用超声波的物理特征与被检测物体在声学性质上存在的差异,从而绘制出待检测物体内部的形态学信息的技术。三维超声成像能够直观地显示物体的特征,为医生在临床诊断中做出精准的诊断与合理的治疗方案提供了有效的辅助,方便医生对病情进行诊断。但三维超声成像是对整个三维体数据进行处理,在计算量和数据量上都远远大于二维超声成像。传统的利用CPU计算的方法成像速度较慢、实时性差,严重影响了三维超声成像系统的发展。近年来,随着人们对计算性能要求的不断提高,基于GPU的计算机并行技术得到了飞速发展。GPU通用计算通常采用CPU+GPU的异构模式,作为主机的CPU负责执行复杂逻辑处理和事务处理等不适合数据并行的计算,而作为设备的GPU负责计算密集型的大规模数据并行计算。由于GPU在处理能力和存储器带宽上相对于CPU有明显优势,GPU可以弥补CPU性能上的不足,从而充分发 ...
【技术保护点】
1.一种CUDA异构平台中的数据处理方法,其特征在于,包括:针对存储在主机存储模块中的数据的若干子数据,根据主机向设备发送数据的时长,核函数执行时长,以及设备向主机发送数据的时长,将第一CUDA流传输的所述若干子数据中的第一子数据,与第二CUDA流传输的所述若干子数据中的第二子数据,进行交叉传输,完成所述第一子数据和第二子数据的处理;针对所述若干子数据中剩余的子数据,采用所述交叉传输的方式,完成所述数据的处理;其中,所述数据被分成所述若干子数据。
【技术特征摘要】
1.一种CUDA异构平台中的数据处理方法,其特征在于,包括:针对存储在主机存储模块中的数据的若干子数据,根据主机向设备发送数据的时长,核函数执行时长,以及设备向主机发送数据的时长,将第一CUDA流传输的所述若干子数据中的第一子数据,与第二CUDA流传输的所述若干子数据中的第二子数据,进行交叉传输,完成所述第一子数据和第二子数据的处理;针对所述若干子数据中剩余的子数据,采用所述交叉传输的方式,完成所述数据的处理;其中,所述数据被分成所述若干子数据。2.根据权利要求1所述的CUDA异构平台中的数据处理方法,其特征在于,所述若干子数据存储在主机存储模块的页锁定内存中。3.根据权利要求1所述的CUDA异构平台中的数据处理方法,其特征在于,所述根据主机向设备发送数据的时长,核函数执行时长,以及设备向主机发送数据的时长,将第一CUDA流传输的所述若干子数据中的第一子数据,与第二CUDA流传输的所述若干子数据中的第二子数据,进行交叉传输,完成所述第一子数据和第二子数据的处理,包括:将主机向设备发送数据的时长与设备向主机发送数据的时长进行比较,获取时长较小值,若所述核函数执行时长小于所述时长较小值,则第一CUDA流向设备传输第一子数据,在第二CUDA流向设备传输第二子数据的同时,设备对第一子数据执行核函数,在第一CUDA流向主机返回执行过核函数的第一子数据的同时,设备对第二子数据执行核函数,最后第二CUDA流向主机返回执行过核函数的第二子数据。4.根据权利要求1所述的CUDA异构平台中的数据处理方法,其特征在于,所述根据主机向设备发送数据的时长,核函数执行时长,以及设备向主机发送数据的时长,将第一CUDA流传输的所述若干子数据中的第一子数据,与第二CUDA流传输的所述若干子数据中的第二子数据,进行交叉传输,完成所述第一子数据和第二子数据的处理,包括:若所述核函数执行时长,大于等于所述主机向设备发送数据的时长,小于等于设备向主机发送数据的时长,则第一CUDA流向设备传输第一子数据,在设备对第一子数据执行核函数的同时,第二CUDA流向设备传输第二子数据,在第一CUDA流向主机返回执行过核函数的第一子数据的同时,设备对第二子数据执行核函数,最后第二CUDA流向主机返回执行过核函数的第二子数据。5.根据权利要求1所述的CUDA异构平台中的数据处理方法,其特征在于,所述根据主机向设备发送数据的时长,核函数执行时长,以及设备向主机发送数据的时长,将第一CUDA流传输的所述若干子数据中的第一子数据,与第二CUDA流传输的所述若干子数据中...
【专利技术属性】
技术研发人员:刘俞辰,
申请(专利权)人:武汉中旗生物医疗电子有限公司,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。