System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种图像边缘检测并行优化方法及系统技术方案_技高网

一种图像边缘检测并行优化方法及系统技术方案

技术编号:41129055 阅读:4 留言:0更新日期:2024-04-30 17:57
本发明专利技术提供了一种图像边缘检测并行优化方法及系统,属于并行计算技术领域,该方法包括:每个核组的主核从任务池中调度一张图像进行计算,将图像分块为tile_list和little_tile_list;主核初始化从核阵列,并采用非阻塞接口开启从核阵列进行计算;主核负责从little_tile_list依次获取little_tile并进行边缘检测处理,同时从核阵列处理tile_list中的tile;从核阵列采用向量化指令加速检测;从核阵列将处理后的图像数据传输回主存。本发明专利技术充分利用了神威架构的特征,包括负载均衡、访存优化和从核阵列并行计算,以提高图像边缘检测的计算效率。

【技术实现步骤摘要】

本专利技术属于并行计算,尤其涉及一种图像边缘检测并行优化方法及系统


技术介绍

1、图像边缘检测是图像处理任务中的一个基本环节,通过卷积核作用于图像,从而识别出物体的边缘或者轮廓。目前,自动驾驶和实时工业检测迅猛发展,对图像进行边缘检测提出了新的要求。新一代神威超算使用的是sw26010 pro芯片,每个芯片上包含6个核组,每个核组由1个主核和1个从核阵列构成,从核阵列由64个从核按照8*8的方式进行排列,芯片上配备16gb主存,每个从核配备256kb的ldm(local data memory),ldm可被配置为私有ldm、从核cache和从核连续共享ldm。主核和从核阵列通过dma(remote memory access)传输数据,从核与从核之间通过rma实现细粒度通信。新一代神威超算支持c、c++和fortran语言,支持 swpytorch、swtensorflow 和 swblas 等编程框架和库。尽管图像边缘检测算法在其他平台上已经得到了较为成熟的优化,但针对神威架构的优化算法目前仍在发展中,这导致在神威架构上的实时检测表现仍不如预期。


技术实现思路

1、针对现有技术中的上述不足,本专利技术提供的一种图像边缘检测并行优化方法及系统,旨在解决该平台上图像边缘检测延迟高的问题,通过充分利用神威超算的并行处理特性和优化算法,实现了实时图像边缘检测的目标。

2、为了达到以上目的,本专利技术采用的技术方案为:

3、本方案提供一种图像边缘检测并行优化方法,包括以下步骤:

4、s1、将所需处理的图像组织为一个任务池,并由每个核组从图像处理任务池中调度图像;

5、s2、利用主核按预设分块pre_tile对图像进行分块,并将划分结果分别存储于tile_list和little_tile_list,其中,tile_list表示存储与预设分块pre_tile大小相同的图像块的位置信息的列表,little_tile_list表示存储小于预设分块pre_tile的图像块的位置信息的列表;

6、s3、利用主核和从核列阵,对划分结果进行协同并行计算;

7、s4、根据s3中主核和从核阵列完成的协同并行计算结果,输出边缘检测后的图像结果,完成对图像边缘检测并行的优化。

8、本专利技术的有益效果是:本专利技术通过对图像检测任务进行多层次划分,充分利用了神威架构主核和从核阵列的算力,并且结合sobel边缘检测算法,进一步划分了从核列阵的高速储存区,从而削弱了每个从核的访存瓶颈,提升了图像处理的实时效率,适用于各种需要高效边缘检测的应用场景。

9、进一步地,所述s1包括以下步骤:

10、s101、将所需处理的图像组织为一个任务池;

11、s102、由每个核组的主核依次从图像处理任务池中调度一个图像任务。

12、再进一步地,所述s2包括以下步骤:

13、s201、按从核连续共享 ldm的大小对预设分块pre_tile进行设置,其中,从核连续共享ldm的大小在提交任务脚本中通过参数ldm_share_size设置,且满足下式:

14、

15、其中,ldm_share_size表示每个从核连续共享ldm空间中负责配置从核连续共享ldm的大小参数,pre_tile.width表示预设分块pre_tile的水平宽度,pre_tile.height表示预设分块pre_tile的垂直高度,sizeof(int)表示一个类型为整形数据所占的字节数,3表示一个图像像素需要储存三个通信的信息,nums_cpe表示参与配置从核连续共享ldm的从核数量;

16、s202、初始化tile_list和little_tile_list;

17、s203、选定图像的左上角端点作为起点,从起点开始,以预设分块pre_tile的尺寸为步长,遍历图像;

18、s204、对于每个步长的位置,判断是否能截取一个大小等于预设分块pre_tile的区域,若是,则将该区域的左上角坐标储存至tile_list中,否则,将该区域的左上角坐标、宽度和长度存储至little_tile_list中;

19、s205、判断整个图像是否遍历完,若是,则进入s3,否则,返回s203。

20、上述进一步方案的有益效果是:本专利技术通过预设从核连续共享ldm空间的大小,使得从核阵列在访问子图像像素数据时,减少cache miss的概率,削弱了访存瓶颈。

21、再进一步地,所述s3包括以下步骤:

22、s301、由主核初始化从核阵列,并调用从核阵列执行从核函数且向从核阵列传递参数;

23、s302、由主核从little_tile_list中依次获取little_tile的位置信息,对图像进行边缘检测处理;同时,利用从核依次获取tile位置信息,并将该tile边界拓展数据传输至从核阵列共享ldm,由从核列阵按行并行对图像进行边缘检测处理,并将从核检测结果通过dma传输至主存,其中,little_tile表示小于预设分块pre_tile的图像块的位置信息,tile表示tile_list中的图像块的位置信息,即大小与预设分块pre_tile大小相同的子图像;

24、s303、判断是否遍历完little_tile_list中所有的little_tile位置信息,若是,则进入s4,否则,返回s302;同时,

25、判断tile_list中的单元项是否遍历完毕,若是,则进入s4,否则,返回s302。

26、再进一步地,所述s302中利用从核依次获取tile位置信息,并将该tile边界拓展数据传输至从核阵列共享ldm,由从核按行并行对图像进行边缘检测处理,并将从核检测结果通过dma传输至主存,其具体为:

27、a1、利用每个从核获取需要处理tile的左上角坐标,分别记录起始行号begin_row和起始列号begin_col,并获取从核编号id,以及预设分块pre_tile中的pre_tile_width和pre_tile_height,其中,pre_tile_width表示预设分块pre_tile的宽度,pre_tile_height表示预设分块pre_tile的高度;

28、a2、根据记录结果,在从核阵列中,通过循环遍历pre_tile_height+2,由所有从核调用通信接口,将图像边缘拓展的子图像的每一行图像色彩数据依次存放至从核连续共享ldm;

29、a3、由从核阵列按行并行对图像进行边缘检测;

30、a4、针对每个从核计算结束一行后,由每个从核通过数据通信函数将从核私有ldm中的数据,通过dma传输至主存。

31、上述进一步方案的有益效果是:本专利技术采用主从协同并行计算模式,充分利用单核组的计算资源,尽可能地保证负载均衡。本专利技术通过采用从核阵列512位向量指令集,一个指令周期内完成本文档来自技高网...

【技术保护点】

1.一种图像边缘检测并行优化方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的图像边缘检测并行优化方法,其特征在于,所述S1包括以下步骤:

3.根据权利要求1所述的图像边缘检测并行优化方法,其特征在于,所述S2包括以下步骤:

4.根据权利要求1所述的图像边缘检测并行优化方法,其特征在于,所述S3包括以下步骤:

5.根据权利要求4所述的图像边缘检测并行优化方法,其特征在于,所述S302中利用从核依次获取tile位置信息,并将该tile边界拓展数据传输至从核阵列共享LDM,由从核按行并行对图像进行边缘检测处理,并将从核检测结果通过DMA传输至主存,其具体为:

6.根据权利要求5所述的图像边缘检测并行优化方法,其特征在于,所述A3包括以下步骤:

7.根据权利要求6所述的图像边缘检测并行优化方法,其特征在于,所述每个从核的处理范围的表达式如下:

8.一种执行如权利要求1-7任一所述的图像边缘检测并行优化方法的图像边缘检测并行优化系统,其特征在于,包括:

【技术特征摘要】

1.一种图像边缘检测并行优化方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的图像边缘检测并行优化方法,其特征在于,所述s1包括以下步骤:

3.根据权利要求1所述的图像边缘检测并行优化方法,其特征在于,所述s2包括以下步骤:

4.根据权利要求1所述的图像边缘检测并行优化方法,其特征在于,所述s3包括以下步骤:

5.根据权利要求4所述的图像边缘检测并行优化方法,其特征在于,所述s302中利用从核依次获取tile位置信...

【专利技术属性】
技术研发人员:赵洪扬张恒基郑云鹤杨嘉苓张强郑诺周广森李锡涛宋华鑫
申请(专利权)人:西南石油大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1